背景

百度资源平台的抓取诊断主要有三个功能:

  1. 抓取诊断工具,可以让站长从百度蜘蛛的视角查看抓取内容,自助诊断百度蜘蛛看到的内容和预期是否一致。
  2. 每个站点每周可使用70次,抓取结果只展现百度蜘蛛可见的前200KB内容。
  3. 抓取诊断可能受到网络影响造成抓取失败,如遇到抓取失败情况,可重新检测,并自查网站是否可正常访问。

如果你有很多站点,那么提交起来就比较麻烦了,本文主要是从多账号,多站点角度来设计软件,尽量做到操作简单方便。

功能特点

  1. 支持多ck同时操作
  2. 支持多站点同时提交
  3. 支持根据ck一键导入站点
  4. 支持文件导入站点
  5. 支持一键刷新剩余额度
  6. 支持自定义链接生成规则
  7. 支持多线程
  8. 支持ADSL拨号VPS
  9. 支持代理IP
  10. 支持多种打码模式

运行环境

  • 只支持windows系统
  • win10 64位以上系统(完整版)
  • 推荐2核4G 以上配置

界面设计

采用Python3 TK设计的批量百度资源抓取诊断工具界面及说明

采用Python3 TK设计的批量百度资源抓取诊断工具界面及说明

软件安装说明

1、下载谷歌浏览器

系统依赖谷歌浏览器,需要谷歌浏览器 110.0.5481.38 以上版本,也就是用最新的谷歌浏览器就可以了,

谷歌浏览器官方下载地址:https://www.google.cn/chrome/

下载之后安装即可

部分阉割系统可能存在缺少系统dll文件,从而导致无法运行,安装下 vcredist_x64.exe 即可解决。

功能使用流程

  1. 选择ck文件
  2. 根据ck获取所有站点
  3. 设置链接生成规则
  4. 设置拨号ADSL(如有需要)
  5. 开始处理

1、浏览器设置

这里指定好谷歌浏览器安装好的路径即可

2、ck文件选择

3、线程数量

4、调试模式

当勾选上可看到软件执行整个过程

5、打码设置

软件支持两个打码平台,一个是作者自己的打码平台,另一个对接的是图鉴快识别打码平台,用户可自由选择

6、 网络设置

软件支持3种网络模式:

  1. 本机
  2. adsl
  3. 代理IP

7、 导入站点

点击导入站点,可选择站点格式文件,

文件格式如下:

cookie1----域名1
cookie2----域名2
cookie3----域名3

8、清空站点

点击清空站点按钮,可以清空列表中的站点信息

9、 开始处理

点击开始处理开始自动推送抓取诊断链接

最后

任何软件都有bug

本软件只可用于学习交流使用,请勿非法使用!

qq:466867714 tg: pojoin