免费下载

八爪鱼采集器 - 最好用的网页数据采集器,超过40万用户首选网页采集软件

  1. 软件版本:V6.4.3
  2. 支持系统:32/64位 XP / Vista / Win7 / Win8 / Win8.1 / Win10
  3. 更新日期:03月22日 (新版功能)
免费下载
微信订阅号:八爪鱼采集器Live
扫一扫,关注我们
教程 | 功能点 | 实战案例
官方论坛解答
点击提问
免费版QQ群
1群:470619317 点击加入
2群:148686415 点击加入
专业版QQ群
3群:135071723 限专业版用户
2群:385161018 限专业版用户
1群:475423041 限专业版用户
旗舰版QQ群
3群:196097783 限旗舰版用户
2群:286777906 限旗舰版用户
1群:130849246 限旗舰版用户
站长采集交流群QQ群
2群:304456535 点击加入
1群:492396817点击加入
down

手动创建翻页循环及下一页死循环解决方法【4.6版本录制】

标签: 特殊翻页,xpath,高阶 2015/2/3 16:14:59

相信很多朋友都碰到过这种情况,明明是一个翻页按钮,但是点击后没有创建翻页人选项,很多人会以为这种网页就不能做翻页了,其实是可以的,我们可以手动创建出一个翻页循环来。接下来就教大家如何手动创建翻页循环。

首先我们打开一个无法自动创建翻页的网页

图片1

这时我选择点击这个元素,系统会自动添加一个点击步骤到流程中

图片2

点击自定义,进入自定义定位方式界面,将下一页的Xpath复制出来,然后把创建的点击步骤删除,因为我们让系统自动创建点击步骤只是为了得到下一页的Xpath,如果是懂Xpath的朋友可以省掉这个步骤。当然,系统自动生成的Xpath可能会有问题,会需要我们修改。

图片3

接下来我们要创翻页循环,先拖一个循环步骤到流程中,打开高级选项,勾选点击单个元素,然后将之前复制的下一页人Xpath填到单个元素输入框中,点击保存。

图片4

然后拖入一个点击步骤到,打开高级选项,勾选上点击当前循环中设置的元素,点击保存。

图片5

翻页循环就建好了,接下来我们再看一下下一页死循环的问题。有些网站可能我们用系统做好的规则在采集的时候可能明明已经采集最后一页了,就是不停止,一直在最后一页循环采集,这种情况其实是由于xpath定位不对导致的,我们需要通过修改xpath来解决这个翻页问题。

在出现这个问题的时候,我们可以直接在流程里面找到问题所在。

下面的规则是直接按照新手入门的步骤做的

图片6

如上图:

浏览器中要采集的数据已经在最后一页了,可以我们在循环列表中依旧能找到下一页的按钮,代表一直都可以点击这个按钮进行采集,循环是结束不了的

点开循环列表的高级设置按钮,可以看下下一页的xpath如下图所示

图片7

 

我们把这个xpath复制到火狐里面去,发现在第一页是的确可以定位下一页的,但是在第二页就变了,可以看到这个xpath在火狐里面每一页都能定位,

图片8

 

图片9

再看一下第一页和第三页里面源码的区别

图片10

图片11

可以看到第一页和第三页下一页的class属性是不一样的,我们只需要前面几页的下一页能正确定位,但是最后一页是不需要的,这样可以直接用class来区别。手动在火狐里面直接写,只需要改li里面的就行改成li[@class=’next’]

然后将这.//*[@id='gkaTable_page']/table/tbody/tr/td/div/ul/li[@class='next'] 再复制到八爪鱼里面。

图片12

 

配置完成之后单机采集可以看到规则能正常完成

图片13



分享到: 更多
人工服务

立即下载,体验更高效简单的数据收集吧! 免费下载

粤公网安备 44030502000701号