免费下载

八爪鱼采集器 - 最好用的网页数据采集器,超过40万用户首选网页采集软件

  1. 软件版本:V6.4.3
  2. 支持系统:32/64位 XP / Vista / Win7 / Win8 / Win8.1 / Win10
  3. 更新日期:03月22日 (新版功能)
免费下载
微信订阅号:八爪鱼采集器Live
扫一扫,关注我们
教程 | 功能点 | 实战案例
官方论坛解答
点击提问
免费版QQ群
1群:470619317 点击加入
2群:148686415 点击加入
专业版QQ群
2群:135071723 限专业版用户
1群:385161018 限专业版用户
旗舰版QQ群
2群:286777906 限旗舰版用户
1群:130849246 限旗舰版用户
站长采集交流群QQ群
2群:304456535 点击加入
1群:492396817点击加入
down

一二页重复循环解决方法【4.6版本录制】

标签: 特殊翻页,xpath,高阶 2015/9/17 17:36:40

很多用户在制作规则的时候,可能会遇到老是在一二页循环提取数据,不会转到第三页以后,这种情况其实是由于xpath定位不好导致的,我们需要通过修改xpath来解决这个翻页问题。

在出现这个问题的时候,我们可以直接在流程里面找到问题所在。

下面的规则是直接按照新手入门的步骤做的

图片1

如上图:

在点击循环的时候可以看到循环的是下一页按钮,我们可以直接在流程里选择点击翻页

这时八爪鱼下面的浏览器会直接跳到第二页

图片2

我们再点击流程图里面的循环,可以看到循环列表已经变成了上一页,这样系统再点击翻页的时候就会直接跳回第一页提取第一页的数据,如此一直重复循环

图片3

点开循环列表的高级设置按钮,可以看下下一页的xpath如下图所示

图片4

我们把这个xpath复制到火狐里面去,发现在第一页是的确可以定位下一页的,但是在第二页就变了,可以看到这个xpath在火狐里面上一页和下一页都定位了,因为八爪鱼自动识别的都是当前页面的xpath,系统没有翻到第二页不知道第二页的情况,所以我们翻页的xpath只在第一页里面是正常的

图片11

 

再看一下火狐浏览器里面的源码,在第二页里面这个xpath对应的不正确,直接上一页和下一页都对应到了。所以我们需要通过修改xpath来正确定位下一页

图片5

 

 

手动在火狐里面直接写,可以看到这个网页的下一页特点的,我们直接可以用text()函数,前面在xpath入门2里面给大家介绍过这个函数的意思,是一个文本函数,直接可以定位源码里面包含的文本,在火狐里面写成//A[text()=’下一页’]即可,然后将这条xpath再复制到八爪鱼里面。

 

图片8



分享到: 更多
人工服务

立即下载,体验更高效简单的数据收集吧! 免费下载

粤公网安备 44030502000701号