免费下载

八爪鱼采集器 - 最好用的网页数据采集器,超过40万用户首选网页采集软件

  1. 软件版本:V6.4.3
  2. 支持系统:32/64位 XP / Vista / Win7 / Win8 / Win8.1 / Win10
  3. 更新日期:03月22日 (新版功能)
免费下载
微信订阅号:八爪鱼采集器Live
扫一扫,关注我们
教程 | 功能点 | 实战案例
官方论坛解答
点击提问
免费版QQ群
1群:470619317 点击加入
2群:148686415 点击加入
专业版QQ群
3群:135071723 限专业版用户
2群:385161018 限专业版用户
1群:475423041 限专业版用户
旗舰版QQ群
3群:196097783 限旗舰版用户
2群:286777906 限旗舰版用户
1群:130849246 限旗舰版用户
站长采集交流群QQ群
2群:304456535 点击加入
1群:492396817点击加入
down

八爪鱼7.0教程——循环下翻下拉框教程

标签: 新手入门,新手,v7.0 2017/6/23 18:38:30

循环下翻下拉框教程

 

定位:循环点击下拉框,并选择下一个元素的步骤。

 

适用情况:网页内存在可以下拉并选择对应元素的下拉框,采集的数据需要进行下拉框内元素的循环选择。

 

示例网址:http://live.500.com/

 

下面为你示范循环下翻下拉框步骤

步骤一:输入网址→保存网址→点击下拉框→点击循环切换下拉列表选项

 循环下翻下拉框示例1

步骤二:点击提取的元素→点击采集该元素的文本

2 

步骤三:手动运行规则判断是否正确→保存并启动

 循环下翻下拉框示例3

 

示例中,下拉框共有8个选项循环下拉1采集完成后可以看到共采集8条数据,证明循环下拉完成了所有循环下翻下拉操作。

 

 

假如我们希望只循环下翻所有元素中的几条,那么该如何操作呢?

下面为你演示如何循环下翻所有元素的一部分:

整体操作如下:

循环下翻下拉框示例4 

重点操作如下:

循环下翻下拉框示例5 

示例中,基本步骤与循环所有元素步骤一致,区别在于循环下拉框的高级设置中,该示例我们希望只循环滚动下拉框中第2到第4个内容,对于还没有学会Xpath的同学,我们可以复制不固定元素列表中的完整XPath,点击固定元素列表,再点击下方内容框,粘贴之前复制的Xpath进去,在后面分别加上你需要的内容顺序,第二条便填写[2],这里需要注意,输入[2]的时候输入法必须处于英文状态下,Xpath只支持英文标点符号的使用。

 

这里再说明一次循环中高级设置中的各项内容:

操作名为该循环的名字,可以对其进行修改以方便日后对规则的修正;

执行前等待为进行该操作前等待的时间,如果设置执行前等待时间为5秒,则会在翻页完成后等待5秒再循环提取元素,如果希望采集每一个电影的信息前有个等待,则可以在提取步骤设置执行前等待;

或者出现元素是配合执行前等待使用的,在其中输入元素的XPath则可以在出现该元素的时候结束执行前的等待,例如我们设置循环文本步骤执行前等待10秒,或者出现元素设置为电影标题,则翻页操作后,假如第11秒标题加载出来,则八爪鱼会在第10秒尝试进行循环提取操作,而假如第8秒标题加载出来,则八爪鱼会在第8秒标题加载出来后结束循环的执行前等待来尝试进行循环提取操作。

元素在Iframe选项适用于该循环需要采集的内容在网页中是框架,在新手教程中暂不涉及,咱们按下不表。

循环方式包括单个元素、固定元素列表、不固定元素列表、URL列表、以及文本列表。其中单个元素表示只进行一个元素的循环操作,循环点击下一页便多是运用了此种操作;固定元素列表表示循环一些固定的部分,不固定元素列表表示循环一些不固定的部分,在该示例中,如果我们循环采集下拉框中固定位置元素,则是使用固定元素列表,而我们在示例中使用的不固定元素列表则是输入定位的Xpath,该Xpath定位到的所有元素都会出现在循环列表中,例如第一个示例操作;

图片2          

URL列表多用于打开多个网页采集内容的时候,可以放入多个网页链接进行循环打开操作;

 

文本列表则多用于需要输入文字的网页,将列表中多个文本输入网页输入框进行查询。

文本循环2 

满足以下条件时退出循环可以设定循环次数,例如设定循环2次后退出,则循环提取步骤只会采集列表中前两条信息,如果循环翻页中设置循环2次后退出,则会循环采集前两页内容。

 



分享到: 更多
人工服务

立即下载,体验更高效简单的数据收集吧! 免费下载

粤公网安备 44030502000701号