免费下载

八爪鱼采集器 - 最好用的网页数据采集器,超过40万用户首选网页采集软件

  1. 软件版本:V6.4.1
  2. 支持系统:32/64位 XP / Vista / Win7 / Win8 / Win8.1 / Win10
  3. 更新日期:01月20日 (新版功能)
免费下载
官方论坛解答
(优先处理)
点击提问
八爪鱼采集器QQ群
28群:106739425 群已满
22群:519441479 点击加入
21群:451754429 点击加入
20群:437959025 点击加入
14群:123134988 点击加入
13群:471815573 点击加入
12群:148686415 点击加入
7群:498193915 点击加入
5群:470619317 点击加入
1群:61570666 群已满
专业版QQ群
3群:135071723 限专业版用户
2群:385161018 限专业版用户
1群:475423041 限专业版用户
旗舰版QQ群
3群:196097783 限旗舰版用户
2群:286777906 限旗舰版用户
1群:130849246 限旗舰版用户
站长采集交流群QQ群
2群:304456535 点击加入
1群:492396817点击加入
down
如何采集房源信息?

 

建立采集任务

 

将要采集的房源网站地址复制下来

(这里只是举的一个网站例子,其他网页的采集,可以参考这个教程的步骤去进行采集规则的编辑) 

房源1.jpg

打开八爪鱼采集器,建立采集任务,完成采集任务及任务组名称编辑,点击下一步

 房源2.jpg

 

 

编辑采集规则

 

将复制的网页地址粘贴在八爪鱼采集器内置浏览器的地址栏中,点击跳转,

采集的网页会在下方浏览器中打开,流程设计器中会生成一个打开网页步骤,

房源3.jpg

 

 

 

创建翻页循环

 

将网页下拉到底部,找到翻页的按钮,右键点击,选择执行“循环点击这个元素”

房源4.jpg

 

完成后流程设计器会生成一个翻页循环,点击“自定义”进行设置

房源5.jpg

 

 选择“元素文本=下一页”这个选项,点击确定,完成翻页循环的创建

房源6.jpg

 

创建提取数据列表

 

完成后上述操作后,右键点击页面中第一个房源信息的方框,

在跳出的操作框中,选择下图红色方框的选项“创建一个元素列表”

房源7.jpg

 

 将第一个房源的信息添加到列表

房源8.jpg

 

点击继续编辑列表 

房源9.jpg 

 点击第二个方框中的房源信息,同样将其添加到列表

房源10.jpg

 

八爪鱼会将具有相似特征的元素抓取到列表中,

如下图,所有的群组信息被添加到列表,接着点击创建列表完成

房源11.jpg 

 再点击循环,完成列表的创建

房源12.jpg

 

 

提取要采集的文本信息

 

创建列表完成后流程图,如左侧所示,接着我们需要对采集的房源信息进行抓取,

如图点击房源中的标题,在跳出的执行框中,选择执行”抓取这个元素文本”

方框其他数据的信息抓取,重复同样的步骤即可

房源14.jpg

 

抓取到的内容会显示在右上方的操作框中,这里可以修改采集字段的名称,

到这里我们就完成了房源信息提取

房源16.jpg

 

由于每一页都需要循环采集数据,所以我们需要将这个循环列表拖入到翻页循环里面

房源18.jpg

 

注意流程是从上网页执行的,所以这个循环列表需要放到点击翻页的前面,否则会漏掉第一页的数据。

最终流程图如下图所示:

房源18.jpg

 点击保存,进入下一个采集步骤

 

开始采集

 

选择采集方式,开始房源信息的采集

房源19.jpg

 

采集完成,有多个导出格式可供选择,可以根据需要点选,采集到的重复数据八爪鱼采集器会自动识别出来,

导出时可以选择是否去重,完成房源信息的采集

房源20.jpg

 

 

相关教程推荐:

58同城、赶集网、百姓网信息采集

京东商品列表的采集

 

立即下载,体验更高效简单的数据收集吧! 免费下载
联系 我们
官方联系方式 0755-86522010
商务合作QQ 1982043845
客服咨询QQ群 106739425
点击我加入