本文介绍使用八爪鱼采集蚂蜂窝美食评论(以三种美食为例)的方法

采集网站:

http://www.mafengwo.cn/poi/4208245.html

 

http://www.mafengwo.cn/poi/6764789.html

 

http://www.mafengwo.cn/poi/17777.html

 

 

使用功能点:

l URL循环

l 分页列表循环

 

蚂蜂窝网站简介:蚂蜂窝旅行网是中国领先的自由行服务平台。蚂蜂窝旅行网由陈罡和吕刚创立于2006年,从2010年正式开始公司化运营。蚂蜂窝的景点、餐饮、酒店等点评信息均来自数千万用户的真实分享,每年帮助过亿的旅行者制定自由行方案。

 

蚂蜂窝以“自由行”为核心,蚂蜂窝提供全球60000个旅游目的地的旅游攻略、旅游问答、旅游点评等资讯,以及酒店、交通、当地游等自由行产品及服务。

 

蚂蜂窝美食评论采集数据说明:本文进行了蚂蜂窝-美食评论信息的采集。本文仅以“蚂蜂窝-美食评论信息采集”为例。大家在实操过程中,可根据自身需求,更换蚂蜂窝的其他内容进行数据采集。

 

蚂蜂窝美食评论采集字段详细说明:评论内容,评论人id,评论时间。

 

步骤1:创建采集任务

1)进入主界面,选择“自定义采集

 

 

2)要采集网站URL制粘贴到输入框中,点击保存网址。这里我们先到蚂蜂窝上面复制想要采集的美食网址,然后复制粘贴

 

 

步骤2:创建翻页循环

1)网页打开以后,将页面下拉到底部,点击Next按钮。在右侧操作提示框中,选择循环点击单个链接

 

 

 

步骤3:创列表循环及信息提取

1)移动鼠标选中第一条评论,评价框会变成绿色,其中的字段会变为红色底色然后选择右侧操作提示中的选中子元素

 

2)字段信息选择完成以后,选中字段旁边的编辑和删除标识,可以把多余的字段删除,并进行自定义命名

 

3)然后选择“选中全部

 

步骤4:数据采集及导出

1)接下来选择右侧提示中的采集以下数据”,将整个页面中的评论信息采集下来

 

2)然后选择“保存并启动”,开始数据采集

 

3)这里采集方式选择启动本地采集

 

4)采集完成后,会跳出提示,选择导出数据选择合适的导出方式,将采集好的数据导出,这里我们选择excel作为导出为格式,数据导出后如下图