本文介绍使用八爪鱼采集饿了么商家信息的方法

 

采集网站:

https://www.ele.me/place (不换配送地址的采集网址)

https://www.ele.me/home/(换配送地址的采集网址)

 

采集的内容包括:店名,起送价,配送费,平均送达速度,月售,综合评价,商家地址,营业时间,服务态度,菜品评价。

 

使用功能点:

l 八爪鱼7.0教程——AJAX点击和翻页教程

/tutorialdetail-1/ajaxdjfy_7.html

 

步骤1:创建饿了么商家信息任务

1)进入主界面,选择自定义采集

 

 

 


2)将要采集的网址URL复制粘贴到网站输入框中,点击“保存网址”。

 

 


打开网页之后,打开右上角的流程按钮,使制作的流程可见状态。

 

此时网页会迅速定位到当前地址,网址也会变成地址附近的商家。如果想要修改成其他地址,在网址栏输入https://www.ele.me/home/,在首页的选项中选择“输入文字”,在文字框中输入“深圳软件园一期”(离八爪鱼公司较近),点击确定。

 

 

在页面中显示出来的下拉框中点击一个你要采集的地址,比如我点击了第一个地址,则地址更换完成。

 

 

步骤2:创建翻页循环

 

1)如图所示,饿了商家信息没有下一页,需要向下滚动刷新,并且在最下方是“点击加载更多商家”,因此需要做两个操作。此操作涉及到AJAX点击和翻页教程具体请看:

操作1:点击上一步已做好的“点击元素”,进行“滚动页面”设置。在右侧高级选项里勾选滚动页面,设置滚动4次,每次间隔3秒,滚动方式直接滚动到底部。点击“确定”。

 

 

没有修改地址的用户可以直接在第一步“打开网页”中进行设置,设置方式相同。

 

操作2:点击最下方的“点击加载更多商家”,在选项框中选择“循环点击单个元素”,翻页循环步骤就在左上角流程里了。

 

在流程的点击翻页右侧高级选项里,勾选滚动页面,设置滚动4次,每次间隔3秒,滚动方式直接滚动到底部。勾选ajax加载,超时5秒。设置执行前等待2秒,点击“确定”。

 

 

步骤3创建列表循环

 

1)鼠标先点击商品列表中第一个商品(注意要包括该商品全部子元素,如果只选择了标题或者配送费,可点击提示框最右下角的正方形加小斜线的图标,扩大选项范围),再点击第二个商品,此时所有商品已经全都选中,鼠标点击提示框中的“循环点击每个元素”,列表循环就创建完成,并进入到第一个循环项的详情页面。

 

 

2)数据提取,接下来采集具体字段,分别选中页面店名,起送价,配送费,平均送达速度,月售,综合评价,商家地址,营业时间,服务态度,菜品评价,再分别鼠标点击“点击该元素的文本”,再修改字段名称,数据提取完毕。

 

 

 

3)可在流程各个步骤的高级选项里设置“执行前等待”几秒时间,可减少访问页面较快出现防采集问题。设置后点击“确定”。

 

 

步骤4饿了么商家信息数据采集及导出

 

1)点击左上角的“保存”,然后点击“开始采集”。

 

 

选择“启动本地采集”

 

3)采集完成后,会跳出提示,选择“导出数据”,选择“合适的导出方式”,将采集好的数据导出即可。