本文介绍使用八爪鱼采集淘宝网商品(以某女装店铺所有商品)的方法

 

采集网站:

https://tangs.taobao.com/category.htm?spm=a1z10.1-c-s.w5001-15784518815.3.1457e73eKuBzRB&search=y&scene=taobao_shop

 

使用功能点:

l分页列表及详细信息提取

 

淘宝网:淘宝网是亚太地区较大的网络零售、商圈,由阿里巴巴集团在2003年5月创立。淘宝网是中国深受欢迎的网购零售平台,拥有近5亿的注册用户数,每天有超过6000万的固定访客,同时每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品。

 

淘宝网商品采集数据说明:本文进行了淘宝网商品(以某女装店铺所有商品)采集。本文仅以“淘宝网商品(以某女装店铺所有商品)”为例。大家在实操过程中,可根据自身需求,更换淘宝网的其他内容进行数据采集。

 

淘宝网采集字段详细说明:商品标题,商品价格,商品评价,商品销量,商品库存,商品人气值。

 

步骤1:创建采集任务

1)进入主界面,选择“自定义模式”

1

2)要采集的网址制粘贴到网站输入框中,点击“保存网址

2

 

步骤2:创建翻页循环

1)将页面下拉到底部,点击“下一页”按钮,在右侧操作提示框中,选择循环点击下一页

3

步骤3:创列表循环

1)移动鼠标选中页面里的第一个商品链接。选中后,系统会自动识别页面里的其他相似链接。在右侧操作提示框中,选择“选中全部”

4

2)选择“循环点击每个链接”,以创建一个列表循环

5

步骤4:提取商品信息

1)在创建列表循环后,系统会自动点击第一个商品链接,进入商品详细信息页。点击需要的字段,选择“采集该元素的文本”

6

2)选择要采集的字段完成后,点击“采集以下数据”

7

3)选中相应的字段,可以进行字段的自定义命名完成后,点击左上角的“保存并启动”,启动采集任务

8

4)选择“启动本地采集

10

步骤5:数据采集及导出

1)采集完成后,会跳出提示,选择导出数据”。选择合适的导出方式,将采集好的数据导出

11

2)这里我们选择excel作为导出为格式,数据导出后如下图

12