免费下载

八爪鱼采集器 - 最好用的网页数据采集器,超过40万用户首选网页采集软件

  1. 软件版本:V6.4.3
  2. 支持系统:32/64位 XP / Vista / Win7 / Win8 / Win8.1 / Win10
  3. 更新日期:03月22日 (新版功能)
免费下载
微信订阅号:八爪鱼采集器Live
扫一扫,关注我们
教程 | 功能点 | 实战案例
官方论坛解答
点击提问
免费版QQ群
1群:470619317 点击加入
2群:148686415 点击加入
专业版QQ群
2群:135071723 限专业版用户
1群:385161018 限专业版用户
旗舰版QQ群
2群:286777906 限旗舰版用户
1群:130849246 限旗舰版用户
站长采集交流群QQ群
2群:304456535 点击加入
1群:492396817点击加入
down

淘宝商品图片采集以及抓取方法

标签: 实战教程,v7.0,图片,淘宝,商品 2017/12/5 16:50:55

本文介绍使用八爪鱼7.0采集淘宝商品图片的方法首先将淘宝商品搜索结果网页中图片的URL采集下来,再通过八爪鱼专用的图片批量下载工具,将采集到的淘宝商品图片URL,下载并保存到本地电脑中。

 

采集网址:淘宝商品搜索页面

 

比如T恤(可更换其他关键词对淘宝商品图片进行采集):

https://s.taobao.com/search?q=T%E6%81%A4&imgfile=&commend=all&search_type=item&sourceId=tb.index&spm=a21bo.2017.201856-taobao-item.1&ie=utf8&initiative_id=tbindexz_20170306

 

采集数据内容:淘宝商品图片地址

 

使用功能点:

l 翻页设置

l 图片链接采集

 

 

步骤1:创建淘宝商品图片采集任务

1)进入八爪鱼采集器主界面,选择自定义模式

 

 

淘宝商品图片采集步骤1

 

2)将上面网址的网址复制粘贴到网站输入框中,点击保存网址

 

淘宝商品图片采集步骤2

 

3)如下图红色框中的淘宝商品图片即为本次要采集的内容。


淘宝商品图片采集步骤3

 

步骤2:创建翻页循环

l 找到翻页按钮,设置翻页循环

l 设置ajax翻页时间

l 设置滚动页面

1)将淘宝商品搜索结果页页面下拉到底部,找到下一页按钮,鼠标点击,在右侧操作提示框中,选择“循环点击下一页”这个选项。

 

淘宝商品图片采集步骤4

 

2)选择右上角的流程按钮,点击流程图中的点击翻页按钮,然后选中ajax加载数据,时间选择2秒。

 

 

淘宝商品图片采集步骤5

 

步骤3:淘宝商品图片链接采集

l 选中采集的淘宝商品图片,创建图片的采集列表

l 提取淘宝商品图片链接

 

1)点击需要采集的图片,点击“选中全部”

 

 

淘宝商品图片采集步骤6

 

2)当前页面中所有的图片地址将会被选中,点击“采集以下图片地址”

 

淘宝商品图片采集步骤7

 

注意: 在提示框中的字段上会出现一个“X”标识,点击即可删除该字段。

3)修改采集任务名、字段名,并点击下方提示中的保存并开始采集

 

淘宝商品图片采集步骤8

 

4)根据采集的情况选择合适的采集方式,这里选择“启动本地采集

 

淘宝商品图片采集步骤9

 

说明:本地采集占用当前电脑资源进行采集,如果存在采集时间要求或当前电脑无法长时间进行采集可以使用云采集功能,云采集在网络中进行采集,无需当前电脑支持,电脑可以关机,可以设置多个云节点分摊任务,10个节点相当于10台电脑分配任务帮你采集,速度降低为原来的十分之一;采集到的数据可以在云上保存三个月,可以随时进行导出操作。

步骤4:数据采集及导出

1)采集完成后,会跳出提示,选择导出数据

 

2)选择合适的导出方式,将采集好的数据导出

 

 

步骤5:将采集好的淘宝商品图片URL批量转换为图片

经过如上操作,我们已经得到了要采集的淘宝商品图片的URL。接下来,再通过八爪鱼专用的图片批量下载工具,将采集到的图片URL中的图片,下载并保存到本地电脑中。

图片批量下载工具https://pan.baidu.com/s/1c2n60NI

1)下载八爪鱼图片批量下载工具,双击文件中的MyDownloader.app.exe文件,打开软件


淘宝商品图片采集步骤10

 

2)打开File菜单,选择从EXCEL导入(目前只支持EXCEL格式文件)


淘宝商品图片采集步骤11

 

 

3)进行相关设置,设置完成后,点击OK即可导入文件

 

选择EXCEL文件:导入你需要下载图片地址的EXCEL文件

EXCEL表名:对应数据表的名称

文件URL列名:表内对应URL的列名称

保存文件夹名:EXCEL中需要单独一个列,列出图片想要保存到文件夹的路径,可以设置不同图片存放至不同文件夹

如果要把文件保存到文件夹,则路径需要以“\”结尾,例如:“D:\同步\”,如果要下载后按照指定的文件名保存,则需要包含具体的文件名,例如“D:\同步\1.jpg”

 

如果下载的文件路径和文件名完全一样,则原先存在的文件会被删除

 

 

淘宝商品图片采集步骤12

 



分享到: 更多
人工服务

立即下载,体验更高效简单的数据收集吧! 免费下载

粤公网安备 44030502000701号