No data
搜索
AI
内容范围
选择栏目
没有与 相关的结果
AI 搜索
请输入
  • 首页
  • API
  • 免费下载
  • 八爪鱼RPA
  • RPA帮助中心
菜单
首页实战案例社交媒体【豆瓣】热门电影采集

【豆瓣】热门电影采集

 

 

采集场景

在豆瓣电影首页(https://movie.douban.com/)输入关键词搜索,得到相关电影列表页。实例网址:https://search.douban.com/movie/subject_search?search_text=%E6%88%98%E7%8B%BC ,是输入关键词【战狼】后得到的电影列表页。然后点击电影链接,进入电影详情页,采集详情页数据。

 

 

 

采集字段

电影、导演、编剧、主演、制片国家/地区、语言、片长、类型、又名、剧情简介、评分、星级、五星占比、四星占比、三星占比、二星占比、一星占比、剧情简介、采集时间、页面网址等。

 

 

采集结果

采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例:

 

教程说明

本篇更新时间:2024/01/03   八爪鱼版本:V8.6.7

如果因网页改版造成网址或步骤无效,无法收集到目标数据,请联系官方客服,我们将及时修正。

 

采集步骤

步骤一:打开网页

步骤二、创建【循环翻页】,采集多页数据

步骤三、建立【循环列表】,提取所有电影标题

步骤四、点击电影链接,进入详情页

步骤五、提取详情页中的字段

步骤六、编辑字段

步骤七、启动采集

 

以下为具体步骤:

 

步骤一、打开网页

 

在首页【输入框】中输入目标网址 https://search.douban.com/movie/subject_search?search_text=%E6%88%98%E7%8B%BC ,点击【开始采集】,八爪鱼自动打开网页。

 

特别说明:

a. 打开网页后,如果开始开始【自动识别】,请点击【不再自动识别】或【取消识别】将其关掉。因为本文不适合使用【自动识别】。

b. 【自动识别】适用于自动识别网页上的列表、滚动和翻页,识别成功后直接启动采集即可获取数据。详情点击查看 【自动识别】教程

c. 目标网址可根据需求,更换成自己需要的,结构与示例网址结构相同即可(在 https://movie.douban.com/ 中搜索关键词得到)。

 

步骤二、建立循环翻页

 

如果只是采集一页数据,可跳过此步骤。

如果需要翻页以采集多页数据:选择页面中的【后页>】按钮,在操作提示上单击【循环点击单个链接】,创建【循环翻页】。

 

 

特别说明:

a. 创建【循环翻页】后,八爪鱼会自动点击【下一页】按钮进行翻页,从第1页,第2页......直到最后1页。如果只需采集特定页的数据,可在八爪鱼中设置循环翻页的次数,详情点击查看  翻页以采集多页数据教程。

 

步骤三、建立【循环列表】,提取所有电影标题

 

通过以下连续3步,提取所有电影标题

1、选中页面上1电影标题

2、在操作提示框中,点击【选中全部子元素】

3、在操作提示框中,点击【文本内容】

还可以选中关键词输入框,在提示框中选择【文本框内的值】,将搜索的关键词文本提取下来。

步骤四、点击电影链接,进入详情页

 

在当前电影列表中(在网页中用红色框框起来),选中电影标题,然后在操作提示框中点击【点击该链接】,点击后自动进入该电影详情页。

 

 

特别说明:

a. 一定要在当前电影列表中选中电影标题做【点击该链接】,否则【点击元素】步骤无法与【循环】中的电影列表产生联动,会一直重复点击某一条电影链接,进入其详情页。

b. 如何找到当前电影列表?在【循环列表】中查看当前项(蓝色背景),然后点击【提取列表数据】,网页中被红色框框起来的就是当前电影列表。

 

步骤五、提取详情页中的字段

 

1、采集文本

进入详情页后,采集需要的字段。

文本类型的字段:选中页面中的文本,然后再选择【文本内容】。示例中提取了评分、星级占比等字段。

 

 

2、【导演】/【编剧】/【主演】字段

以【编剧】为例,一个电影一般有多个【编剧】,我们将多个【编剧】作为一个字段提取。

先选中其中一个编剧名,在操作提示框中,选择【文本内容】。

再点击目标字段后的  ... 按钮,选择【修改元素定位】,修改XPath为://span[contains(text(),'编剧')]/following-sibling::span 后保存。

 

 

特别说明:

a. 默认生成的XPath无法精准定位到我们想要的字段,所以需要手动修改XPath。这里需要一定的XPath知识。点击查看 XPath学习与实例教程 。

b. 【导演】和【主演】的提取方法是是一样的,提取后都需改XPath。

【主演】字段XPath://span[contains(text(),'主演')]/following-sibling::span

【导演】字段XPath://span[contains(text(),'导演')]/following-sibling::span

 

3、【类型】字段

该字段比较特殊,经过特殊处理后才能提取下来。如果无需【类型】字段,可跳过此步骤。

如果需要采集,请按以下步骤操作:

 

① 选中类型字段所在的一整块区域,在提示框选择【outer html】

② 点击目标字段后的  ... 按钮 → 【格式化数据】→【添加步骤】→【正则表达式替换】→ 输入【\s+】→【确定】

③ 点击【添加步骤】→【正则表达式匹配】→ 输入【(?<=类型:)(.+?)(?=:<\/span>)】→ 勾选【匹配所有】→【确定】

④ 点击【添加步骤】→【正则表达式匹配】→ 输入【(?<=">)(.+?)<\/span>】→ 勾选【匹配所有】-【确定】

⑥ 点击【添加步骤】→【替换】→ 替换【</span>】为【/】→【确定】

⑦ 点击【确定】→【应用】保存以上所有设置

 

在【当前页面数据预览】面板观察,【类型】从源码中被提取出来。

 

 

特别说明:

a. 什么是数据格式化?数据采集下来之后,有时候格式不是我们想要的,或者只想从一段数据里提取特定数据,可通过八爪鱼的【格式化数据】功能实现。详情点击查看 数据格式化教程 。

b. 正则表达式是什么?怎么写?正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,用来从文本中匹配/过滤信息。正则表达式有其特定写法,需要系统学习才能掌握,点击查看 正则表达式 教程 。

 

4、【制片国家/地区】【语言】【片长】【又名】字段

这些字段也比较特殊,经过特殊处理后才能提取下来。如果无需【类型】字段,可跳过此步骤。

 

如果需要采集,请按以下步骤操作:

 

以【制片国家/地区】字段提取为例:

① 选中字段所在的一整块区域,在提示框选择【文本内容】

② 点击目标字段后的  ... 按钮 → 【格式化数据】→【添加步骤】→【正则表达式替换】→ 输入【\s+】→【确定】

③ 再点击【添加步骤】→【正则表达式匹配】→ 输入【(?<=制片国家\/地区:)(.+?)(?=语言:)】→【确定】

④ 点击【确定】→【应用】保存以上所有设置

 

在【当前页面数据预览】面板观察,【制片国家/地区】从整块文本中提取出来。

 

 

特别说明:

a. 什么是数据格式化?数据采集下来之后,有时候格式不是我们想要的,或者只想从一段数据里提取特定数据,可通过八爪鱼的【格式化数据】功能实现。详情点击查看 数据格式化教程 。

b. 正则表达式是什么?怎么写?正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,用来从文本中匹配/过滤信息。正则表达式有其特定写法,需要系统学习才能掌握,点击查看 正则表达式 教程 。

c. 【语言】【片长】【又名】的处理方式是相同的,在本文中未详细列出。如有需要,请联系客服。

 

5、【星级】字段

【星级】字段比较特殊,经过特殊处理后才能提取下来。如果无需【类型】字段,可跳过此步骤。

 

如果需要采集,请按以下步骤操作:

① 选中【星级】所在位置,在提示框选择【采集该元素的outer html】

② 点击目标字段后的  ... 按钮 → 【格式化数据】→【添加步骤】→【正则表达式匹配】→ 输入【[0-9]+】→【确定】

③ 点击【添加步骤】→【正则表达式替换】→ 在【正则表达式】中输入【(.+?)】,【替换为】中输入【$1.】→【确定】

④ 点击【添加步骤】→【添加前缀】→ 输入【\】→【确定】

⑤ 点击【添加步骤】→【添加后缀】→ 输入【\】→【确定】

⑥ 【添加步骤】→【正则表达式匹配】→ 输入【(?<=\\)(.+?)(?=\.\\)】→【确定】

⑦ 点击【确定】→【应用】保存以上所有设置

 

在【当前页面数据预览】面板观察,【星级】从源码中被提取出来。

 

 

步骤六、编辑字段

 

在【当前页面数据预览】页面,可删除多余字段,修改字段名,移动字段顺序等。 

 

 

步骤七、启动采集

 

1、单击【采集】并【启动本地采集】。启动后八爪鱼开始自动采集数据。

 

 

2、采集完成后,选择合适的导出方式导出数据。支持导出为Excel、CSV、HTML、数据库等。这里导出为Excel。

 

 

作者:勾勾

编辑:勾勾

 

 

分享文章
上一个
【B站】按类目标签采集视频
下一个
【豆瓣】图书评论采集
最近修改: 2024-01-04
  • 产品概述
    • 动态与公告
      • 版本功能变更
      • 7版本下架
    • 产品简介
      • 什么是八爪鱼采集器?
      • 八爪鱼采集器的特性和优势
      • 应用场景
      • 支持的云服务
      • 使用须知
      • 八爪鱼企业版本套餐介绍
    • 产品计费
      • 计费概述
      • 计费项
        • Saas版本计费
        • 验证码计费
        • 数据定制和模板定制计费
        • 一对一远程服务
        • 模板计费
  • 快速入门
    • 安装注册
      • Windows客户端安装方法
      • Mac客户端安装方法
      • 免费注册账号
      • 客户端界面介绍
      • 本地采集界面介绍
    • 新手指引
    • 模板采集
    • 自动识别采集
    • 快速创建一个自定义采集案例
    • 【八爪鱼新手入门】常见问题清单-官方版
    • 八爪鱼采集器:官方推广福利
  • 操作指南
    • 基本采集
      • 01 自定义采集(含智能识别)
      • 02 采集单个数据
      • 03 采集列表数据
      • 04 采集表格数据
      • 05 从列表进入详情页采集
      • 06 翻页以采集多页数据
      • 07 启动采集并导出数据
      • 08 采集原理与流程执行逻辑
    • 循环
      • 文本循环:批量输入关键词
      • URL循环:批量采集同类网页
      • 循环下拉框(切换下拉选项)
    • 登录验证
      • 登录验证采集
      • 验证码自动识别
    • ajax与新标签
      • ajax网页采集方法
      • 新标签
      • 边滚动边采集数据的方法
      • 滚动加载数据翻页
    • XPath
      • XPath系统学习与实例
      • XPath实例:修改循环列表XPath
      • XPath实例1:循环列表-过滤多余的项
      • XPath实例2:循环列表-添加更多的项
      • 绝对xpath、相对XPath学习与实例
      • 采集遇到一二页重复循环的解决办法
      • 八爪鱼采集最后一页死循环原因以及解决办法
    • 特殊翻页
      • 点击【加载更多】或【再显示20条】等按钮翻页
      • 无【下一页】按钮,点击数字进行翻页
      • 边点击加载更多边采集数据的方法
    • 数据格式
      • 添加特殊字段
      • 自定义定位元素方式
      • 设置备用位置
      • 自定义抓取方式
      • 字段合并
      • 字段格式化
      • 正则表达式
      • 无此字段时如何处理
      • 数据去重
    • 数据导出
      • 导出到SqlServer数据库
      • 导出到Oracle数据库
      • 导出到Mysql数据库
      • 导出到数据库常见问题
      • 自动导出到本地文件
      • 文件边采集边下载
    • 云采集
      • 云采集日志查看
      • 云采集使用方法(含定时云采集)
      • 云采集原理和规则加速设置
      • 云采集实况与历史运行记录
      • 数据导出API和任务控制API
      • 企业版管理
      • 云采集任务启动优化
      • 云采集排错教程
      • 云采集监控预警平台
    • 其他功能点
      • json采集
      • 执行前等待
      • 判断条件
      • 触发器功能说明
      • 鼠标移上去出现新数据
      • 网页包含iframe框架处理办法
      • 如何获取浏览器UA(User-Agent简称UA)
      • 网址批量输入
      • 自动重试
      • 常见防采集套路及解决方法
      • 返回上一级网页
      • 采集新增数据
      • 增量采集
  • 实战案例
    • 电商
      • 【京东】商品列表采集
      • 【京东】商品评价采集
      • 【京东】商品详情页采集
      • 【京东】商品list列表采集
      • 【京东】采集场景汇总
      • 【淘宝】商品列表页采集
      • 【Amazon】商品评论采集
      • 【Amazon】商品列表页采集
      • 【Amazon】商品详情页采集
      • 【速卖通】 AliExpress(速卖通)关键词搜索采集商品信息
      • 【百度爱采购】关键词搜索厂家
      • 【速卖通】AliExpress(速卖通)商品评价
    • 社交媒体
      • 【微博】热搜榜采集
      • 【微博】评论采集(只采一级评论)
      • 【微博】搜索关键词采集
      • 【搜狗微信】特定微信公众号的最新文章采集
      • 【搜狗微信】文章列表和详情页正文采集
      • 【知乎】问题和回答采集
      • 【哔哩哔哩】视频采集
      • 【B站】UP主主页视频采集
      • 【B站】视频详情页数据采集
      • 【B站】按类目标签采集视频
      • 【豆瓣】热门电影采集
      • 【豆瓣】图书评论采集
      • 【微博】博主主页的博文
      • 【西瓜视频】关键词搜索列表采集
      • 【抖音】博主主页视频列表采集
      • 【知乎】近期热榜采集
    • 新闻资讯
      • 【今日头条】头条号文章采集
      • 【今日头条】首页新闻采集
      • 【搜狐】时政新闻采集
    • 房产
      • 【百姓网】短租房源数据采集
      • 【房天下】房源数据采集
      • 【58同城】民宿短租数据采集
      • 【黄河口信息港】房源数据采集
      • 【房天下】二手房数据采集
    • 生活服务
      • 【百度】搜索结果采集
      • 【百度图片】采集与导出
      • 【百度地图】列表采集
      • 【58同城】职位信息采集
      • 中国天气网数据采集
      • 【天眼查】企业信息采集
      • 【携程】景点评价采集
      • 【携程】游记攻略采集
      • 【智联招聘】智联招聘职位数据采集
    • 金融
      • 百度爱采购关键词搜索商品
      • 【东方财富】定向增发股数据采集
      • 【同花顺】基金净值数据采集
      • 【银保监】官网政策公告采集
      • 【雪球】热帖评论采集
      • 【股吧】股票评论采集
  • 视频专区
    • 界面介绍
      • 软件界面介绍
      • 自定义任务编辑界面介绍
      • 本地采集界面介绍
    • 操作指导
      • 基本采集
        • 0基础获取数据:使用模板采集数据
        • 第1课:自动识别
        • 第2课:单个数据采集
        • 第3课:列表数据采集
        • 第4课:表格数据采集
        • 第5课:从列表进入详情采集
        • 第6课:翻页以采集多页数据
        • 第7课:启动采集并导出数据
        • 第8课:采集原理与执行逻辑
      • 循环
        • 批量输入关键词查询并采集
        • URL循环:批量采集同类网页
      • Ajax与新标签
        • 边滚动边采集
        • 滚动加载数据采集
        • Ajax网页设置方法
      • XPath
        • XPath01 安装XPath工具
        • XPath02 XPath 与八爪鱼
        • XPath03 通过标签和属性写XPath
        • XPath04 XPath函数
        • XPath05 修改循环列表XPath实例
        • XPath06 修改翻页XPath实例
        • XPath07 修改提取数据XPath实例
        • XPath08 相对XPath学习与实例
        • 修改元素定位
      • 特殊翻页
        • 无“下一页“按钮,点击数字进行翻页
        • 边点击边采集
        • 点击加载更多采集数据
      • 数据格式
        • 格式化数据
        • 设置备用元素
        • 添加特殊字段/字段设置导入导出
        • 正则表达式
        • 采集新增数据的方法
        • 同一字段的多行合并
      • 云采集
        • 云采集实况与历史运行记录
        • 云采集使用方法
        • 云采集原理与加速规则
      • 特殊采集
        • JSON采集
        • 登录验证的方法
        • 自定义抓取方式
      • 其他功能点
        • 触发器
        • 在下拉框中选择条件查询
        • 企业版管理
        • 判断条件
        • 网址输入
    • 问题排查
      • 优化规则采集
      • 云采集排错
      • 本地采集排错
      • 云采集日志
      • 执行前等待
    • 操作实践
      • 采集亚马逊排行榜数据,辅助选品决策
      • 巧用数据分析工具,优化选品策略
      • cookie获取方法
    • 直播回放
      • 八爪鱼数据抓取大神之路1
      • 八爪鱼数据抓取大神之路2
      • 新闻数据采集-政府公告
      • 新闻数据采集-人民网
      • 社媒数据采集-微博热搜
      • 社媒数据采集-豆瓣影评
      • 金融数据采集-天天基金网
      • 电商数据采集-当当网
  • 常见问题
    • 操作类问题
      • 安装登录
        • 八爪鱼登录/登陆时提示“超时,请稍后重试”
        • 安装八爪鱼,安装成功后无法启动怎么办?
        • 谷歌xphah 插件装不上?拖入扩展程序的时候,谷歌识别为“扩展包无效”
        • 如何下载8.4.6版本?
        • 八爪鱼有苹果IOS系统/mac版本的安装包吗?
        • 八爪鱼软件怎么下载
        • 只有客户端吗?
        • 八爪鱼有手机APP吗?
        • 客户端下载不下来啊?
        • windows10系统可以安装八爪鱼吗?
        • 八爪鱼有手机APP吗
        • 安装八爪鱼采集器常见问题汇总
        • 安装软件提示要购买
        • 版本充值后账号未升级?
        • 客户端数是什么?
        • 如何查看错误日志/Log日志?
        • 登录八爪鱼,提示无网络链接,请检查是否连上互联网?
        • 有32位的操作系统吗?
        • 如何切换账号
        • 如何下载八爪鱼7版本并安装?
        • 官网下载安装客户端后,打开客户端提示要升级,但是没有升级按钮导致一直卡在提示升级界面
      • 自定义采集常见问题
        • 无法采集数据?
        • 如何使用相对XPATH采集数据/什么情况下会出现相对XPATH?
        • 经常白屏显示about:black
        • 如何借助火狐浏览器以及firebug、firepath插件查看网页源码,修改xpath?
        • 翻页采集数据不全怎么办?
        • 什么是XPATH/如何学习xpath?
        • 网页在八爪鱼中打不开怎么办?
        • 如何利用xpath中的position()和last()去掉option标签中的无用元素?
        • 网页一直在加载或加载很久怎么办?
        • 单个元素 / 固定元素列表 / 不固定元素列表是什么?
        • 八爪鱼可以一起采集,然后每个标题分别导出嘛?
        • 如何既采集列表,又采集详情中的数据?
        • 点击元素采集的时候,下面数据预览是空的
        • 需要翻页的网页如何采集?
        • 提示任务版本不一致?
        • 如何设置循环翻页的次数?
        • 八爪鱼可以将采集到的数据发布到网站吗?
        • 如何下载最新版本八爪鱼?
        • 网页包含Iframe框架怎么处理?
        • 本地加速同时任务数/云采集加速
        • 代理IP如何使用?
        • 可以采集图片吗/如何采集图片?
        • 点击循环列表不能返回上一级网页,并显示找不到匹配元素,这是为什么呢?
        • 怎么清除cookie
        • 局部滚动
        • 如何设置翻页次数?
        • 八爪鱼可以一起采集,然后每个标题分别导出嘛?
        • 网站本身有页码限制,可以突破限制?
        • 怎么切换浏览器?
        • 您好,自定义的手动输入网址只能采取1万条数据吗?
        • 数据预览怎么展开?
        • 需要登录账号的网站如何采集?
        • 可以设置几个本地定时采集任务数?
        • 点击元素跳转第二页,配置提取数据的时候,就会白屏卡住了,这是咋回事呀
        • 采集过程中网站加载失败怎么重新加载
        • 为什么设置了cookie登录,启动采集后还是提示需要登录?
        • 你好,我想下载某个网站中的视频如何操作?
        • 八爪鱼采集器为什么打不开?
        • 支持textarea吗?
        • 登录时有拖动的验证码/滑块验证的应该怎么办?
        • 设置了批量输入文本,为什么只会爬取第一个文本的数据?
        • 假如使用判断语句 哪个命令是暂停的功能?
        • IP一般建议多久切换一次
        • 怎么关闭自动识别
        • 网站防采集,采集过程中出现验证码怎么办?
        • 对于要使用Ukey和CA的网站,怎么用八爪鱼登录?
        • 广告屏蔽功能说明
        • 电脑IP被封了,网页打不开了?
        • 什么是判断条件?有什么作用以及使用要点有哪些?
        • 如何清除缓存?
        • 如何打开多个网址(URL)进行采集?URL循环列表最多可以放多少条?
        • 如何采集商品的图片?
        • 网页有循环下拉框需要筛选的怎么采集?循环下拉框如何使用?
        • 八爪鱼可以设置采集当前时间吗?(采集时间)
        • 采集特定数据?如不出现某些文字的时候就不采集
        • 打开网页或点击元素后,出现异常弹窗怎么办?
        • 什么是触发器,如何使用?
        • 网站需要登录用户名和密码的,能采集么?
        • 如何采集详情页的数据?
        • 如何批量获取/采集某网站数据?
        • 有多个网页怎么做规则去采集?
        • 如何去除段落?
        • 采集的网站有iframe框架怎么办?
        • 生成循环列表时,出现的不是教程中的“点击元素”而是“提取数据”,如何处理?
        • 如何格式化数据?
        • URL循环如何使用?
        • 提取到的文本数据,有很多空格如何处理?
        • 制作规则和手动执行时有数据,但本地采集和云采集均无数据?
        • 云采集为什么比本地采集还慢?
        • 如何分配任务节点?
        • 一直在第一第二页重复采集怎么办?一二页循环采集,不采集后面的数据?
        • 网页上没有下一页按钮,如何实现翻页采集?特殊翻页如何采集?
        • 正则表达式是什么,有什么用,如何使用正则表达式?数据格式化里的正则表达式怎么用?
        • 什么是ajax/何时要设置AJAX/如何设置AJAX?
        • 如何创建循环?循环翻页/循环提取数据怎么使用?
        • 怎样创建循环翻页?
        • 文本循环如何使用?如何批量输入关键词进行搜索?
        • 如何用XPATH自定义抓取特定网页文字?
        • 如何采集带“更多信息”、“加载更多”、“查看更多”之类的网站?
        • 如何利用xpath中的following-sibling和preceding-sibling定位标签?
        • 什么是不固定元素列表?
        • 如何采集列表数据?
        • 没有翻页按钮,通过选择日期、地址等方式来进行翻页,该如何处理?
        • 如何通过关键词/关键字采集搜索结果?
        • 点击下一页按钮,不出现循环点击下一页怎么办?
        • 为什么每次清理cookie就未响应了?
        • 如何自定义字段提取数据?
        • 在打开详情页时,设置在新标签中打开则无法提取到数据,不设置在新标签中打开则只能提取到一条数据,循环无法跳回。
        • 采集到的数据如何去除重复数据?
        • 数据需要一层一层打开页面才能抓到?单击不行,双击才能打开页面?
        • 需要搜索或者输入一批关键词,在采集搜索之后的结果怎么操作?
        • json采集如何自定义request header?
        • 循环下拉框是否可以嵌套?如何嵌套?
        • 增量采集功能说明
        • 页面需要滚动,滚动条下拉才加载的数据应该如何采集?
        • 打开网页后,页面加载不全/显示不全怎么办?
        • 网页源码有图片地址,但是软件识别不出来,没有“采集该图片地址”的选项怎么办?
        • 数据被不断替换,怎么办?
        • 正则工具如何使用
        • 元素是什么?
        • 编写规则时,页面跳转到新页面,无法继续编辑怎么办?
        • 如何设置循环翻页的次数?
        • 如何切换任务中网址
        • 企业版能不能解决网站的反爬?
        • 海外网站怎么采集?
        • 一直采集最后一页怎么办?
        • 什么是翻页死循环?
        • 能不能采集抖音团长信息?
        • 为什么任务之前采集正常,现在采集不了了?
        • 在哪里修改字段的xpath?
        • 在哪里修改循环翻页的xpath?
        • 在哪里修改循环列表的xpath?
        • 一个任务可以输入多个关键词采集吗?
        • 只想采集当天或者指定时间的数据怎么设置?
        • 采集时前半程没问题,后面就采不到数据或者只能采到极少数的数据?
        • 可以采集抖音评论数据吗?如何采集?
        • 为什么只能采集1条数据就结束了?
        • 无标题文章
        • 采集新闻类数据时,正文字段中怎么配置可以既采集到文字,又能采集到两行文字中间穿插的图片呢?
        • 需要展开全文的怎么采集?
      • 简易模板
        • 采集模板可以导出 / 修改 / 加字段吗?
        • 已有模板不符合需求,如何申请新模板?
        • 官网的简易模板如何使用?
        • 简易采集模式是什么?
        • 软件内置的模板可以修改吗?
        • 模板不满足需求怎么办?
        • 使用淘宝商品评论模板无法采集?
        • 有无免费的模板?
        • 有境外采集模板吗?
        • 八爪鱼的亚马逊模板可以采集哪个站点的数据?
        • 使用简易模板时,提示账号权限不足?
        • 软件内置的简易模板采集出来的数据为什么没有电话?
        • 为什么有些简易模板不能用本地采集?
      • 任务列表
        • 如何删除任务组?
        • 300个任务上限是一天还是多久?
        • 已保存的配置在哪儿看啊?
        • 怎么清空云数据?
        • 如何批量删除任务?
        • 如何获取任务的task id?
        • 如何删除不需要的任务?
        • 如何导入任务?
        • 如何导出任务?
        • 已删除任务能否找回?
        • 同时运行任务数是什么?
        • 如何复制任务副本?
        • 保存不了任务
        •  请问有没有获取当前账号下,正在采集任务的api接口?
      • 数据导出
        • 如何调用API接口导出数据?
        • 导出数据是否有上限?超过上限怎么办?
        • read ECONNRESET
        • ER_NO_DEFAULT_FOR_FIELD:Fied'art_title'doens't have a default value
        • 采集完可以进行批量处理吗
        • 可不可以导出txt格式
        • 请问怎么只导出部分数据?
        • API导出数据size最大是1000条,如果一次性采集的数据超过1000条,应该怎么导出
        • 怎么导出excel表格?
        • 导出到数据库不成功怎么办?
        • 可以导出到某某某数据库吗?
        • mysql无法连接到指定的数据库,详细信息:Reading from the stream has failed.如何解决?
        • 数据导入远程数据库被拒?
        • 任务保存与数据存储?
        • 数据量大,如何导出?
        • 采集到的数据无法导出excel文件?
        • 采集的数据导出到文件的数据条数说明
        • 自动导出任务计划是自动同步的吗?能否在多台电脑查看计划?
        • 八爪鱼支持导出数据到mysql数据库吗?
        • 采集好的任务数据存在什么地方?
        • 数据导出在Mysql中提示成功,但数据库中查不到数据?
        • 为什么定时导出数据到数据库没有生效?
        • 怎么设置定时导出数据到本地文件?
        • 多个任务的数据可以导出到同一个excel文件吗?
        • 数据预览的数据可以直接导出吗?
        • 采集完成后导出数据失败怎么办?
        • 点击导出数据没反应?
        • 采集到数据之后,如何手动或者自动导入数据库?
        • 导出到远程数据库Mysql,在导出向导中看不到表字段?
        • 数据导出到数据库出现错误“Fatal error encountered during command execution”?
        • 采集到的数据上传到自己的网站上吗?
        • 帮我查下一下我还剩多少导出余额吗?
      • 云采集相关
        • 为什么云采集的数据和本地加速模式采集的数据与本地普通模式采集数据不同?
        • 突然断电了,会继续采集吗?
        • 制作规则和手动执行时有数据,但本地采集和云采集均无数据?
        • 为什么云采集数据与本地采集数据不同?
        • 为什么本地采集有数据,云采集无数据?
        • 云采集为什么比本地采集还慢?
        • 云采集去重原则是什么?
        • 如何管理企业版,提高采集和获取数据的效率?
        • 云采集的时候把八爪鱼退了还能继续采集嘛
        • 云采集为什么一直在排队?
        • 在哪里查看采集日志?
        • 八爪鱼采集器有告警功能吗?比如任务采集不到数据,可以发邮件或短信之类的
        • 我这边云采集是不是只能运行一个任务?我看说明是最大可以运行6个
      • API
        • API接口
    • 业务类问题
      • 人工服务
        • 有售前顾问吗
        • 上班了吗
        • 客服工作时间是什么
      • 采集相关
        • 能采集什么数据/能采集XX网站吗/能采集XX行业数据吗?
        • 能采集电话号码吗?哪些电话号码可以采集?
        • 请问免费版本一次性可以导出多少条数据
        • 能采集QQ邮箱/用户浏览数据/卖家信息/客户数据吗?
        • 付费后是否能加速采集
        • 能采集网页中的文本/链接/图片/视频/音频/html源码吗?
        • 可以采集微信公众号/小程序/好友/朋友圈吗?
        • 能采集可以采集国外网站的数据吗?需要翻墙怎么办?
        • 八爪鱼是否可以实时采集?数据源一更新就马上采集?
        • 没有在教程和常见问题中找到答案怎么办?
        • 任务停止后,下次采集时可以从停止的地方继续采集吗?
        • 免费版只能爬取到图片数据吗?
        • 能不能爬取百度指数?
        • 云采集是否可以避免IP被限制采集的情况?
        • 团队版云采集可以同时运行多少个云采集任务?
        • 云节点是什么
        • 采集数据时,采集到一半突然断开/终止怎么办?
        • 免费版只能爬取到图片数据吗?
        • 任务能不能用加速,需要满足加速条件,什么样的规则可实现云加速?
        • 云采集加速设置
        • 只采集最近的数据,是否能实现
        • 怎么查看云采集日志?
        • 采集过程中漏数据?
        • 动态会更新数据的网页怎么爬
        • 采集有问题,如何进行排错?
        • 免费版加速采集
        • 怎么优化规则?
        • 免费版只能采集8个数据吗
        • 八爪鱼可以暂停采集吗?
        • 提取数据出错怎么办?提取不到数据如何处理?
        • 怎么提升采集效率?
        • 翻页最后一页死循环?一直重复采集最后一页数据怎么办?
        • 一些数据采集不到?采集数据有空白的解决方案
        • 可以关机采集吗?
        • 什么是云采集?云采集有什么用?怎么使用云采集?
        • 八爪鱼团队协作功能是什么?
        • 为什么云采集数据与本地采集数据不同?
        • 本地采集一段时间,采集到一定数据量后程序闪退?
        • 同一个规则之前可以采到数据,后来采不到数据或者采集的数据不全?
        • 采集时某些数据字段漏了,但网页中又有这些字段
        • 重复采集第一/二页?翻页死循环?
        • 没有采集到数据就提示采集完成了?运行采集后,马上提示采集完成?
        • 只抓取了少部分数据,任务卡住或提示采集完成?
        • 八爪鱼可以同时采集多个任务吗?
        • 本地采集数据一直不增加?
        • 可以采集亚马逊的数据吗?
        • 可以采集微信文章的永久链接吗?
        • 网页打开异常,有http状态码时怎么办?
        • 采集的过程中出现网页状态码200,采集不到数据应该如何处理?
        • 本地采集有数据,云采集没数据?
        • 云采集去重原则
        • 如何使用云采集?
        • 云采集漏数据可能原因与排查方法
        • 采集时遇到每一页都重复采集第一条数据?
        • 提取到的数据有重复数据?
        • 本地采集数据比较慢?
        • 网站总数据有300页,但只显示50页如何处理?
        • 任务的优先级怎么设置?
        • 为什么采集到60条信息,还是一直采集状态,但是信息就一直60条?
        • 抖音私信可以采集吗
        • 可以采集文件吗?
        • 可以采集电话号码吗?
        • 自动采集网页里面的所有内容
        • 为什么云采集数据还有本地加速模式与本地普通模式采集数据不同?
        • 豆瓣上的图片数据怎么采集?
        • 八爪鱼有伪原创功能吗?
        • 可以采集什么数据
        • 八爪鱼能采什么数据?
        • 采集数据比较慢?
        • 八爪鱼可以采集哪些数据?
        • 你好,海外ip代理有吗?
        • 可以采集闲鱼吗?
        • 八爪鱼可以设置定时采集吗?
        • 网页上面的一些词组把他们提取出来。要怎么弄
        • 如何采集网页上的数据?
        • 花多少钱都不能采集电话号码吗
        • 采集网址是付费项目么?
        • 八爪鱼如何抓取数据?
        • 八爪鱼可以采集拼多多吗?
        • 这个网址无法采集吗?
        • 八爪鱼可以批量给微博用户发私信吗?
        • 可以抓取小红书内容吗
        • 可以采集微信公众号的历史文章吗?
        • 请问这个软件适合外贸吗?
        • 可以采集电商数据吗?
        • 可以采集二维码吗?
        • 八爪鱼是一款什么样的软件?
        • 八爪鱼可以部署到服务器吗?
        • 网页提交的表单数据可以抓取吗?
        • 采集到的商品数据可以上传到淘宝店铺吗?
        • 可不可以采集邮箱?如何采集邮箱?
        • 可以采集房源的数据吗?
        • 美团采集
        • 可以采集微信公众号吗,怎么采?
        • 可以采集标题吗?
        • 八爪鱼可以采集卖家数据信息吗?
        • 可以采集什么网站/可以采集某某行业的数据吗?
        • 可以爬取facebook和twitter数据吗?
        • 八爪鱼是否支持抓取整站内容?
        • 怎么通过爬虫下载vip资源或者付费资源?
        • 有没有人工培训?
        • 这个软件可以收集客户信息不?
        • 八爪鱼有创建社群的功能吗?
        • 这个软件采集的数据可以对接织梦后台么?
        • 可以采集Json数据吗,怎样采集json类型的数据?
        • 如何采集58同城?
        • 鼠标移到上面才显示的信息如何采集?
        • 如何快速采集数据?
        • 八爪鱼是否可以同步/实时采集,实时监控某一个网站?数据源处更新,采集的数据也同步更新?
        • 可以采集微信群和微信朋友圈的信息吗?
        • 百度知道怎么采集?
        • 八爪鱼可以分析数据吗?
        • 马蜂窝美食栏目下的评论信息如何采集?
        • 微图/数多多还可以用吗?
        • 如何采集阿里巴巴商家数据/1688商品店铺数据?
        • 八爪鱼可以画词云图吗?
        • 如何采集网页的html源代码?
        • 八爪鱼采集器和八爪鱼RPA的区别是什么?
        • 抖音私信可以采集吗
        • 可以采集文件吗?
        • 免费版采集有数量限制吗?
        • 网页里面的附件如word、pdf、ppt等文件如何下载?
        • 可以采集电话号码吗?
        • 可以采集APP上的数据吗?
        • 自动采集网页里面的所有内容
        • 请问代理IP有啥用?
        • 豆瓣上的图片数据怎么采集?
        • 可以采集什么数据
        • 八爪鱼能采什么数据?
        • 采集数据比较慢怎么办?
        • 网址在浏览器中可以打开但在八爪鱼打不开
        • 八爪鱼可以设置定时采集吗?
        • 采集数据是否有限制
        • 网站防采集了怎么办?
        • 八爪鱼可以采集手机APP里面的数据吗?
        • 如何采集网页上的数据?
        • 如何采集表格?
        • 可以采集国外网站的数据吗?
        • 只能抓取网页数据吗
        • 八爪鱼的采集原理是什么?
        • 可以采集微信好友吗?
        • 八爪鱼可以采集微信小程序里面的数据吗?
        • 自定义采集模式是什么?
        • 不知道采集的网址\网站,但是想要数据可以吗?
        • 可以采集/抓取地图信息吗?比如百度地图、谷歌地图、高德地图?
        • 八爪鱼可以进行网站建设吗?
        • 可以采集高德地图的商家数据吗?如何采集?
        • 百度搜索结果\内容怎么采集?
        • 如何批量采集网页链接地址(URL),然后通过循环打开这些链接去采集详情页数据(URL循环)?
        • 经纬度坐标信息如何采集?
        • 如何采集全国家具建材经销商信息?
        • 八爪鱼可以采集新闻吗?如今日头条、环球网、36氪
        • 如何采集网站上的小说?
        • 可以采集QQ群成员吗?
        • 可以采集简历吗?
        • 大众点评的数据能不能采集,怎么采集大众点评的数据?
        • 八爪鱼可以采集贷款数据吗?如何采集?
        • 如何采集电影数据?
        • 如何使用八爪鱼抓取网址?
        • 汽车行业的数据怎么采集?
        • 加密的数据可以采集吗?
        • 页面结构不规整的网站可以采集吗?
        • 淘宝的sku能采集吗?
        • 海外网站可以采集吗?
        • 请问云采集无法访问外网怎么解决?
        • 为什么会有大量重复数据?
        • 为什么在浏览器里打开正常,在采集器内打开是空白的?
        • 本地采集卡死怎么办、
        • 有验证码的网站可以采集吗?
        • 为什么只采集1条数据就结束了?
        • 什么是翻页死循环?
        • 采集过程中卡死怎么办?
        • 采集淘宝天猫经常出现验证怎么办?
        • 网页无法打开怎么办?
        • 任务配置好了,怎么导出数据?
        • 怎么设置只采集前几页的数据?
        • 可以从上次停止的地方开始采集吗?
        • 付费会员后可以解决淘宝天猫的反爬吗?
        • 云采集漏数据原因?如何排查?
        • 微博评论爬取数据后,为什么那么多重复的数据出现?
        • 微博博主博文爬取数据后,为什么那么多重复的数据出现?
        • 淘宝天猫验证无法通过怎么办?
        • 用咱们的工具会被封IP吗?
        • 可以通过接口修改登录cookie吗?
        • 我采集出来的数据,想要一个自动增加的序号字段,就是采集过程中,采集第一条为1,第二条为2
        • 八爪鱼RPA是什么
        • 可以接入deepseek吗?支持deepseek吗?
      • 公司相关
        • 八爪鱼咨询电话是多少?
        • 官网地址
        • 公司地址
        • 公司的主要业务模式
        • 公司主要是做什么的
        • 你们公司的名称是什么
        • 你们能做广告推广吗?
        • 八爪鱼咨询QQ群号多少?
        • 公司有哪些产品?
      • 网站相关
        • 抖音的数据怎么采集?
        • 可以抓取淘宝订单吗?
        • 怎么抓推特的博主博文数据呢?
        • 淘宝评论可以提取吗?
        • 八爪鱼有海外版吗
        • 为什么有的网页点击之后没有选中子元素这一项呢?
        • 如何采集微博数据?
        • 假如我想采集淘宝和拼多多同样的商品应该怎么采集?
        • 你好,我想从百度上爬几十家公司的新闻,八爪鱼哪个产品有这种功能?
        • 能不能采集知乎文章?
        • 百度地图的数据能不能采集,地图上的商家数据怎么采集?
        • 淘宝采集
        • 金融行业数据采集
        • 八爪鱼能采集网页上的视频吗?
        • 自定义采集模式如何使用?
        • Ebay商品图片如何采集?
        • 京东商品数据怎么采集?
        • 如何采集网页上的链接?
        • 京东商品评论怎么采集?
        • 京东评论只想采集差评怎么操作?
        • 可以抓弹幕吗?
        • 如何采集39健康网的数据?
        • 装修数据怎么采集?
        • 招聘网站的信息如何采集?
        • 如何采集赶集网数据?
        • 可以采集携程网?
        • 如何采集今日头条数据?
        • 如何采集列表上的信息,同时又采集列表里面的详情?
        • 百度贴吧怎么采集?
        • 不会配置任务怎么办?
      • 购买相关
        • 如何购买云节点
        • 数据定制服务
        • 这款软件怎么收费的?
        • 购买有优惠券吗?
        • 团队版涨价了吗
        • 八爪鱼软件怎么购买?
        • 我以前是旗舰+版,对应的新版本套餐我用哪个版本呢?
        • 我以前是旗舰版,对应的新版本套餐我用哪个版本呢?
        • 我现在是旗舰版,新套餐方案对我有什么影响呢,会自动转成新套餐吗?
        • 免费版、个人版、团队版、企业版有什么区别
        • 私有化部署的价格是多少?
        • 可以定制采集的规则吗?
        • 支持linux部署么
        • 购买后,如何开发票?
        • 团队版的账号,可以其他人同时登录吗
        • 发票的开票内容是什么?
        • 商务合作
        • 八爪鱼售前咨询电话
        • 如何购买叠加包
        • 我们账号到期了
        • 麻烦帮忙催一下,尽早开发票?
        • 教育公益版怎样申请?
        • 要填哪些发票信息
        • 需要低版本的八爪鱼软件
        • 什么是本地加速模式?
        • 个人版能做什么
        • 我们单位要报销
        • 任务数是什么?
        • 境外舆情监控服务如何购买?
        • 购买八爪鱼软件可以提供合同吗?
        • 八爪鱼的价格
        • 个人版可以开票么?
        • IP如何购买?
        • 软件咨询
        • 国外的网站可以用云采集吗?
        • 这个能开纸质的增值税专用发票吗?
        • 八爪鱼在外地有分公司吗?
        • 购买后账号马上就可以使用吗?
        • 验证码自动识别怎么收费?
        • 升级到个人版有什么优惠?
        • 个人版比专业版的优势在哪?
        • 免费版是永久的吗?
        • 个人版比专业版贵了
        • 我现在是旗舰+版,新套餐方案对我有什么影响呢,会自动转成新套餐吗?
        • 新版本内测
        • 八爪鱼线下培训课程可以学到什么?
        • 八爪鱼可以内网部署吗?
        • 团队版本在哪里购买?
        • 规则定制怎么收费?
      • 账号相关
        • 是否支持私有化部署?
        • 八爪鱼有哪些版本?版本有什么区别?
        • 购买后如何开发票,发票内容是什么?
        • 购买后可以提供合同吗?
        • 八爪鱼如何退款?
        • 八爪鱼售前咨询电话是多少?
        • 购买后账号可以马上升级吗?
        • 团队版/企业版可以试用吗?试用规则是怎么样的?如何申请试用?
        • 是否提供规则定制 / 数据定制服务?
        • 八爪鱼验证码套餐是什么,怎么收费?
        • 团队版的账号,可以其他人同时登录吗?
        • 个人版有试用吗?
        • 八爪鱼有教育公益计划吗?
        • 新企业版同时可登录限制是3,如果用户需要多人登录同时使用的,不想导出任务到子账号使用的,怎么处理?
        • 旧版本转换新版本套餐,是否支持延长期限服务?
        • 1个账号能多人同时登录吗?
        • 忘记密码了怎么办?如何重置密码
        • 账号被锁定了怎么办?
        • 个人版可以申请试用团队版吗
        • 注册收不到短信验证码?
        • 有没有客服的企业微信?
        • 账号密码不正确?
        • 账号忘记密码了,发送验证码的邮箱收不到验证码?
        • 收不到注册账号激活码?
        • 公益教育注册总是提交不了?
        • 账号如何注销?
        • 八爪鱼账号在哪里注册?
        • 企业版试用
        • 新版同时可登录限制是3,如果用户需要多人登录同时使用的,不想导出任务到子账号使用的,怎么处理?
        • 旧版本转换新版本套餐,是否支持延长期限服务?
        • 忘记密码了怎么办?如何重置密码
        • 个人版可以申请试用团队版吗
        • 注册收不到短信验证码?
        • 有没有客服的企业微信?
        • 账号密码不正确?
        • 你好,账号忘记密码了,发送验证码的邮箱收不到验证码?
        • 收不到注册账号激活码?
        • 八爪鱼账号在哪里注册?
        • 团队版试用
        • 免费版可以一直使用吗?
        • 免费版能采集哪些数据?
        • 个人版可以用云采集吗?
        • 个人版能采集哪些数据?
        • 团队版可以采集哪些数据?
        • 企业版能采集哪些数据?
        • 企业版可以提供哪些服务?
        • 企业版的优势是什么?
        • 购买后发现不满足需求怎么办?
        • 申请试用后,怎么知道试用申请是否通过?
        • 试用期间采集有什么限制吗?
        • 如何查看教育公益版认证成功了?
        • 怎么查看代理ip的消耗记录?
        • 怎么查看验证码的消耗记录?
        • 怎么查看模板余额消耗记录?
    • 排错方法
      • 规则出错排查方法
      • 网页空白的排错方法
      • 云采集排错教程
      • 怎么手动执行下规则
大纲