跳转到主要内容
查找任务、查看详情、校验任务定义,获取后续运行与导出所需的 taskId 或任务文件。

octopus task list(查看采集任务)

命令描述 列出你在八爪鱼账号下的采集任务,并显示每个任务的任务 ID。后续 runcloud startdata export 等命令都可能用到这个 ID。
octopus task list
octopus task list --keyword 小红书
octopus task list --page 2 --page-size 20
octopus task list --limit 10
octopus task list --json
如果还没有现成任务,可以使用 octopus detect 检测新 URL 并生成任务文件。

octopus task inspect(查看任务详情)

octopus task inspect <taskId>
查看任务名称、输出字段、运行方式等信息。运行前建议关注 runOnLabel 字段:
显示值含义应使用的命令
云端和本地两种运行方式均可octopus runoctopus cloud start
仅云端只能用云端运行octopus cloud start
仅本地只能用本地运行octopus run
也可查看本地任务文件:
octopus task inspect <taskId> --task-file ./task.json

octopus task validate(校验任务定义)

正式运行前建议先校验任务:
octopus task validate <taskId>
octopus task validate <taskId> --task-file ./task.json
如果校验失败,请根据错误信息更新任务定义,或回到桌面客户端调整不兼容的采集规则。

任务文件格式

CLI 支持本地 .json.xml.otd 任务文件,可传给 inspectvalidaterun
octopus run <taskId> --task-file ./task.json --max-rows 20

下一步

运行采集任务

本地、云端或任务文件运行。

网页检测与任务生成

从 URL 检测结构并生成本地任务文件。