跳转到主要内容
使用八爪鱼 CLI,在命令行中完成网页检测、任务生成、已有任务运行、云采集控制和数据导出。
八爪鱼 CLI 是面向开发者、数据团队、运维和 AI Agent 场景的命令行工具。v0.1.24 将 Agent 工作流提升为 LLM 创建任务的推荐路径,新增视觉审查契约与生成任务后的样品采集能力。

CLI 能做什么

网页检测与任务生成

使用 octopus detect 检测列表页、详情页与分页逻辑,并生成可复用本地任务文件。

运行生成的任务

使用 octopus run <taskId> --task-file task.json 执行检测生成的任务,并通过 --max-rows 控制条数。

运行已有任务

使用 octopus run <taskId> 本地运行,或用 octopus cloud start <taskId> 在云端运行。

导出采集数据

通过 octopus data history/export 查看历史批次并导出 XLSX、CSV、HTML、JSON、XML。

安装

npm install -g bazhuayu-cli@0.1.24
octopus --version
环境要求:
  • Node.js 20 或更高版本(推荐 22 LTS)
  • npm 8 或更高版本
  • Windows x64、macOS x64 / arm64、Linux x64
  • 网页 detect 与本地 run 需要可用 Chrome 环境
Linux x64 从 v0.1.22 起支持本地采集;Linux arm64 暂不支持本地执行,可使用云采集。

常见工作流

1

安装 CLI

使用 npm install -g bazhuayu-cli@0.1.24 安装,并运行 octopus doctor 检查环境。
2

登录认证

通过 octopus auth login--oauth--stdin 或环境变量完成认证。
3

选择采集路径

LLM / Agent 使用 detect --agent 生成并审查任务;用户直接操作 CLI 时可用 detect --auto,已有任务或任务文件用 run 执行。
4

运行与监控

本地运行可使用 --detach 后台执行,并用 octopus local status 查看进度。
5

导出数据

使用 octopus data export 导出 Excel、CSV、JSON 等格式。

快速命令示例

octopus --help
octopus doctor
octopus auth login
octopus detect https://example.com --agent --agent-command "node make-plan.mjs" --goal "提取列表数据" --task-id example-list --output task.json --yes --run-sample 3 --json
octopus detect https://example.com --auto --goal "提取列表数据" --task-id example-list --output task.json
octopus task validate example-list --task-file task.json
octopus run example-list --task-file task.json --max-rows 20
octopus task list
octopus run <taskId> --detach
octopus data export <taskId> --format xlsx --file result.xlsx

CLI、MCP / 客户端功能对比

功能MCP / 客户端CLI
浏览和搜索采集模板可以不可以
从 URL 新建采集任务客户端可以可以,使用 octopus detect
从 URL 执行采集客户端可以先用 detect 生成任务,再使用 run <taskId> --task-file
修改复杂采集规则客户端更适合部分支持,复杂规则建议客户端调整
运行已有任务可以可以
停止正在运行的任务可以可以
查看任务状态可以可以
导出采集数据可以可以
写成脚本自动执行不适合可以
接入 AI AgentMCP 更自然可以,通过 JSON / JSONL 与 Agent 模式

CLI、MCP 与桌面客户端怎么选

场景推荐方式
在 ChatGPT、Claude、Cursor、Gemini、QClaw 等 AI 中用自然语言操作MCP 服务
新 URL 快速试采、命令行自动化、服务器 / CI 定时采集八爪鱼 CLI
可视化搭建复杂规则、精细调整流程八爪鱼桌面客户端
CLI 与 MCP 可配合使用:例如在 AI 中通过 MCP 找到任务或生成需求,再在终端用 CLI 做批量运行、导出或 Agent 流程。

当前限制

  • CLI v1 不支持内核浏览器(Kernel browser)及旧版工作流(Legacy workflow)。
  • Linux arm64 暂不支持本地执行。
  • detect 与本地 run 依赖浏览器环境;网页结构复杂、登录墙或强风控页面可能需要在客户端中进一步调整规则。

下一步

安装与验证

安装 CLI、检查 Node.js / Chrome 环境与平台支持。

运行第一个任务

从新 URL 生成任务并运行,或运行已有任务并导出数据。

网页检测与任务生成

从 URL 检测结构并生成可复用任务文件。

命令速查表

认证、识别、运行、导出命令一览。