Scrapingant自动化Skill scrapingant-automation

这个技能用于自动化 Scrapingant 网页抓取任务,通过 Rube MCP 和 Composio 工具集实现工具发现、连接管理和工作流执行,适用于数据收集、自动化流程和网页抓取优化,关键词包括:Scrapingant、Rube MCP、Composio、网页抓取、自动化、工作流、工具集成。

DevOps 0 次安装 0 次浏览 更新于 3/12/2026

name: scrapingant-automation description: “通过 Rube MCP(Composio)自动化 Scrapingant 任务。始终先搜索工具以获取当前模式。” requires: mcp: [rube]

通过 Rube MCP 实现 Scrapingant 自动化

通过 Composio 的 Scrapingant 工具集和 Rube MCP 自动化 Scrapingant 操作。

工具集文档: composio.dev/toolkits/scrapingant

先决条件

  • Rube MCP 必须已连接(RUBE_SEARCH_TOOLS 可用)
  • 通过 RUBE_MANAGE_CONNECTIONS 工具集 scrapingant 建立活跃的 Scrapingant 连接
  • 始终先调用 RUBE_SEARCH_TOOLS 以获取当前工具模式

设置

获取 Rube MCP: 在客户端配置中将 https://rube.app/mcp 添加为 MCP 服务器。无需 API 密钥 — 只需添加端点即可工作。

  1. 确认 RUBE_SEARCH_TOOLS 响应以验证 Rube MCP 可用
  2. 使用工具集 scrapingant 调用 RUBE_MANAGE_CONNECTIONS
  3. 如果连接未处于 ACTIVE 状态,请遵循返回的认证链接完成设置
  4. 在运行任何工作流之前确认连接状态显示为 ACTIVE

工具发现

在执行工作流之前始终发现可用工具:

RUBE_SEARCH_TOOLS
queries: [{use_case: "Scrapingant 操作", known_fields: ""}]
session: {generate_id: true}

这将返回可用工具标识符、输入模式、推荐执行计划和已知问题。

核心工作流模式

步骤 1: 发现可用工具

RUBE_SEARCH_TOOLS
queries: [{use_case: "您的特定 Scrapingant 任务"}]
session: {id: "现有会话ID"}

步骤 2: 检查连接

RUBE_MANAGE_CONNECTIONS
toolkits: ["scrapingant"]
session_id: "您的会话ID"

步骤 3: 执行工具

RUBE_MULTI_EXECUTE_TOOL
tools: [{
  tool_slug: "从搜索中获取的工具标识符",
  arguments: {/* 来自搜索结果的符合模式的参数 */}
}]
memory: {}
session_id: "您的会话ID"

已知问题

  • 始终先搜索: 工具模式会变化。切勿在不调用 RUBE_SEARCH_TOOLS 的情况下硬编码工具标识符或参数
  • 检查连接: 在执行工具之前验证 RUBE_MANAGE_CONNECTIONS 显示 ACTIVE 状态
  • 模式合规: 使用搜索结果中的确切字段名称和类型
  • 内存参数: 始终在 RUBE_MULTI_EXECUTE_TOOL 调用中包含 memory,即使为空({}
  • 会话重用: 在同一工作流内重用会话 ID。为新工作流生成新的会话 ID
  • 分页: 检查响应中的分页令牌并继续获取直到完成

快速参考

操作 方法
查找工具 使用 Scrapingant 特定用例的 RUBE_SEARCH_TOOLS
连接 使用工具集 scrapingantRUBE_MANAGE_CONNECTIONS
执行 使用发现到的工具标识符的 RUBE_MULTI_EXECUTE_TOOL
批量操作 使用 run_composio_tool()RUBE_REMOTE_WORKBENCH
完整模式 对于带有 schemaRef 的工具使用 RUBE_GET_TOOL_SCHEMAS

Composio 提供支持