网络抓取AI自动化Skill webscraping-ai-automation

这个技能用于自动化网络抓取AI任务,通过Rube MCP和Composio的Webscraping AI工具包。关键词:网络抓取、AI、自动化、Rube MCP、Composio、工具包。

AI应用 0 次安装 0 次浏览 更新于 3/12/2026

name: webscraping-ai-automation description: “通过Rube MCP(Composio)自动化Webscraping AI任务。始终首先搜索工具以获取当前架构。” requires: mcp: [rube]

通过Rube MCP进行Webscraping AI自动化

通过Composio的Webscraping AI工具包和Rube MCP自动化Webscraping AI操作。

工具包文档: composio.dev/toolkits/webscraping_ai

先决条件

  • Rube MCP必须连接(RUBE_SEARCH_TOOLS可用)
  • 通过RUBE_MANAGE_CONNECTIONS与工具包webscraping_ai建立活跃的Webscraping AI连接
  • 始终首先调用RUBE_SEARCH_TOOLS以获取当前工具架构

设置

获取Rube MCP: 在客户端配置中添加https://rube.app/mcp作为MCP服务器。无需API密钥——只需添加端点即可工作。

  1. 通过确认RUBE_SEARCH_TOOLS响应来验证Rube MCP可用
  2. 调用RUBE_MANAGE_CONNECTIONS,工具包为webscraping_ai
  3. 如果连接未激活,请按照返回的认证链接完成设置
  4. 在运行任何工作流之前,确认连接状态显示为ACTIVE

工具发现

在执行工作流之前始终发现可用工具:

RUBE_SEARCH_TOOLS
queries: [{use_case: "Webscraping AI operations", known_fields: ""}]
session: {generate_id: true}

这返回可用工具标识符、输入架构、推荐执行计划和已知陷阱。

核心工作流模式

步骤1:发现可用工具

RUBE_SEARCH_TOOLS
queries: [{use_case: "您的特定Webscraping AI任务"}]
session: {id: "现有会话ID"}

步骤2:检查连接

RUBE_MANAGE_CONNECTIONS
toolkits: ["webscraping_ai"]
session_id: "您的会话ID"

步骤3:执行工具

RUBE_MULTI_EXECUTE_TOOL
tools: [{
  tool_slug: "来自搜索的TOOL_SLUG",
  arguments: {/* 来自搜索结果的符合架构的参数 */}
}]
memory: {}
session_id: "您的会话ID"

已知陷阱

  • 始终首先搜索: 工具架构会变化。切勿在未调用RUBE_SEARCH_TOOLS的情况下硬编码工具标识符或参数
  • 检查连接: 在执行工具之前验证RUBE_MANAGE_CONNECTIONS显示ACTIVE状态
  • 架构合规: 使用搜索结果中的确切字段名称和类型
  • 内存参数: 始终在RUBE_MULTI_EXECUTE_TOOL调用中包含memory,即使为空({}
  • 会话重用: 在工作流中重用会话ID。为新工作流生成新的ID
  • 分页: 检查响应中的分页令牌,并继续获取直到完成

快速参考

操作 方法
查找工具 RUBE_SEARCH_TOOLS,使用Webscraping AI特定用例
连接 RUBE_MANAGE_CONNECTIONS,工具包为webscraping_ai
执行 RUBE_MULTI_EXECUTE_TOOL,使用发现的工具标识符
批量操作 RUBE_REMOTE_WORKBENCH,使用run_composio_tool()
完整架构 RUBE_GET_TOOL_SCHEMAS,用于具有schemaRef的工具

Composio提供支持