智能文档探索与分析技能Skill docs-seeker

这个技能专注于智能发现和分析技术文档,通过多种策略如llms.txt优先搜索、GitHub仓库通过Repomix分析以及并行探索代理实现全面覆盖。适用于需要最新库/框架文档、llms.txt格式文档、GitHub仓库分析、无直接llms.txt支持的文档以及并行处理多个文档源的场景。关键词:技术文档搜索、AI代理、llms.txt、Repomix、并行探索、文档发现、GitHub分析、智能搜索。

AI智能体 0 次安装 0 次浏览 更新于 3/18/2026

name: docs-seeker description: “使用llms.txt标准、通过Repomix分析GitHub仓库以及并行探索来搜索互联网上的技术文档。当用户需要时使用:(1) 库/框架的最新文档,(2) llms.txt格式的文档,(3) GitHub仓库分析,(4) 没有直接llms.txt支持的文档,(5) 并行多个文档源” version: 1.0.0

文档发现与分析

概述

通过多种策略智能发现和分析技术文档:

  1. llms.txt优先:搜索标准化的AI友好文档
  2. 仓库分析:使用Repomix分析GitHub仓库
  3. 并行探索:部署多个Explorer代理以全面覆盖
  4. 后备研究:当其他方法不可用时,使用Researcher代理

核心工作流程

阶段1:初始发现

  1. 识别目标

    • 从用户请求中提取库/框架名称
    • 注意版本要求(默认:最新)
    • 如果模糊,澄清范围
  2. 搜索llms.txt

    WebSearch: "[库名] llms.txt site:[文档域名]"
    

    常见模式:

    • https://docs.[库].com/llms.txt
    • https://[库].dev/llms.txt
    • https://[库].io/llms.txt

    → 找到?继续阶段2 → 未找到?继续阶段3

阶段2:llms.txt处理

单个URL:

  • WebFetch检索内容
  • 提取并呈现信息

多个URL(3个以上):

  • 关键:并行启动多个Explorer代理
  • 每个代理处理主要文档部分(第一批最多5个)
  • 每个代理读取分配的URL
  • 将发现汇总成合并报告

示例:

同时启动3个Explorer代理:
- 代理1: getting-started.md, installation.md
- 代理2: api-reference.md, core-concepts.md
- 代理3: examples.md, best-practices.md

阶段3:仓库分析

当llms.txt未找到时:

  1. 通过WebSearch找到GitHub仓库
  2. 使用Repomix打包仓库:
    npm install -g repomix  # 如果需要
    git clone [仓库URL] /tmp/docs-analysis
    cd /tmp/docs-analysis
    repomix --output repomix-output.xml
    
  3. 读取repomix-output.xml并提取文档

Repomix优势:

  • 整个仓库在单个AI友好文件中
  • 保留目录结构
  • 优化为AI消费

阶段4:后备研究

当没有GitHub仓库存在时:

  • 并行启动多个Researcher代理
  • 重点关注:官方文档、教程、API参考、社区指南
  • 将发现汇总成合并报告

代理分发指南

  • 1-3个URL:单个Explorer代理
  • 4-10个URL:3-5个Explorer代理(每个2-3个URL)
  • 11个以上URL:5-7个Explorer代理(优先最相关)

版本处理

最新(默认):

  • 搜索时不指定版本
  • 使用当前文档路径

特定版本:

  • 在搜索中包含版本:[库] v[版本] llms.txt
  • 检查版本化路径:/v[版本]/llms.txt
  • 对于仓库:检出特定标签/分支

输出格式

# [库] [版本] 的文档

## 来源
- 方法:[llms.txt / 仓库 / 研究]
- URL:[来源列表]
- 访问日期:[当前日期]

## 关键信息
[按主题组织的提取相关信息]

## 附加资源
[相关链接、示例、参考]

## 备注
[任何限制、缺失信息或注意事项]

快速参考

工具选择:

  • WebSearch → 查找llms.txt URL、GitHub仓库
  • WebFetch → 读取单个文档页面
  • Task (Explore) → 多个URL、并行探索
  • Task (Researcher) → 分散文档、多样化来源
  • Repomix → 完整代码库分析

流行llms.txt位置:

错误处理

  • llms.txt不可访问 → 尝试替代域名 → 仓库分析
  • 仓库未找到 → 搜索官方网站 → 使用Researcher代理
  • Repomix失败 → 仅尝试/docs目录 → 手动探索
  • 多个冲突来源 → 优先官方 → 注意版本

关键原则

  1. 始终从llms.txt开始 — 最有效方法
  2. 积极使用并行代理 — 更快结果、更好覆盖
  3. 验证官方来源 — 避免过时文档
  4. 报告方法 — 告诉用户使用了哪种方法
  5. 显式处理版本 — 不要假设最新

详细文档

如需全面指南、示例和最佳实践:

工作流程:

参考指南: