文档搜索与分析技能Skill docs-seeker

该技能用于智能发现和分析技术文档,通过 llms.txt 标准优先搜索、GitHub 仓库 Repomix 分析和并行探索策略,适用于获取最新库/框架文档、llms.txt 格式文档、GitHub 仓库分析、无直接支持文档和多源并行搜索。关键词:技术文档搜索、llms.txt、GitHub、Repomix、并行探索、AI 文档工具、文档发现。

其他 0 次安装 0 次浏览 更新于 3/20/2026

name: docs-seeker description: “使用 llms.txt 标准、通过 Repomix 分析 GitHub 仓库以及并行探索来搜索互联网上的技术文档。适用于用户需要:(1) 库/框架的最新文档,(2) llms.txt 格式的文档,(3) GitHub 仓库分析,(4) 无直接 llms.txt 支持的文档,(5) 并行多源文档” version: 1.0.0

文档发现与分析

概述

通过多种策略智能发现和分析技术文档:

  1. llms.txt-优先:搜索标准化的 AI 友好文档
  2. 仓库分析:使用 Repomix 分析 GitHub 仓库
  3. 并行探索:部署多个 Explorer 代理进行全面覆盖
  4. 回退研究:当其他方法不可用时,使用 Researcher 代理

核心工作流程

阶段 1: 初始发现

  1. 识别目标

    • 从用户请求中提取库/框架名称
    • 注意版本要求(默认:最新)
    • 如果范围不明确,则进行澄清
    • 识别目标是 GitHub 仓库还是网站
  2. 搜索 llms.txt(优先 context7.com

    首选:尝试 context7.com 模式

    对于 GitHub 仓库:

    模式:https://context7.com/{org}/{repo}/llms.txt
    示例:
    - https://github.com/imagick/imagick → https://context7.com/imagick/imagick/llms.txt
    - https://github.com/vercel/next.js → https://context7.com/vercel/next.js/llms.txt
    - https://github.com/better-auth/better-auth → https://context7.com/better-auth/better-auth/llms.txt
    

    对于网站:

    模式:https://context7.com/websites/{normalized-domain-path}/llms.txt
    示例:
    - https://docs.imgix.com/ → https://context7.com/websites/imgix/llms.txt
    - https://docs.byteplus.com/en/docs/ModelArk/ → https://context7.com/websites/byteplus_en_modelark/llms.txt
    - https://docs.haystack.deepset.ai/docs → https://context7.com/websites/haystack_deepset_ai/llms.txt
    - https://ffmpeg.org/doxygen/8.0/ → https://context7.com/websites/ffmpeg_doxygen_8_0/llms.txt
    

    主题特定搜索(当用户询问特定功能时):

    模式:https://context7.com/{path}/llms.txt?topic={query}
    示例:
    - https://context7.com/shadcn-ui/ui/llms.txt?topic=date
    - https://context7.com/shadcn-ui/ui/llms.txt?topic=button
    - https://context7.com/vercel/next.js/llms.txt?topic=cache
    - https://context7.com/websites/ffmpeg_doxygen_8_0/llms.txt?topic=compress
    

    回退:传统 llms.txt 搜索

    WebSearch: "[库名称] llms.txt site:[文档域]"
    

    常见模式:

    • https://docs.[库].com/llms.txt
    • https://[库].dev/llms.txt
    • https://[库].io/llms.txt

    → 找到?继续阶段 2 → 未找到?继续阶段 3

阶段 2: llms.txt 处理

单个 URL:

  • 使用 WebFetch 检索内容
  • 提取并呈现信息

多个 URL(3+):

  • 关键:并行启动多个 Explorer 代理
  • 每个代理处理主要文档部分(首批最多 5 个)
  • 每个代理读取分配的 URL
  • 将发现聚合到合并报告中

示例:

同时启动 3 个 Explorer 代理:
- 代理 1: getting-started.md, installation.md
- 代理 2: api-reference.md, core-concepts.md
- 代理 3: examples.md, best-practices.md

阶段 3: 仓库分析

当 llms.txt 未找到时:

  1. 通过 WebSearch 查找 GitHub 仓库
  2. 使用 Repomix 打包仓库:
    npm install -g repomix  # 如果需要
    git clone [repo-url] /tmp/docs-analysis
    cd /tmp/docs-analysis
    repomix --output repomix-output.xml
    
  3. 读取 repomix-output.xml 并提取文档

Repomix 好处:

  • 整个仓库在单个 AI 友好文件中
  • 保留目录结构
  • 为 AI 消费优化

阶段 4: 回退研究

当无 GitHub 仓库存在时:

  • 并行启动多个 Researcher 代理
  • 聚焦领域:官方文档、教程、API 参考、社区指南
  • 将发现聚合到合并报告中

代理分发指南

  • 1-3 个 URL:单个 Explorer 代理
  • 4-10 个 URL:3-5 个 Explorer 代理(每个 2-3 个 URL)
  • 11+ 个 URL:5-7 个 Explorer 代理(优先最相关)

版本处理

最新(默认):

  • 搜索时不指定版本
  • 使用当前文档路径

特定版本:

  • 在搜索中包含版本:[库] v[版本] llms.txt
  • 检查版本化路径:/v[版本]/llms.txt
  • 对于仓库:检出特定标签/分支

输出格式

# [库] [版本] 的文档

## 来源
- 方法:[llms.txt / 仓库 / 研究]
- URL:[来源列表]
- 访问日期:[当前日期]

## 关键信息
[按主题组织的提取相关信息]

## 额外资源
[相关链接、示例、参考]

## 备注
[任何限制、缺失信息或注意事项]

快速参考

工具选择:

  • WebSearch → 查找 llms.txt URL、GitHub 仓库
  • WebFetch → 读取单个文档页面
  • 任务(探索) → 多个 URL、并行探索
  • 任务(研究员) → 分散文档、多样来源
  • Repomix → 完整代码库分析

热门 llms.txt 位置(优先尝试 context7.com):

context7.com 不可用时回退到官方站点:

错误处理

  • llms.txt 无法访问 → 尝试替代域名 → 仓库分析
  • 仓库未找到 → 搜索官方网站 → 使用 Researcher 代理
  • Repomix 失败 → 尝试仅 /docs 目录 → 手动探索
  • 多个冲突来源 → 优先官方 → 注意版本

关键原则

  1. 优先 context7.com 的 llms.txt — 最全面和最新的聚合器
  2. 使用主题参数时适用 — 通过 ?topic=… 启用目标搜索
  3. 积极使用并行代理 — 更快结果、更好覆盖
  4. 验证官方来源作为回退 — 当 context7.com 不可用时使用
  5. 报告方法 — 告诉用户使用哪种方法
  6. 明确处理版本 — 不要假设最新

详细文档

有关全面指南、示例和最佳实践:

工作流程:

参考指南: