name: docs-seeker description: “使用 llms.txt 标准、通过 Repomix 分析 GitHub 仓库以及并行探索来搜索互联网上的技术文档。适用于用户需要：(1) 库/框架的最新文档，(2) llms.txt 格式的文档，(3) GitHub 仓库分析，(4) 无直接 llms.txt 支持的文档，(5) 并行多源文档” version: 1.0.0

文档发现与分析

概述

通过多种策略智能发现和分析技术文档：

llms.txt-优先：搜索标准化的 AI 友好文档
仓库分析：使用 Repomix 分析 GitHub 仓库
并行探索：部署多个 Explorer 代理进行全面覆盖
回退研究：当其他方法不可用时，使用 Researcher 代理

核心工作流程

阶段 1: 初始发现

识别目标
- 从用户请求中提取库/框架名称
- 注意版本要求（默认：最新）
- 如果范围不明确，则进行澄清
- 识别目标是 GitHub 仓库还是网站

搜索 llms.txt（优先 context7.com）

首选：尝试 context7.com 模式

对于 GitHub 仓库：

模式：https://context7.com/{org}/{repo}/llms.txt
示例：
- https://github.com/imagick/imagick → https://context7.com/imagick/imagick/llms.txt
- https://github.com/vercel/next.js → https://context7.com/vercel/next.js/llms.txt
- https://github.com/better-auth/better-auth → https://context7.com/better-auth/better-auth/llms.txt

对于网站：

模式：https://context7.com/websites/{normalized-domain-path}/llms.txt
示例：
- https://docs.imgix.com/ → https://context7.com/websites/imgix/llms.txt
- https://docs.byteplus.com/en/docs/ModelArk/ → https://context7.com/websites/byteplus_en_modelark/llms.txt
- https://docs.haystack.deepset.ai/docs → https://context7.com/websites/haystack_deepset_ai/llms.txt
- https://ffmpeg.org/doxygen/8.0/ → https://context7.com/websites/ffmpeg_doxygen_8_0/llms.txt

主题特定搜索（当用户询问特定功能时）：

模式：https://context7.com/{path}/llms.txt?topic={query}
示例：
- https://context7.com/shadcn-ui/ui/llms.txt?topic=date
- https://context7.com/shadcn-ui/ui/llms.txt?topic=button
- https://context7.com/vercel/next.js/llms.txt?topic=cache
- https://context7.com/websites/ffmpeg_doxygen_8_0/llms.txt?topic=compress

回退：传统 llms.txt 搜索

WebSearch: "[库名称] llms.txt site:[文档域]"

常见模式：

https://docs.[库].com/llms.txt
https://[库].dev/llms.txt
https://[库].io/llms.txt

→ 找到？继续阶段 2 → 未找到？继续阶段 3

阶段 2: llms.txt 处理

单个 URL：

使用 WebFetch 检索内容
提取并呈现信息

多个 URL（3+）：

关键：并行启动多个 Explorer 代理
每个代理处理主要文档部分（首批最多 5 个）
每个代理读取分配的 URL
将发现聚合到合并报告中

示例：

同时启动 3 个 Explorer 代理：
- 代理 1: getting-started.md, installation.md
- 代理 2: api-reference.md, core-concepts.md
- 代理 3: examples.md, best-practices.md

阶段 3: 仓库分析

当 llms.txt 未找到时：

通过 WebSearch 查找 GitHub 仓库

使用 Repomix 打包仓库：

npm install -g repomix  # 如果需要
git clone [repo-url] /tmp/docs-analysis
cd /tmp/docs-analysis
repomix --output repomix-output.xml

读取 repomix-output.xml 并提取文档

Repomix 好处：

整个仓库在单个 AI 友好文件中
保留目录结构
为 AI 消费优化

阶段 4: 回退研究

当无 GitHub 仓库存在时：

并行启动多个 Researcher 代理
聚焦领域：官方文档、教程、API 参考、社区指南
将发现聚合到合并报告中

代理分发指南

1-3 个 URL：单个 Explorer 代理
4-10 个 URL：3-5 个 Explorer 代理（每个 2-3 个 URL）
11+ 个 URL：5-7 个 Explorer 代理（优先最相关）

版本处理

最新（默认）：

搜索时不指定版本
使用当前文档路径

特定版本：

在搜索中包含版本：[库] v[版本] llms.txt
检查版本化路径：/v[版本]/llms.txt
对于仓库：检出特定标签/分支

输出格式

# [库] [版本] 的文档

## 来源
- 方法：[llms.txt / 仓库 / 研究]
- URL：[来源列表]
- 访问日期：[当前日期]

## 关键信息
[按主题组织的提取相关信息]

## 额外资源
[相关链接、示例、参考]

## 备注
[任何限制、缺失信息或注意事项]

快速参考

工具选择：

WebSearch → 查找 llms.txt URL、GitHub 仓库
WebFetch → 读取单个文档页面
任务（探索） → 多个 URL、并行探索
任务（研究员） → 分散文档、多样来源
Repomix → 完整代码库分析

热门 llms.txt 位置（优先尝试 context7.com）：

Astro: https://context7.com/withastro/astro/llms.txt
Next.js: https://context7.com/vercel/next.js/llms.txt
Remix: https://context7.com/remix-run/remix/llms.txt
shadcn/ui: https://context7.com/shadcn-ui/ui/llms.txt
Better Auth: https://context7.com/better-auth/better-auth/llms.txt

当 context7.com 不可用时回退到官方站点：

Astro: https://docs.astro.build/llms.txt
Next.js: https://nextjs.org/llms.txt
Remix: https://remix.run/llms.txt
SvelteKit: https://kit.svelte.dev/llms.txt

错误处理

llms.txt 无法访问 → 尝试替代域名 → 仓库分析
仓库未找到 → 搜索官方网站 → 使用 Researcher 代理
Repomix 失败 → 尝试仅 /docs 目录 → 手动探索
多个冲突来源 → 优先官方 → 注意版本

关键原则

优先 context7.com 的 llms.txt — 最全面和最新的聚合器
使用主题参数时适用 — 通过 ?topic=… 启用目标搜索
积极使用并行代理 — 更快结果、更好覆盖
验证官方来源作为回退 — 当 context7.com 不可用时使用
报告方法 — 告诉用户使用哪种方法
明确处理版本 — 不要假设最新

详细文档

有关全面指南、示例和最佳实践：

工作流程：

WORKFLOWS.md — 详细工作流程示例和策略

参考指南：

工具选择 — 选择和使用工具的完整指南
文档来源 — 跨生态系统的常见来源和模式
错误处理 — 故障排除和解决策略
最佳实践 — 有效发现的 8 个基本原则
性能 — 优化技术和基准
限制 — 边界和成功标准