name: docs-seeker description: “使用llms.txt标准、通过Repomix分析GitHub仓库以及并行探索来搜索互联网上的技术文档。当用户需要时使用：(1) 库/框架的最新文档，(2) llms.txt格式的文档，(3) GitHub仓库分析，(4) 没有直接llms.txt支持的文档，(5) 并行多个文档源” version: 1.0.0

文档发现与分析

概述

通过多种策略智能发现和分析技术文档：

llms.txt优先: 搜索标准化的AI友好文档
仓库分析: 使用Repomix分析GitHub仓库
并行探索: 部署多个探索代理进行全面覆盖
回退研究: 当其他方法不可用时使用研究代理

核心工作流

第一阶段：初始发现

识别目标
- 从用户请求中提取库/框架名称
- 注意版本要求（默认：最新）
- 澄清范围如果不明确
- 识别目标是GitHub仓库还是网站

搜索llms.txt（优先context7.com）

首先：尝试context7.com模式

对于GitHub仓库：

模式：https://context7.com/{org}/{repo}/llms.txt
示例：
- https://github.com/imagick/imagick → https://context7.com/imagick/imagick/llms.txt
- https://github.com/vercel/next.js → https://context7.com/vercel/next.js/llms.txt
- https://github.com/better-auth/better-auth → https://context7.com/better-auth/better-auth/llms.txt

对于网站：

模式：https://context7.com/websites/{normalized-domain-path}/llms.txt
示例：
- https://docs.imgix.com/ → https://context7.com/websites/imgix/llms.txt
- https://docs.byteplus.com/en/docs/ModelArk/ → https://context7.com/websites/byteplus_en_modelark/llms.txt
- https://docs.haystack.deepset.ai/docs → https://context7.com/websites/haystack_deepset_ai/llms.txt
- https://ffmpeg.org/doxygen/8.0/ → https://context7.com/websites/ffmpeg_doxygen_8_0/llms.txt

主题特定搜索（当用户询问特定功能时）：

模式：https://context7.com/{path}/llms.txt?topic={query}
示例：
- https://context7.com/shadcn-ui/ui/llms.txt?topic=date
- https://context7.com/shadcn-ui/ui/llms.txt?topic=button
- https://context7.com/vercel/next.js/llms.txt?topic=cache
- https://context7.com/websites/ffmpeg_doxygen_8_0/llms.txt?topic=compress

回退：传统llms.txt搜索

网络搜索："[库名] llms.txt site:[文档域名]"

常见模式：

https://docs.[库].com/llms.txt
https://[库].dev/llms.txt
https://[库].io/llms.txt

→ 找到？进入第二阶段 → 未找到？进入第三阶段

第二阶段：llms.txt处理

单URL：

使用WebFetch获取内容
提取并呈现信息

多URL（3个以上）：

关键：并行启动多个探索代理
每个代理处理主要文档部分（第一批最多5个）
每个代理读取分配的URL
汇总发现为统一报告

示例：

同时启动3个探索代理：
- 代理1：getting-started.md, installation.md
- 代理2：api-reference.md, core-concepts.md
- 代理3：examples.md, best-practices.md

第三阶段：仓库分析

当llms.txt未找到时：

通过网络搜索找到GitHub仓库

使用Repomix打包仓库：

npm install -g repomix  # 如果需要
git clone [repo-url] /tmp/docs-analysis
cd /tmp/docs-analysis
repomix --output repomix-output.xml

读取repomix-output.xml并提取文档

Repomix优势：

整个仓库在单个AI友好文件中
保持目录结构
为AI消费优化

第四阶段：回退研究

当没有GitHub仓库存在时：

并行启动多个研究代理
重点领域：官方文档、教程、API参考、社区指南
汇总发现为统一报告

代理分配指南

1-3个URL：单个探索代理
4-10个URL：3-5个探索代理（每个2-3个URL）
11个以上URL：5-7个探索代理（优先最相关）

版本处理

最新（默认）：

搜索时不包括版本说明
使用当前文档路径

特定版本：

搜索时包含版本：[库] v[版本] llms.txt
检查版本化路径：/v[版本]/llms.txt
对于仓库：检出特定标签/分支

输出格式

# [库] [版本]的文档

## 来源
- 方法：[llms.txt / 仓库 / 研究]
- URL：[来源列表]
- 访问日期：[当前日期]

## 关键信息
[按主题组织的提取相关信息]

## 其他资源
[相关链接、示例、参考]

## 备注
[任何限制、缺失信息或注意事项]

快速参考

工具选择：

WebSearch → 查找llms.txt URL、GitHub仓库
WebFetch → 读取单个文档页面
任务（探索） → 多个URL、并行探索
任务（研究） → 分散文档、多样来源
Repomix → 完整代码库分析

常见llms.txt位置（优先尝试context7.com）：

Astro：https://context7.com/withastro/astro/llms.txt
Next.js：https://context7.com/vercel/next.js/llms.txt
Remix：https://context7.com/remix-run/remix/llms.txt
shadcn/ui：https://context7.com/shadcn-ui/ui/llms.txt
Better Auth：https://context7.com/better-auth/better-auth/llms.txt

如果context7.com不可用，回退到官方网站：

Astro：https://docs.astro.build/llms.txt
Next.js：https://nextjs.org/llms.txt
Remix：https://remix.run/llms.txt
SvelteKit：https://kit.svelte.dev/llms.txt

错误处理

llms.txt无法访问 → 尝试替代域名 → 仓库分析
仓库未找到 → 搜索官方网站 → 使用研究代理
Repomix失败 → 尝试仅/docs目录 → 手动探索
多个冲突来源 → 优先官方 → 注意版本

关键原则

优先context7.com的llms.txt — 最全面和最新的聚合器
当适用时使用主题参数 — 通过?topic=…启用定向搜索
积极使用并行代理 — 更快结果、更好覆盖
作为回退验证官方来源 — 当context7.com不可用时使用
报告方法 — 告诉用户使用了哪种方法
明确处理版本 — 不要假设最新

详细文档

全面指南、示例和最佳实践：

工作流：

WORKFLOWS.md — 详细工作流示例和策略

参考指南：

工具选择 — 选择和使用工具的完整指南
文档来源 — 跨生态系统的常见来源和模式
错误处理 — 故障排除和解决策略
最佳实践 — 8个有效发现的基本原则
性能 — 优化技术和基准
限制 — 边界和成功标准