迭代检索 iterative-retrieval

迭代检索技能是一种用于多代理系统中解决上下文缺失问题的技术。它通过四个阶段(派遣、评估、精炼、循环)逐步检索和精炼相关文件,确保代理获得足够且相关的上下文信息,以提高任务执行效率。关键词:迭代检索、上下文检索、子代理、文件检索、精炼搜索、AI智能体、RAG应用。

RAG应用 0 次安装 0 次浏览 更新于 3/7/2026

名称: 迭代检索 描述: 用于逐步精炼上下文检索以解决子代理上下文问题的模式

迭代检索模式

解决多代理工作流程中的“上下文问题”,其中子代理在开始工作之前不知道需要什么上下文。

问题

子代理以有限上下文产生。它们不知道:

  • 哪些文件包含相关代码
  • 代码库中存在什么模式
  • 项目使用什么术语

标准方法失败:

  • 发送所有内容:超过上下文限制
  • 不发送内容:代理缺乏关键信息
  • 猜测需要什么:经常错误

解决方案:迭代检索

一个渐进精炼上下文的4阶段循环:

┌─────────────────────────────────────────────┐
│                                             │
│   ┌──────────┐      ┌──────────┐            │
│   │ 派遣     │─────▶│ 评估     │            │
│   └──────────┘      └──────────┘            │
│        ▲                  │                 │
│        │                  ▼                 │
│   ┌──────────┐      ┌──────────┐            │
│   │  循环    │◀─────│ 精炼     │            │
│   └──────────┘      └──────────┘            │
│                                             │
│        最多3个循环,然后继续               │
└─────────────────────────────────────────────┘

阶段 1:派遣

初始广泛查询以收集候选文件:

// 从高层意图开始
const initialQuery = {
  patterns: ['src/**/*.ts', 'lib/**/*.ts'],
  keywords: ['authentication', 'user', 'session'],
  excludes: ['*.test.ts', '*.spec.ts']
};

// 派遣到检索代理
const candidates = await retrieveFiles(initialQuery);

阶段 2:评估

评估检索内容的相关性:

function evaluateRelevance(files, task) {
  return files.map(file => ({
    path: file.path,
    relevance: scoreRelevance(file.content, task),
    reason: explainRelevance(file.content, task),
    missingContext: identifyGaps(file.content, task)
  }));
}

评分标准:

  • 高(0.8-1.0):直接实现目标功能
  • 中(0.5-0.7):包含相关模式或类型
  • 低(0.2-0.4):间接相关
  • 无(0-0.2):不相关,排除

阶段 3:精炼

基于评估更新搜索标准:

function refineQuery(evaluation, previousQuery) {
  return {
    // 新增在高相关性文件中发现的新模式
    patterns: [...previousQuery.patterns, ...extractPatterns(evaluation)],

    // 新增在代码库中找到的术语
    keywords: [...previousQuery.keywords, ...extractKeywords(evaluation)],

    // 排除确认不相关的路径
    excludes: [...previousQuery.excludes, ...evaluation
      .filter(e => e.relevance < 0.2)
      .map(e => e.path)
    ],

    // 针对特定缺口
    focusAreas: evaluation
      .flatMap(e => e.missingContext)
      .filter(unique)
  };
}

阶段 4:循环

以精炼标准重复(最多3个循环):

async function iterativeRetrieve(task, maxCycles = 3) {
  let query = createInitialQuery(task);
  let bestContext = [];

  for (let cycle = 0; cycle < maxCycles; cycle++) {
    const candidates = await retrieveFiles(query);
    const evaluation = evaluateRelevance(candidates, task);

    // 检查是否有足够上下文
    const highRelevance = evaluation.filter(e => e.relevance >= 0.7);
    if (highRelevance.length >= 3 && !hasCriticalGaps(evaluation)) {
      return highRelevance;
    }

    // 精炼并继续
    query = refineQuery(evaluation, query);
    bestContext = mergeContext(bestContext, highRelevance);
  }

  return bestContext;
}

实际范例

范例 1:Bug修复上下文

任务:“修复认证token过期bug”

循环 1:
  派遣:在src/**搜索“token”、“auth”、“expiry”
  评估:找到auth.ts (0.9)、tokens.ts (0.8)、user.ts (0.3)
  精炼:新增“refresh”、“jwt”关键字;排除user.ts

循环 2:
  派遣:搜索精炼术语
  评估:找到session-manager.ts (0.95)、jwt-utils.ts (0.85)
  精炼:足够上下文(2个高相关性文件)

结果:auth.ts、tokens.ts、session-manager.ts、jwt-utils.ts

范例 2:功能实现

任务:“为API端点增加速率限制”

循环 1:
  派遣:在routes/**搜索“rate”、“limit”、“api”
  评估:无匹配 - 代码库使用“throttle”术语
  精炼:新增“throttle”、“middleware”关键字

循环 2:
  派遣:搜索精炼术语
  评估:找到throttle.ts (0.9)、middleware/index.ts (0.7)
  精炼:需要路由器模式

循环 3:
  派遣:搜索“router”、“express”模式
  评估:找到router-setup.ts (0.8)
  精炼:足够上下文

结果:throttle.ts、middleware/index.ts、router-setup.ts

与代理整合

在代理提示中使用:

为此任务检索上下文时:
1. 从广泛关键字搜索开始
2. 评估每个文件的相关性(0-1尺度)
3. 识别仍缺少的上下文
4. 精炼搜索标准并重复(最多3个循环)
5. 回传相关性 >= 0.7的文件

最佳实践

  1. 从广泛开始,逐渐缩小 - 不要过度指定初始查询
  2. 学习代码库术语 - 第一个循环通常会揭示命名惯例
  3. 追踪缺失内容 - 明确的缺口识别驱动精炼
  4. 在“足够好”时停止 - 3个高相关性文件胜过10个普通文件
  5. 自信地排除 - 低相关性文件不会变得相关

相关

  • 长篇指南 - 子代理协调章节
  • continuous-learning 技能 - 用于随时间改进的模式
  • ~/.claude/agents/ 中的代理定义