令牌预算顾问Skill token-budget-advisor

这是一个用于在AI对话系统中评估令牌预算和推荐任务分块策略的技能,帮助管理上下文窗口限制,避免令牌超出,确保任务成功完成。关键词:令牌预算,任务分块,AI代理,上下文管理,风险评估,智能工作流。

AI智能体 0 次安装 0 次浏览 更新于 3/18/2026

name: 令牌预算顾问 description: 主动的令牌预算评估和任务分块策略。当查询涉及多个大文件上传、请求进行全面的多文档分析、复杂多步骤工作流(需要大量研究,超过10个工具调用)、类似“完整分析”、“全面审计”、“彻底审查”、“深度探讨”的短语,或结合广泛研究和大型输出产物的任务时,使用此技能。此技能有助于在开始工作前早期评估令牌消耗风险并推荐分块策略。

令牌预算顾问

此技能提供对令牌密集型任务的早期评估,并推荐分块策略以确保在上下文窗口限制内成功完成。

何时使用此技能

在开始工作前触发此技能,当您检测到:

  • 多个文件上传(3+个文档)结合分析请求
  • 请求“全面的”、“完整的”、“彻底的”或“完整的”分析
  • 多文档比较分析
  • 复杂工作流需要10+个工具调用(广泛网络研究 + 综合)
  • 任务结合大量研究和大型产物(报告、演示文稿)
  • 查询跨越多个维度(时间 + 类别 + 定量)
  • 请求“分析一切”或“创建所有方面的完整报告”

核心功能

此技能有两个目的:

  1. 早期预警系统:评估任务是否可能超出令牌限制
  2. 战略规划:提供具体、可操作的分块推荐

令牌估计框架

快速评估启发式方法

使用这些粗略指南估计令牌消耗:

输入成本:

  • 上传文档:每个约1,000-5,000个令牌(取决于长度)
  • 网络搜索结果:约500-1,500个令牌
  • 网络抓取(完整文章):约2,000-8,000个令牌
  • Google Drive文档:约1,000-10,000个令牌(差异较大)

输出成本:

  • 简单响应:500-2,000个令牌
  • 详细分析:2,000-5,000个令牌
  • 长篇报告:5,000-15,000个令牌
  • 复杂产物(演示文稿、文档):5,000-20,000个令牌

工具调用开销:

  • 每个工具调用包括查询、结果和推理:平均约1,000-3,000个令牌

警告阈值:

  • 警告区(60-80%的预算):任务可完成但紧张;考虑效率
  • 危险区(80-95%的预算):高风险;强烈推荐分块
  • 超出预算(95%+的预算):任务需要分块;无法在一个对话中完成

任务复杂性乘数

应用这些心理调整:

  • 需要综合:在输出估计上增加30-50%(比较、整合多个来源)
  • 迭代优化:增加20-30%(当任务涉及审查和改进时)
  • 多种格式:每增加一种输出类型增加20%(报告 + 演示文稿 + 电子表格)

分块策略框架

当任务超出令牌预算时,推荐具体分块方法。基于任务结构选择策略:

1. 顺序处理

最适合: 时间序列数据、按时间顺序分析、有序工作流

模式:

“这个12个月的数据分析将超出我们的令牌预算。我建议我们按季度拆分:
- 第1部分:Q1-Q2分析(1月-6月)
- 第2部分:Q3-Q4分析(7月-12月)
- 第3部分:综合和建议

我应该从第1部分开始吗?”

何时使用:

  • 历史数据分析
  • 期间比较
  • 多阶段项目

2. 维度分解

最适合: 多面分析、同一主题的不同方面

模式:

“一个完整的市场分析涵盖财务、竞争、监管和技术因素将给我们的令牌预算带来压力。让我们分解为:
- 会话1:财务表现和市场规模
- 会话2:竞争格局和定位
- 会话3:监管环境和合规
- 会话4:技术趋势和综合

我们应该先处理哪个维度?”

何时使用:

  • 多利益相关者分析
  • 同一主题的不同分析视角
  • 复杂商业案例

3. 深度递进

最适合: 需要大纲 → 草案 → 优化的任务

模式:

“创建一个包含详细研究的全面50页演示文稿将超出我们的预算。我建议:
- 第1轮:构建结构和大纲(30分钟)
- 第2轮:为幻灯片1-25开发内容(45分钟)
- 第3轮:为幻灯片26-50开发内容(45分钟)
- 第4轮:优化审查(30分钟)

我们从大纲开始吗?”

何时使用:

  • 大型文档或演示文稿
  • 当质量优化重要时
  • 受益于迭代的创意项目

4. 子集采样

最适合: 大型文档集,其中代表性采样有效

模式:

“分析所有15个合同将超出我们的预算。我建议:
- 第1部分:分析5个代表性合同(不同类型/日期)
- 第2部分:基于发现模式,用5个更多确认
- 第3部分:快速扫描剩余5个以查找例外,然后综合

这样在管理令牌的同时给出全面覆盖。听起来好吗?”

何时使用:

  • 大规模文档审查
  • 跨多个文件的模式识别
  • 基于风险的采样方法

5. 并行轨道处理

最适合: 独立的工作流,稍后可以合并

模式:

“将我们的产品与5个竞争对手在功能、定价和定位上进行比较对一个会话来说太大。让我们按竞争对手拆分:
- 会话1:竞争对手A和B完整分析
- 会话2:竞争对手C和D完整分析
- 会话3:竞争对手E + 综合矩阵

每个会话保持专注和可管理。”

何时使用:

  • 比较分析
  • 多个独立主题
  • 当部分不需要彼此上下文时

沟通指南

消息框架

推荐分块时,使用此结构:

  1. 清楚地确认请求
  2. 提供令牌预算评估(简短,1句话)
  3. 推荐具体分块方法(编号列表,2-4部分)
  4. 请求确认继续(让用户保持控制)

示例:

我将帮助您分析这8份财务报告并创建一个全面的演示文稿。
考虑到所需的研究和产物创建,此任务将超出我们的令牌预算。
我建议拆分:
1. 报告1-4:分析和关键发现
2. 报告5-8:分析和关键发现
3. 将所有发现综合成演示文稿

我应该从报告1-4开始吗?

不应该做什么

❌ 不要过度解释令牌预算或技术性地讨论上下文窗口 ❌ 不要过度道歉或听起来限制性 ❌ 不要提供模糊建议如“也许以某种方式拆分” ❌ 不要开始工作然后中途停止说“我们已经用完了令牌”

✅ 要实事求是和解决方案导向 ✅ 要提供具体、可操作的分解 ✅ 要保持向任务完成的动力 ✅ 要将分块框架为质量改进(彻底性)而非限制

处理边缘情况

用户坚持单次会话

如果用户反对分块:

“我理解您希望一次性完成。我会尽力完成,但我可能需要:
- 优先处理最关键的元素
- 提供简化版本
- 在某些领域关注广度而非深度

让我开始,看看我们能走多远。哪些方面是最高优先级的?”

任务中途变得太大

如果中途令牌预算变得令人担忧:

“我大约完成了一半,我们正在接近令牌限制。我有两个选项:
1. 完成当前部分并在新对话中继续(推荐 - 保持质量)
2. 加速通过剩余部分,进行更轻的分析

哪种方法对您更好?”

不确定估计

当任务范围不明确时:

“我想确保我们成功完成此任务。范围可能向不同方向发展。您能澄清:
- [关于深度的具体问题]
- [关于广度的具体问题]

这有助于我评估是否应该分块此任务。”

与其他技能的集成

此技能与特定领域技能协同工作:

  • 在重型文档分析之前:检查令牌预算,然后使用docx/pdf/xlsx技能
  • 在全面研究之前:评估范围,然后执行研究过程
  • 在复杂产物之前:规划分块,然后使用pptx/docx/xlsx创建技能

将此技能视为在开始令牌密集型任务之前的“预检查”。

实践示例

示例1:多文档分析

用户查询: “分析所有这些上传的合同,告诉我常见条款和差异” [用户已上传12个PDF合同]

响应: “我将帮助您分析这12个合同。考虑到数量,我建议我们分批处理以确保彻底分析:

  1. 合同1-4:提取关键条款、义务和独特条款
  2. 合同5-8:相同分析
  3. 合同9-12:相同分析
  4. 综合:所有合同中的常见条款 + 关键差异

这确保我能给每个合同适当关注。我应该从合同1-4开始吗?”

示例2:全面研究报告

用户查询: “研究AI芯片市场,并创建一个详细报告,涵盖市场规模、关键玩家、技术趋势和5年预测”

响应: “我将创建一个全面的AI芯片市场报告。此研究和报告创建将很庞大,所以我建议:

  1. 市场概述:规模、增长、细分(研究 + 草案)
  2. 竞争格局:关键玩家、市场份额、策略(研究 + 草案)
  3. 技术趋势:当前发展、新兴技术(研究 + 草案)
  4. 未来展望:5年预测、影响(研究 + 草案)
  5. 最终报告组装:执行摘要、优化、格式化

每个部分获得彻底研究和质量写作。我应该从市场概述开始吗?”

示例3:简单任务(无分块)

用户查询: “总结这个10页PDF,给我关键要点”

响应: [无触发 - 正常进行,不调用此技能] “我将阅读PDF并为您提取关键点。”

理由:单文档摘要在正常令牌预算内。

技能维护

此技能应在以下情况更新:

  • 令牌预算限制变化
  • 出现令牌密集型任务的新模式
  • 分块策略在实践中证明无效
  • 用户反馈表明沟通可以更清晰