name: 令牌预算顾问 description: 主动的令牌预算评估和任务分块策略。当查询涉及多个大文件上传、请求进行全面的多文档分析、复杂多步骤工作流(需要大量研究,超过10个工具调用)、类似“完整分析”、“全面审计”、“彻底审查”、“深度探讨”的短语,或结合广泛研究和大型输出产物的任务时,使用此技能。此技能有助于在开始工作前早期评估令牌消耗风险并推荐分块策略。
令牌预算顾问
此技能提供对令牌密集型任务的早期评估,并推荐分块策略以确保在上下文窗口限制内成功完成。
何时使用此技能
在开始工作前触发此技能,当您检测到:
- 多个文件上传(3+个文档)结合分析请求
- 请求“全面的”、“完整的”、“彻底的”或“完整的”分析
- 多文档比较分析
- 复杂工作流需要10+个工具调用(广泛网络研究 + 综合)
- 任务结合大量研究和大型产物(报告、演示文稿)
- 查询跨越多个维度(时间 + 类别 + 定量)
- 请求“分析一切”或“创建所有方面的完整报告”
核心功能
此技能有两个目的:
- 早期预警系统:评估任务是否可能超出令牌限制
- 战略规划:提供具体、可操作的分块推荐
令牌估计框架
快速评估启发式方法
使用这些粗略指南估计令牌消耗:
输入成本:
- 上传文档:每个约1,000-5,000个令牌(取决于长度)
- 网络搜索结果:约500-1,500个令牌
- 网络抓取(完整文章):约2,000-8,000个令牌
- Google Drive文档:约1,000-10,000个令牌(差异较大)
输出成本:
- 简单响应:500-2,000个令牌
- 详细分析:2,000-5,000个令牌
- 长篇报告:5,000-15,000个令牌
- 复杂产物(演示文稿、文档):5,000-20,000个令牌
工具调用开销:
- 每个工具调用包括查询、结果和推理:平均约1,000-3,000个令牌
警告阈值:
- 警告区(60-80%的预算):任务可完成但紧张;考虑效率
- 危险区(80-95%的预算):高风险;强烈推荐分块
- 超出预算(95%+的预算):任务需要分块;无法在一个对话中完成
任务复杂性乘数
应用这些心理调整:
- 需要综合:在输出估计上增加30-50%(比较、整合多个来源)
- 迭代优化:增加20-30%(当任务涉及审查和改进时)
- 多种格式:每增加一种输出类型增加20%(报告 + 演示文稿 + 电子表格)
分块策略框架
当任务超出令牌预算时,推荐具体分块方法。基于任务结构选择策略:
1. 顺序处理
最适合: 时间序列数据、按时间顺序分析、有序工作流
模式:
“这个12个月的数据分析将超出我们的令牌预算。我建议我们按季度拆分:
- 第1部分:Q1-Q2分析(1月-6月)
- 第2部分:Q3-Q4分析(7月-12月)
- 第3部分:综合和建议
我应该从第1部分开始吗?”
何时使用:
- 历史数据分析
- 期间比较
- 多阶段项目
2. 维度分解
最适合: 多面分析、同一主题的不同方面
模式:
“一个完整的市场分析涵盖财务、竞争、监管和技术因素将给我们的令牌预算带来压力。让我们分解为:
- 会话1:财务表现和市场规模
- 会话2:竞争格局和定位
- 会话3:监管环境和合规
- 会话4:技术趋势和综合
我们应该先处理哪个维度?”
何时使用:
- 多利益相关者分析
- 同一主题的不同分析视角
- 复杂商业案例
3. 深度递进
最适合: 需要大纲 → 草案 → 优化的任务
模式:
“创建一个包含详细研究的全面50页演示文稿将超出我们的预算。我建议:
- 第1轮:构建结构和大纲(30分钟)
- 第2轮:为幻灯片1-25开发内容(45分钟)
- 第3轮:为幻灯片26-50开发内容(45分钟)
- 第4轮:优化审查(30分钟)
我们从大纲开始吗?”
何时使用:
- 大型文档或演示文稿
- 当质量优化重要时
- 受益于迭代的创意项目
4. 子集采样
最适合: 大型文档集,其中代表性采样有效
模式:
“分析所有15个合同将超出我们的预算。我建议:
- 第1部分:分析5个代表性合同(不同类型/日期)
- 第2部分:基于发现模式,用5个更多确认
- 第3部分:快速扫描剩余5个以查找例外,然后综合
这样在管理令牌的同时给出全面覆盖。听起来好吗?”
何时使用:
- 大规模文档审查
- 跨多个文件的模式识别
- 基于风险的采样方法
5. 并行轨道处理
最适合: 独立的工作流,稍后可以合并
模式:
“将我们的产品与5个竞争对手在功能、定价和定位上进行比较对一个会话来说太大。让我们按竞争对手拆分:
- 会话1:竞争对手A和B完整分析
- 会话2:竞争对手C和D完整分析
- 会话3:竞争对手E + 综合矩阵
每个会话保持专注和可管理。”
何时使用:
- 比较分析
- 多个独立主题
- 当部分不需要彼此上下文时
沟通指南
消息框架
推荐分块时,使用此结构:
- 清楚地确认请求
- 提供令牌预算评估(简短,1句话)
- 推荐具体分块方法(编号列表,2-4部分)
- 请求确认继续(让用户保持控制)
示例:
我将帮助您分析这8份财务报告并创建一个全面的演示文稿。
考虑到所需的研究和产物创建,此任务将超出我们的令牌预算。
我建议拆分:
1. 报告1-4:分析和关键发现
2. 报告5-8:分析和关键发现
3. 将所有发现综合成演示文稿
我应该从报告1-4开始吗?
不应该做什么
❌ 不要过度解释令牌预算或技术性地讨论上下文窗口 ❌ 不要过度道歉或听起来限制性 ❌ 不要提供模糊建议如“也许以某种方式拆分” ❌ 不要开始工作然后中途停止说“我们已经用完了令牌”
✅ 要实事求是和解决方案导向 ✅ 要提供具体、可操作的分解 ✅ 要保持向任务完成的动力 ✅ 要将分块框架为质量改进(彻底性)而非限制
处理边缘情况
用户坚持单次会话
如果用户反对分块:
“我理解您希望一次性完成。我会尽力完成,但我可能需要:
- 优先处理最关键的元素
- 提供简化版本
- 在某些领域关注广度而非深度
让我开始,看看我们能走多远。哪些方面是最高优先级的?”
任务中途变得太大
如果中途令牌预算变得令人担忧:
“我大约完成了一半,我们正在接近令牌限制。我有两个选项:
1. 完成当前部分并在新对话中继续(推荐 - 保持质量)
2. 加速通过剩余部分,进行更轻的分析
哪种方法对您更好?”
不确定估计
当任务范围不明确时:
“我想确保我们成功完成此任务。范围可能向不同方向发展。您能澄清:
- [关于深度的具体问题]
- [关于广度的具体问题]
这有助于我评估是否应该分块此任务。”
与其他技能的集成
此技能与特定领域技能协同工作:
- 在重型文档分析之前:检查令牌预算,然后使用docx/pdf/xlsx技能
- 在全面研究之前:评估范围,然后执行研究过程
- 在复杂产物之前:规划分块,然后使用pptx/docx/xlsx创建技能
将此技能视为在开始令牌密集型任务之前的“预检查”。
实践示例
示例1:多文档分析
用户查询: “分析所有这些上传的合同,告诉我常见条款和差异” [用户已上传12个PDF合同]
响应: “我将帮助您分析这12个合同。考虑到数量,我建议我们分批处理以确保彻底分析:
- 合同1-4:提取关键条款、义务和独特条款
- 合同5-8:相同分析
- 合同9-12:相同分析
- 综合:所有合同中的常见条款 + 关键差异
这确保我能给每个合同适当关注。我应该从合同1-4开始吗?”
示例2:全面研究报告
用户查询: “研究AI芯片市场,并创建一个详细报告,涵盖市场规模、关键玩家、技术趋势和5年预测”
响应: “我将创建一个全面的AI芯片市场报告。此研究和报告创建将很庞大,所以我建议:
- 市场概述:规模、增长、细分(研究 + 草案)
- 竞争格局:关键玩家、市场份额、策略(研究 + 草案)
- 技术趋势:当前发展、新兴技术(研究 + 草案)
- 未来展望:5年预测、影响(研究 + 草案)
- 最终报告组装:执行摘要、优化、格式化
每个部分获得彻底研究和质量写作。我应该从市场概述开始吗?”
示例3:简单任务(无分块)
用户查询: “总结这个10页PDF,给我关键要点”
响应: [无触发 - 正常进行,不调用此技能] “我将阅读PDF并为您提取关键点。”
理由:单文档摘要在正常令牌预算内。
技能维护
此技能应在以下情况更新:
- 令牌预算限制变化
- 出现令牌密集型任务的新模式
- 分块策略在实践中证明无效
- 用户反馈表明沟通可以更清晰