提示词压缩技能 prompt-compression

提示词压缩技能是一种用于优化大语言模型使用成本的技术,通过令牌高效压缩、上下文修剪和选择性提取等方法,在保持提示质量的同时减少令牌消耗。关键技术包括LLMLingua压缩、摘要压缩和令牌修剪,适用于成本优化和智能体性能提升场景。关键词:提示词压缩,令牌优化,LLM成本控制,上下文修剪,智能体优化,大语言模型效率

RAG应用 0 次安装 0 次浏览 更新于 2/23/2026

名称: 提示词压缩 描述: 用于成本优化的令牌高效提示词压缩技术 允许使用的工具:

  • 读取
  • 写入
  • 编辑
  • Bash
  • Glob
  • Grep

提示词压缩技能

能力

  • 实现令牌高效的提示词压缩
  • 设计上下文修剪策略
  • 配置选择性上下文包含
  • 实现LLMLingua风格压缩
  • 设计基于摘要的压缩
  • 创建压缩质量指标

目标流程

  • 大语言模型成本优化
  • 智能体性能优化

实现细节

压缩技术

  1. LLMLingua: 令牌级压缩
  2. 摘要压缩: 基于大语言模型的摘要
  3. 选择性上下文: 相关部分提取
  4. 令牌修剪: 移除低重要性令牌
  5. 文档过滤: 检索前过滤

配置选项

  • 压缩率目标
  • 质量阈值设置
  • 令牌预算约束
  • 压缩模型选择
  • 评估指标

最佳实践

  • 监控质量与压缩的权衡
  • 使用代表性提示词测试
  • 设置适当的压缩比率
  • 验证压缩后提示词质量
  • 跟踪成本节省

依赖项

  • llmlingua (可选)
  • tiktoken
  • transformers