上下文工程Skill context-engineering

上下文工程是一种关键技术,专注于优化人工智能智能体系统中的上下文管理,以提高推理效率并降低计算成本。它涉及上下文基础、优化技术、压缩策略、记忆系统和多智能体协调,适用于AI应用开发、大模型微调和RAG应用。关键词:上下文工程、AI智能体、令牌优化、LLM、多智能体系统、记忆管理。

AI智能体 0 次安装 2 次浏览 更新于 3/17/2026

名称: 上下文工程 描述: >- 精通用于AI智能体系统的上下文工程。在以下情况下使用:设计智能体架构、 调试上下文故障、优化令牌使用、实现记忆系统、 构建多智能体协调、评估智能体性能或开发 基于LLM的管道。涵盖上下文基础、退化模式、优化 技术(压缩、掩码、缓存)、压缩策略、记忆架构、 多智能体模式、LLM作为评估者、工具设计和项目开发。 版本: 1.0.0

上下文工程

上下文工程为LLM任务策划最小的高信号令牌集。目标:在最小化令牌使用的同时最大化推理质量。

何时激活

  • 设计/调试智能体系统
  • 上下文限制约束性能
  • 优化成本/延迟
  • 构建多智能体协调
  • 实现记忆系统
  • 评估智能体性能
  • 开发基于LLM的管道

核心原则

  1. 上下文质量 > 数量 - 高信号令牌胜于详尽内容
  2. 注意力是有限的 - U形曲线偏好开始/结束位置
  3. 渐进式披露 - 及时加载信息
  4. 隔离防止退化 - 将工作分区到子智能体
  5. 优化前测量 - 了解基线

快速参考

主题 何时使用 参考
基础 理解上下文解剖、注意力机制 context-fundamentals.md
退化 调试故障、中间丢失、中毒 context-degradation.md
优化 压缩、掩码、缓存、分区 context-optimization.md
压缩 长会话、摘要策略 context-compression.md
记忆 跨会话持久性、知识图谱 memory-systems.md
多智能体 协调模式、上下文隔离 multi-agent-patterns.md
评估 测试智能体、LLM作为评估者、指标 evaluation.md
工具设计 工具整合、描述工程 tool-design.md
管道 项目开发、批处理 project-development.md

关键指标

  • 令牌利用率:警告在70%,触发优化在80%
  • 令牌方差:解释80%的智能体性能方差
  • 多智能体成本:约15倍单智能体基线
  • 压缩目标:50-70%减少,<5%质量损失
  • 缓存命中目标:70%+用于稳定工作负载

四桶策略

  1. :将上下文保存到外部(草稿、文件)
  2. 选择:仅拉取相关上下文(检索、过滤)
  3. 压缩:减少令牌同时保留信息(摘要)
  4. 隔离:跨子智能体分割(分区)

反模式

  • 详尽上下文优于策划上下文
  • 关键信息在中间位置
  • 无压缩触发器在限制前
  • 单智能体用于可并行任务
  • 无清晰描述的工具

指南

  1. 将关键信息放在上下文的开始/结束
  2. 在70-80%利用率时实现压缩
  3. 使用子智能体进行上下文隔离,而非角色扮演
  4. 用4问题框架设计工具(什么、何时、输入、返回)
  5. 优化令牌每任务,而非令牌每请求
  6. 用基于探针的评估验证
  7. 监控生产中的KV缓存命中率
  8. 开始最小化,仅在被证明必要时增加复杂性

脚本