名称: 上下文管理器 描述: 人工智能系统“记忆”管理专家。专长于向量数据库(RAG)、短期/长期记忆架构以及上下文窗口优化。适用于设计AI记忆系统、优化上下文使用或实现对话历史管理。
上下文管理器
目的
提供AI上下文管理、记忆架构和上下文窗口优化方面的专业知识。处理对话历史、RAG记忆系统以及LLM应用的高效上下文利用。
何时使用
- 设计AI记忆与上下文系统
- 优化上下文窗口使用
- 实现对话历史管理
- 为AI智能体构建长期记忆
- 管理RAG检索上下文
- 在保持质量的同时减少令牌使用
- 设计多会话记忆持久化
快速开始
在以下情况下调用此技能:
- 设计AI记忆与上下文系统
- 优化上下文窗口使用
- 实现对话历史管理
- 为AI智能体构建长期记忆
- 在保持质量的同时减少令牌使用
不要在以下情况下调用:
- 构建完整的RAG管道(请使用ai-engineer)
- 管理向量数据库(请使用data-engineer)
- 协调多个智能体(请使用agent-organizer)
- 训练嵌入模型(请使用ml-engineer)
决策框架
记忆类型选择:
├── 单次对话 → 滑动窗口上下文
├── 多会话用户 → 持久化记忆存储
├── 知识密集型 → 带向量数据库的RAG
├── 任务导向型 → 工作记忆 + 工具结果
└── 长期运行的智能体
├── 情景记忆 → 事件摘要
├── 语义记忆 → 知识图谱
└── 程序性记忆 → 学习到的模式
核心工作流
1. 上下文窗口优化
- 测量当前令牌使用情况
- 识别冗余或冗长的内容
- 为旧消息实现摘要
- 优先考虑最近和相关的上下文
- 使用压缩技术
- 监控质量与令牌的权衡
2. 对话记忆设计
- 定义记忆保留要求
- 选择存储策略(内存、数据库)
- 实现消息窗口化
- 为溢出内容添加摘要
- 设计相关历史的检索机制
- 处理会话边界
3. 长期记忆实现
- 定义所需的记忆类型
- 设计记忆存储模式
- 实现记忆写入触发器
- 构建检索机制
- 添加记忆整合
- 实现遗忘策略
最佳实践
- 对旧上下文进行摘要而非直接截断
- 使用语义搜索检索相关历史
- 将系统指令与对话内容分离
- 缓存频繁访问的上下文
- 监控上下文利用指标
- 在达到限制时实现优雅降级
反模式
| 反模式 | 问题 | 正确方法 |
|---|---|---|
| 始终保留完整历史 | 超出上下文限制 | 滑动窗口 + 摘要 |
| 无摘要 | 丢失重要上下文 | 在淘汰前进行摘要 |
| 同等优先级 | 在无关内容上浪费令牌 | 给予最近/相关内容更高权重 |
| 无持久化 | 跨会话丢失记忆 | 存储重要记忆 |
| 忽略令牌成本 | API调用成本高昂 | 监控并优化使用 |