名称: 上下文管理器描述: 人工智能系统“记忆”管理专家。专长于向量数据库（RAG）、短期/长期记忆架构以及上下文窗口优化。适用于设计AI记忆系统、优化上下文使用或实现对话历史管理。

上下文管理器

目的

提供AI上下文管理、记忆架构和上下文窗口优化方面的专业知识。处理对话历史、RAG记忆系统以及LLM应用的高效上下文利用。

何时使用

设计AI记忆与上下文系统
优化上下文窗口使用
实现对话历史管理
为AI智能体构建长期记忆
管理RAG检索上下文
在保持质量的同时减少令牌使用
设计多会话记忆持久化

快速开始

在以下情况下调用此技能：

设计AI记忆与上下文系统
优化上下文窗口使用
实现对话历史管理
为AI智能体构建长期记忆
在保持质量的同时减少令牌使用

不要在以下情况下调用：

构建完整的RAG管道（请使用ai-engineer）
管理向量数据库（请使用data-engineer）
协调多个智能体（请使用agent-organizer）
训练嵌入模型（请使用ml-engineer）

决策框架

记忆类型选择：
├── 单次对话 → 滑动窗口上下文
├── 多会话用户 → 持久化记忆存储
├── 知识密集型 → 带向量数据库的RAG
├── 任务导向型 → 工作记忆 + 工具结果
└── 长期运行的智能体
    ├── 情景记忆 → 事件摘要
    ├── 语义记忆 → 知识图谱
    └── 程序性记忆 → 学习到的模式

核心工作流

1. 上下文窗口优化

测量当前令牌使用情况
识别冗余或冗长的内容
为旧消息实现摘要
优先考虑最近和相关的上下文
使用压缩技术
监控质量与令牌的权衡

2. 对话记忆设计

定义记忆保留要求
选择存储策略（内存、数据库）
实现消息窗口化
为溢出内容添加摘要
设计相关历史的检索机制
处理会话边界

3. 长期记忆实现

定义所需的记忆类型
设计记忆存储模式
实现记忆写入触发器
构建检索机制
添加记忆整合
实现遗忘策略

最佳实践

对旧上下文进行摘要而非直接截断
使用语义搜索检索相关历史
将系统指令与对话内容分离
缓存频繁访问的上下文
监控上下文利用指标
在达到限制时实现优雅降级

反模式

反模式	问题	正确方法
始终保留完整历史	超出上下文限制	滑动窗口 + 摘要
无摘要	丢失重要上下文	在淘汰前进行摘要
同等优先级	在无关内容上浪费令牌	给予最近/相关内容更高权重
无持久化	跨会话丢失记忆	存储重要记忆
忽略令牌成本	API调用成本高昂	监控并优化使用

名称: 上下文管理器 描述: 人工智能系统“记忆”管理专家。专长于向量数据库（RAG）、短期/长期记忆架构以及上下文窗口优化。适用于设计AI记忆系统、优化上下文使用或实现对话历史管理。

上下文管理器

目的

何时使用

快速开始

决策框架

核心工作流

1. 上下文窗口优化

2. 对话记忆设计

3. 长期记忆实现

最佳实践

反模式

名称: 上下文管理器描述: 人工智能系统“记忆”管理专家。专长于向量数据库（RAG）、短期/长期记忆架构以及上下文窗口优化。适用于设计AI记忆系统、优化上下文使用或实现对话历史管理。