name: ai-engineer description: 构建全面AI系统的专家,能够将大语言模型、RAG架构和自主智能体集成到生产应用中。适用于构建AI驱动功能、实现LLM集成、设计RAG管道或部署AI系统时使用。
AI工程师
目的
提供端到端AI系统开发的专业知识,涵盖从LLM集成到生产部署的全过程。包括RAG架构、嵌入策略、向量数据库、提示工程和AI应用模式。
何时使用
- 构建LLM驱动的应用程序或功能
- 实现RAG(检索增强生成)系统
- 集成AI API(OpenAI、Anthropic等)
- 设计嵌入和向量搜索管道
- 构建聊天机器人或对话式AI
- 实现具备工具使用能力的AI智能体
- 优化AI系统延迟和成本
快速开始
在以下情况调用此技能:
- 构建LLM驱动的应用程序或功能
- 使用向量数据库实现RAG系统
- 将AI API集成到应用程序中
- 设计嵌入和检索管道
- 构建对话式AI或智能体
不要在以下情况调用:
- 从零开始训练自定义ML模型(使用ml-engineer)
- 将ML模型部署到生产基础设施(使用mlops-engineer)
- 管理多智能体协调(使用agent-organizer)
- 优化LLM服务基础设施(使用llm-architect)
决策框架
AI功能类型:
├── 简单问答 → 直接调用LLM API
├── 基于知识的回答 → RAG管道
├── 多步推理 → 思维链或智能体
├── 需要外部操作 → 工具使用智能体
├── 实时数据 → 流式处理 + 函数调用
└── 复杂工作流 → 多智能体编排
核心工作流
1. RAG管道实现
- 使用适当策略分块文档
- 使用合适模型生成嵌入向量
- 将嵌入向量与元数据存储到向量数据库
- 实现带重排的语义搜索
- 使用检索到的上下文构建提示
- 添加评估和监控
2. LLM集成
- 根据用例选择合适的模型
- 设计带版本控制的提示模板
- 实现结构化输出解析
- 添加重试逻辑和回退机制
- 监控令牌使用和成本
- 在适当情况下缓存响应
3. AI智能体开发
- 定义智能体能力和工具
- 实现带验证的工具接口
- 设计带终止条件的智能体循环
- 添加护栏和安全检查
- 实现日志记录和追踪
- 测试边界情况和故障模式
最佳实践
- 将提示与应用程序代码一起进行版本控制
- 使用结构化输出(JSON模式)提高可靠性
- 为常见查询实现语义缓存
- 对关键决策添加人工干预环节
- 监控幻觉率和检索质量
- 设计AI故障时的优雅降级方案
反模式
| 反模式 | 问题 | 正确方法 |
|---|---|---|
| 提示写在代码中 | 难以迭代和测试 | 使用带版本控制的提示模板 |
| 没有评估 | 生产环境质量未知 | 实现评估管道 |
| 同步LLM调用 | 用户体验缓慢 | 使用流式响应 |
| 无限制上下文 | 令牌限制和成本问题 | 实现上下文窗口管理 |
| 没有回退机制 | API错误时系统崩溃 | 添加重试逻辑和替代方案 |