AI工程师 ai-engineer

AI工程师是专注于构建和部署人工智能系统的专家,擅长将大语言模型、RAG架构和智能体技术集成到生产应用中。核心能力包括LLM集成、检索增强生成系统设计、向量数据库应用、提示工程优化和AI代理开发。关键词:人工智能系统开发,LLM集成,RAG架构,向量数据库,提示工程,AI智能体,生产部署,语义搜索,嵌入策略。

AI应用 0 次安装 0 次浏览 更新于 2/23/2026

name: ai-engineer description: 构建全面AI系统的专家,能够将大语言模型、RAG架构和自主智能体集成到生产应用中。适用于构建AI驱动功能、实现LLM集成、设计RAG管道或部署AI系统时使用。

AI工程师

目的

提供端到端AI系统开发的专业知识,涵盖从LLM集成到生产部署的全过程。包括RAG架构、嵌入策略、向量数据库、提示工程和AI应用模式。

何时使用

  • 构建LLM驱动的应用程序或功能
  • 实现RAG(检索增强生成)系统
  • 集成AI API(OpenAI、Anthropic等)
  • 设计嵌入和向量搜索管道
  • 构建聊天机器人或对话式AI
  • 实现具备工具使用能力的AI智能体
  • 优化AI系统延迟和成本

快速开始

在以下情况调用此技能:

  • 构建LLM驱动的应用程序或功能
  • 使用向量数据库实现RAG系统
  • 将AI API集成到应用程序中
  • 设计嵌入和检索管道
  • 构建对话式AI或智能体

不要在以下情况调用:

  • 从零开始训练自定义ML模型(使用ml-engineer)
  • 将ML模型部署到生产基础设施(使用mlops-engineer)
  • 管理多智能体协调(使用agent-organizer)
  • 优化LLM服务基础设施(使用llm-architect)

决策框架

AI功能类型:
├── 简单问答 → 直接调用LLM API
├── 基于知识的回答 → RAG管道
├── 多步推理 → 思维链或智能体
├── 需要外部操作 → 工具使用智能体
├── 实时数据 → 流式处理 + 函数调用
└── 复杂工作流 → 多智能体编排

核心工作流

1. RAG管道实现

  1. 使用适当策略分块文档
  2. 使用合适模型生成嵌入向量
  3. 将嵌入向量与元数据存储到向量数据库
  4. 实现带重排的语义搜索
  5. 使用检索到的上下文构建提示
  6. 添加评估和监控

2. LLM集成

  1. 根据用例选择合适的模型
  2. 设计带版本控制的提示模板
  3. 实现结构化输出解析
  4. 添加重试逻辑和回退机制
  5. 监控令牌使用和成本
  6. 在适当情况下缓存响应

3. AI智能体开发

  1. 定义智能体能力和工具
  2. 实现带验证的工具接口
  3. 设计带终止条件的智能体循环
  4. 添加护栏和安全检查
  5. 实现日志记录和追踪
  6. 测试边界情况和故障模式

最佳实践

  • 将提示与应用程序代码一起进行版本控制
  • 使用结构化输出(JSON模式)提高可靠性
  • 为常见查询实现语义缓存
  • 对关键决策添加人工干预环节
  • 监控幻觉率和检索质量
  • 设计AI故障时的优雅降级方案

反模式

反模式 问题 正确方法
提示写在代码中 难以迭代和测试 使用带版本控制的提示模板
没有评估 生产环境质量未知 实现评估管道
同步LLM调用 用户体验缓慢 使用流式响应
无限制上下文 令牌限制和成本问题 实现上下文窗口管理
没有回退机制 API错误时系统崩溃 添加重试逻辑和替代方案