name: prompt-engineering-patterns description: 掌握高级提示工程技术，以最大化生产环境中大型语言模型（LLM）的性能、可靠性和可控性。在优化提示、改进LLM输出或设计生产提示模板时使用。

提示工程模式

掌握高级提示工程技术，以最大化LLM性能、可靠性和可控性。

何时使用此技能

为生产LLM应用程序设计复杂提示
优化提示性能和一致性
实施结构化推理模式（链式思考、树式思考）
构建具有动态示例选择的少样本学习系统
创建具有变量插值的可重用提示模板
调试和优化产生不一致输出的提示
为专业AI助手实施系统提示

核心能力

1. 少样本学习

示例选择策略（语义相似性、多样性抽样）
平衡示例数量与上下文窗口限制
使用输入-输出对构建有效演示
从知识库动态检索示例
通过战略示例选择处理边缘情况

2. 链式思考提示

逐步推理引导
零样本CoT，使用“让我们一步步思考”
带有推理轨迹的少样本CoT
自一致性技术（采样多个推理路径）
验证和确认步骤

3. 提示优化

迭代细化工作流
A/B测试提示变体
测量提示性能指标（准确性、一致性、延迟）
在保持质量的同时减少令牌使用
处理边缘情况和失败模式

4. 模板系统

变量插值和格式化
条件提示部分
多轮对话模板
基于角色的提示组合
模块化提示组件

5. 系统提示设计

设置模型行为和约束
定义输出格式和结构
建立角色和专业知识
安全指南和内容政策
上下文设置和背景信息

快速入门

from prompt_optimizer import PromptTemplate, FewShotSelector

# 定义结构化提示模板
template = PromptTemplate(
    system="您是一位专家SQL开发人员。生成高效、安全的SQL查询。",
    instruction="将以下自然语言查询转换为SQL：
{query}",
    few_shot_examples=True,
    output_format="带有解释性注释的SQL代码块"
)

# 配置少样本学习
selector = FewShotSelector(
    examples_db="sql_examples.jsonl",
    selection_strategy="semantic_similarity",
    max_examples=3
)

# 生成优化提示
prompt = template.render(
    query="查找过去30天内注册的所有用户",
    examples=selector.select(query="用户注册日期过滤")
)

关键模式

渐进式披露

从简单提示开始，仅在需要时添加复杂性：

级别1：直接指令
- “总结这篇文章”
级别2：添加约束
- “用3个要点总结这篇文章，重点关注关键发现”
级别3：添加推理
- “阅读这篇文章，识别主要发现，然后用3个要点总结”
级别4：添加示例
- 包含2-3个带有输入-输出对的示例总结

指令层次结构

[系统上下文] → [任务指令] → [示例] → [输入数据] → [输出格式]

错误恢复

构建能够优雅处理失败的提示：

包含后备指令
请求置信度分数
不确定时询问替代解释
指定如何指示缺失信息

最佳实践

具体明确：模糊提示产生不一致结果
展示而非告知：示例比描述更有效
广泛测试：在多样、代表性输入上评估
快速迭代：小变化可能产生大影响
监控性能：跟踪生产环境中的指标
版本控制：将提示视为代码，进行适当版本控制
记录意图：解释提示为何如此结构化

常见陷阱

过度工程：在尝试简单提示之前就开始复杂提示
示例污染：使用不匹配目标任务的示例
上下文溢出：因过多示例超出令牌限制
模糊指令：留下多种解释空间
忽略边缘情况：不在异常或边界输入上测试

集成模式

与RAG系统集成

# 将检索到的上下文与提示工程结合
prompt = f"""给定以下上下文：
{retrieved_context}

{few_shot_examples}

问题：{user_question}

仅基于以上上下文提供详细答案。如果上下文信息不足，明确说明缺失内容。"""

与验证集成

# 添加自验证步骤
prompt = f"""{main_task_prompt}

生成响应后，验证其是否符合以下标准：
1. 直接回答问题
2. 仅使用提供上下文中的信息
3. 引用具体来源
4. 承认任何不确定性

如果验证失败，修订您的响应。"""

性能优化

令牌效率

移除冗余词语和短语
首次定义后一致使用缩写
合并类似指令
将稳定内容移至系统提示

延迟减少

在不牺牲质量的情况下最小化提示长度
对长格式输出使用流式处理
缓存常见提示前缀
尽可能批处理类似请求

资源

references/few-shot-learning.md：深入探讨示例选择和构建
references/chain-of-thought.md：高级推理引导技术
references/prompt-optimization.md：系统化细化工作流
references/prompt-templates.md：可重用模板模式
references/system-prompts.md：系统级提示设计
assets/prompt-template-library.md：经过实战检验的提示模板
assets/few-shot-examples.json：精选示例数据集
scripts/optimize-prompt.py：自动化提示优化工具

成功指标

跟踪提示的以下KPI：

准确性：输出的正确性
一致性：类似输入下的可重现性
延迟：响应时间（P50、P95、P99）
令牌使用：每个请求的平均令牌数
成功率：有效输出的百分比
用户满意度：评分和反馈

后续步骤

查看提示模板库以了解常见模式
针对您的具体用例实验少样本学习
实施提示版本控制和A/B测试
设置自动化评估管道
记录您的提示工程决策和学习