宪法式AI提示词技能Skill constitutional-ai-prompts

这是一个用于设计和实施大语言模型(LLM)安全与伦理对齐的提示词工程技能。它通过定义一套“宪法”原则,引导AI进行自我批判、修订,并生成无害、合规的响应。核心功能包括:构建AI安全护栏、内容审核、伦理框架设计、红队测试以及拒绝不安全请求的模式。关键词:AI安全,伦理对齐,提示词工程,大语言模型,内容审核,宪法式AI,安全护栏,LLM对齐,无害AI,自我批判。

大模型微调 2 次安装 47 次浏览 更新于 2/23/2026

name: constitutional-ai-prompts description: 用于对齐LLM行为的宪法式AI与安全护栏提示词 allowed-tools:

  • Read
  • Write
  • Edit
  • Bash
  • Glob
  • Grep

宪法式AI提示词技能

能力

  • 设计宪法式AI原则
  • 实施自我批判与修订提示词
  • 创建无害性指导方针
  • 设计针对不安全请求的拒绝模式
  • 实施红队测试提示词
  • 创建具备伦理意识的响应框架

目标流程

  • 系统提示词护栏
  • 内容审核安全

实施细节

宪法模式

  1. 批判-修订:自我评估并改进响应
  2. 原则遵循:遵循定义的伦理原则
  3. 无害性聚焦:优先考虑安全响应
  4. 有益性平衡:平衡有益性与安全性
  5. 透明度:承认局限性

配置选项

  • 宪法原则列表
  • 批判提示词
  • 修订指南
  • 拒绝模板
  • 升级触发条件

最佳实践

  • 定义清晰的宪法原则
  • 平衡有益性与安全性
  • 使用对抗性输入进行测试
  • 记录拒绝模式
  • 定期审查原则

依赖项

  • langchain-core