宪法式AI提示词技能Skill constitutional-ai-prompts

这是一个用于设计和实施大语言模型（LLM）安全与伦理对齐的提示词工程技能。它通过定义一套“宪法”原则，引导AI进行自我批判、修订，并生成无害、合规的响应。核心功能包括：构建AI安全护栏、内容审核、伦理框架设计、红队测试以及拒绝不安全请求的模式。关键词：AI安全，伦理对齐，提示词工程，大语言模型，内容审核，宪法式AI，安全护栏，LLM对齐，无害AI，自我批判。

大模型微调 2 次安装 115 次浏览更新于 2/23/2026

name: constitutional-ai-prompts description: 用于对齐LLM行为的宪法式AI与安全护栏提示词 allowed-tools:

Read
Write
Edit
Bash
Glob
Grep

宪法式AI提示词技能

能力

设计宪法式AI原则
实施自我批判与修订提示词
创建无害性指导方针
设计针对不安全请求的拒绝模式
实施红队测试提示词
创建具备伦理意识的响应框架

目标流程

系统提示词护栏
内容审核安全

实施细节

宪法模式

批判-修订：自我评估并改进响应
原则遵循：遵循定义的伦理原则
无害性聚焦：优先考虑安全响应
有益性平衡：平衡有益性与安全性
透明度：承认局限性

配置选项

宪法原则列表
批判提示词
修订指南
拒绝模板
升级触发条件

最佳实践

定义清晰的宪法原则
平衡有益性与安全性
使用对抗性输入进行测试
记录拒绝模式
定期审查原则

依赖项

langchain-core