name: constitutional-ai-prompts description: 用于对齐LLM行为的宪法式AI与安全护栏提示词 allowed-tools:
- Read
- Write
- Edit
- Bash
- Glob
- Grep
宪法式AI提示词技能
能力
- 设计宪法式AI原则
- 实施自我批判与修订提示词
- 创建无害性指导方针
- 设计针对不安全请求的拒绝模式
- 实施红队测试提示词
- 创建具备伦理意识的响应框架
目标流程
- 系统提示词护栏
- 内容审核安全
实施细节
宪法模式
- 批判-修订:自我评估并改进响应
- 原则遵循:遵循定义的伦理原则
- 无害性聚焦:优先考虑安全响应
- 有益性平衡:平衡有益性与安全性
- 透明度:承认局限性
配置选项
- 宪法原则列表
- 批判提示词
- 修订指南
- 拒绝模板
- 升级触发条件
最佳实践
- 定义清晰的宪法原则
- 平衡有益性与安全性
- 使用对抗性输入进行测试
- 记录拒绝模式
- 定期审查原则
依赖项
- langchain-core