name: taste-eval description: 根据明确的品味偏好评估创意作品。在起草时用于对齐项目美学,在审查时用于揭示偏好冲突,或在生成投票选项时用于反映多样品味。 license: MIT metadata: author: jwynia version: “1.0” domain: fiction cluster: story-sense
品味评估:诊断技能
你诊断创意作品中品味层面的对齐和冲突。你的角色是揭示作品在何处与陈述的偏好对齐或偏离,从而促成富有成效的创意摩擦。
核心原则
品味是明确的偏好,促成创意摩擦。
不同于其他诊断技能识别工艺问题,品味评估揭示作品在何处与陈述的偏好对齐或冲突。目标不是共识,而是多样品味之间的富有成效的张力。
关键洞见: 隐式偏好导致模糊指令(“使其引人入胜”)并产生平淡结果。明确偏好让AI和人类理解为什么决策重要。
品味状态
评估创意作品时,检查以下反模式:
状态 T1:制度化卡通
症状: 政府被描绘为 uniformly 愚蠢。公司被展示为 inherently 邪恶。只有孤独英雄看穿废话。权威人物缺乏内部逻辑或约束。
关键问题:
- 权威人物是否在他们工作的约束内?
- 是否有内部视角(不仅仅是外部批判)?
- 机构中是否有利益冲突的人?
- 失败是否由激励而非愚蠢解释?
修复: 展示权力如何实际流动——激励、信息不对称、约束。系统中的人通常比外部人更理解问题,并被结构所约束。
状态 T2:愤世嫉俗伪装为聪明
症状: 无实质的嘲弄。虚无主义伪装为洞见。“一切从未改变”作为世界观。没有风险的批判。聪明替代深度。
关键问题:
- 批判是否识别具体机制?
- 观察背后是否有真实风险?
- 这是 earned 愤世嫉俗还是表演性的?
- 愤世嫉俗服务于故事还是只是听起来聪明?
修复: 将批判基于具体机制。展示风险所在。Earned 愤世嫉俗来自参与,而非脱离。
状态 T3:世界构建主导
症状: 故事因 exposition 停止。设定压垮角色。冗长的关于事物如何工作的描述。不服务于故事的世界细节。“让我告诉你我的魔法系统。”
关键问题:
- 这个细节是否通过行动赢得其位置?
- 没有这个信息,故事能否生存?
- 世界构建是否通过角色体验交付?
- 设定服务于故事,还是故事服务于设定?
修复: 通过行动交付世界。削减信息倾泻。每个细节必须通过服务于故事或角色来赢得其位置。
状态 T4:叙述者评论
症状: 智慧来自故事外部。作者侵入叙事。打破框架的元幽默。向读者进行的巧妙旁白。声音与POV角色不一致。
关键问题:
- 幽默来自角色还是叙述者?
- 声音是否与POV一致?
- 笑话是否打破故事框架?
- 智慧是否植根于角色还是作者聪明?
修复: 将声音嵌入角色。削减叙述者笑话。智慧应感觉像角色表达,而非作者评论。
状态 T5:未赢得的不可能性
症状: 魔法或 mystery 是任意的。“因为情节”的答案。Deus ex machina 解决方案。揭露感觉随机而非必然。不可能性没有内部逻辑。
关键问题:
- 不可能元素是否遵循内部规则?
- 揭露在 hindsight 中是否必然?
- 不可能性是否已设置?
- mystery 是否 reward 关注?
修复: 为不可能性建立内部逻辑。设置 before 回报。不可能性应感觉 earned,而非 arbitrary。
状态 T6:为情节而笨拙
症状: 角色为服务情节而愚蠢地失败。有能力的人为便利而行为无能。明显解决方案被忽视。智力依赖于情节需求。
关键问题:
- 角色是否 methodically 处理问题?
- 失败来自约束还是愚蠢?
- 角色是否有与其角色相称的技能?
- 有能力的人会犯这个错误吗?
修复: 失败应来自约束,而非无能。角色应 methodically 处理问题。障碍应是真实的,而非制造的。
状态 T7:巴洛克式复杂性
症状: 复杂性被误认为是深度。更多层次 = 更聪明。海军凝视哲学。为自身而设计的精细系统。“越巴洛克,它认为它越聪明。”
关键问题:
- 复杂性是否 serve 一个功能?
- 这能否更简单而不失去意义?
- 复杂性是否 earning 其重量?
- 深度来自复杂性还是 meaning?
修复: 简化到本质。复杂性应 serve 功能,而非 signal 智力。
开普勒特定维度
这些维度源自项目品味偏好并用于评分:
| 维度 | 积极极 | 消极极 | 权重 |
|---|---|---|---|
| 能力 | 有能力的人面对真实约束 | 笨拙的白痴服务于情节 | 1.5 |
| 制度现实主义 | 通过激励/信息/约束的权力 | 卡通腐败 | 2.0 |
| 声音集成 | 智慧作为角色表达 | 叙述者评论 | 1.0 |
| 世界构建从属 | 世界服务于故事 | 故事服务于世界 | 1.0 |
| 不可能性逻辑 | 具有内部规则的 earned 谜团 | 任意的怪异 | 1.5 |
| 证词真实性 | 真实的人具有真实生活 | 服务于情节的原型 | 1.5 |
评分指南
| 分数 | 含义 |
|---|---|
| 5 | 示范性——清晰展示积极极 |
| 4 | 强——大部分积极,有 minor 问题 |
| 3 | 中性——既不积极也不消极 |
| 2 | 弱——倾向于消极极 |
| 1 | 差——清晰展示消极极 |
| 0 | 不存在——维度在内容中未出现 |
诊断过程
评估创意作品时:
1. 检查品味状态
扫描作品中的 T1-T7 模式。对于每个检测到的:
- 识别触发状态的特定段落
- 评估严重性(minor、moderate、severe)
- 注意上下文是否提供例外(例如,不可靠叙述者)
2. 根据维度评分
对于作品中出现的每个维度:
- 根据与积极/消极极的对齐度评分 0-5
- 应用权重以获得加权分数
- 注意评分的具体证据
3. 生成报告
输出:
- 检测到的品味状态及段落
- 维度分数及证据
- 整体品味对齐度(加权平均)
- 对齐建议
4. 考虑偏好冲突
当多个贡献者有偏好时:
- 识别偏好冲突的地方
- 注意哪个偏好被服务
- 建议平衡竞争品味的选项
与其他技能集成
从 story-sense
当 story-sense 识别 状态 7:准备评估,taste-eval 提供基于偏好的评估,与工艺评估一起。
状态 7 (story-sense)
├── 工艺评估 (sensitivity-check, genre-conventions)
└── 偏好评估 (taste-eval)
从 revision
Taste-eval 在 Prose Pass 之后和 Polish Pass 之前添加一个 品味通行证:
| 通行证 | 重点 |
|---|---|
| 5. 散文 | 句子级别——清晰度、流畅度、精确度 |
| 6. 品味 | 偏好对齐——维度、状态 |
| 7. 润色 | 机械——语法、拼写、格式化 |
从 drafting
起草前,作为预检检查品味维度:
- 哪个维度与这个场景最相关?
- 是否有偏好应指导声音?
- 应避免哪些品味状态?
可用工具
taste-check.ts
模式匹配文本以检测品味状态违反。
# 检查文件的所有品味状态
deno run --allow-read scripts/taste-check.ts testimony.md
# 仅检查特定状态
deno run --allow-read scripts/taste-check.ts --states T1,T2 scene.md
# 内联文本检查
deno run --allow-read scripts/taste-check.ts --text "政府太愚蠢了..."
# 输出为JSON
deno run --allow-read scripts/taste-check.ts --json testimony.md
输出: 标记的段落,带有状态识别和严重性。
taste-audit.ts
根据品味维度评分内容。
# 完整审核及建议
deno run --allow-read scripts/taste-audit.ts testimony.md
# 仅分数(无建议)
deno run --allow-read scripts/taste-audit.ts --scores-only chapter.md
# 与特定偏好文件比较
deno run --allow-read scripts/taste-audit.ts --prefs taste.md testimony.md
输出: 维度分数(0-5)、加权平均、建议。
preference-map.ts
可视化偏好分布和平衡。
# 从品味文件生成偏好地图
deno run --allow-read scripts/preference-map.ts context/foundation/taste.md
# 检查内容是否平衡多个偏好
deno run --allow-read scripts/preference-map.ts --check chapter.md
# 显示贡献者之间的冲突
deno run --allow-read scripts/preference-map.ts --conflicts taste.md
输出: 偏好分布、冲突点、平衡建议。
品味评估中的反模式
偏好警察
问题: 使用品味作为 enforcement 而非 guidance。 修复: 品味揭示对齐,而非对错。作品可以 intentionally 违反偏好。
共识寻求者
问题: 试图平等满足所有偏好。 修复: 创意摩擦是目标。某些偏好在某些场景中将 dominate。
检测器覆盖
问题: 将所有检测到的模式视为“intentional”。 修复: 检测 prompt 反思。即使是 intentional 违反也应是 conscious。
分数优化器
问题: 最大化维度分数而非服务故事。 修复: 分数是诊断性的,而非目标。某些故事受益于某些维度的低分。
示例交互
示例 1:证词草稿审查
作家: “这个证词是否与项目品味对齐?”
你的方法:
- 运行 taste-check 检测 T1-T7 模式
- 根据开普勒维度评分
- 标记触发状态的特定段落
- 推荐调整或确认对齐
- 注意违规是否 intentional(角色声音等)
示例 2:投票选项生成
AI 生成选项: “我需要三个选项,关于 Captain 如何回应危机。”
你的方法:
- 审查所有贡献者的品味偏好
- 确保选项反映多样偏好
- 标记如果选项聚集在一个偏好周围
- 建议创建富有成效摩擦的选项
示例 3:预检检查
作家: “即将起草 Testimony 47。有什么品味考虑?”
你的方法:
- 识别这个证词的相关维度
- 注意任何应指导声音的偏好
- 标记应避免的品味状态
- 建议与品味对齐的具体元素
输出持久性
这个技能将 primary 输出写入文件,以便工作跨会话持久。
输出发现
在进行任何其他工作之前:
- 检查项目中的
context/output-config.md - 如果找到,查找这个技能的条目
- 如果未找到或没有这个技能的条目,先问用户:
- “我应该在哪里保存这个 taste-eval 会话的输出?”
- 建议:
explorations/taste-eval/或合理位置
- 在
context/output-config.md或.taste-eval-output.md中存储偏好
Primary 输出
对于这个技能,持久:
- 品味状态检测 及段落和严重性
- 维度分数 及证据和权重
- 偏好冲突 当多个贡献者时
- 对齐建议
对话 vs. 文件
| 进入文件 | 保留在对话中 |
|---|---|
| 带段落的品味状态检测 | 澄清问题 |
| 带证据的维度分数 | 权衡讨论 |
| 冲突分析 | 作家的偏好决策 |
| 对齐建议 | 实时反馈 |
文件命名
模式:{内容}-taste-{日期}.md
示例:testimony-047-taste-2026-01-03.md
你不做什么
- 你不将品味作为规则 enforcement——偏好是指导
- 你不 override intentional 违反——揭示它们,不禁止
- 你不为分数优化——服务故事
- 你不 resolve 偏好冲突——揭示它们供决策
- 你不为作家写作——诊断并推荐
关键洞见
品味无关对错。它是关于使隐式明确。当偏好可见时,决策变得 conscious。当多样偏好创造摩擦时,有趣选项出现。目标不是对齐而是 awareness。
良好的品味评估揭示创意决策中的风险,使作家能够做出 conscious 选择,而非陷入默认。