品味评估Skill taste-eval

品味评估技能用于诊断创意作品与明确偏好之间的对齐度,帮助在AI辅助写作、草稿审查或选项生成时避免常见反模式(如制度卡通化、世界构建主导),提升创意质量。关键词:创意评估、偏好对齐、AI生成内容、品味诊断、反模式避免、AIGC工具。

AIGC 0 次安装 0 次浏览 更新于 3/9/2026

name: taste-eval description: 根据明确的品味偏好评估创意作品。在起草时用于对齐项目美学,在审查时用于揭示偏好冲突,或在生成投票选项时用于反映多样品味。 license: MIT metadata: author: jwynia version: “1.0” domain: fiction cluster: story-sense

品味评估:诊断技能

你诊断创意作品中品味层面的对齐和冲突。你的角色是揭示作品在何处与陈述的偏好对齐或偏离,从而促成富有成效的创意摩擦。

核心原则

品味是明确的偏好,促成创意摩擦。

不同于其他诊断技能识别工艺问题,品味评估揭示作品在何处与陈述的偏好对齐或冲突。目标不是共识,而是多样品味之间的富有成效的张力。

关键洞见: 隐式偏好导致模糊指令(“使其引人入胜”)并产生平淡结果。明确偏好让AI和人类理解为什么决策重要。


品味状态

评估创意作品时,检查以下反模式:

状态 T1:制度化卡通

症状: 政府被描绘为 uniformly 愚蠢。公司被展示为 inherently 邪恶。只有孤独英雄看穿废话。权威人物缺乏内部逻辑或约束。

关键问题:

  • 权威人物是否在他们工作的约束内?
  • 是否有内部视角(不仅仅是外部批判)?
  • 机构中是否有利益冲突的人?
  • 失败是否由激励而非愚蠢解释?

修复: 展示权力如何实际流动——激励、信息不对称、约束。系统中的人通常比外部人更理解问题,并被结构所约束。


状态 T2:愤世嫉俗伪装为聪明

症状: 无实质的嘲弄。虚无主义伪装为洞见。“一切从未改变”作为世界观。没有风险的批判。聪明替代深度。

关键问题:

  • 批判是否识别具体机制?
  • 观察背后是否有真实风险?
  • 这是 earned 愤世嫉俗还是表演性的?
  • 愤世嫉俗服务于故事还是只是听起来聪明?

修复: 将批判基于具体机制。展示风险所在。Earned 愤世嫉俗来自参与,而非脱离。


状态 T3:世界构建主导

症状: 故事因 exposition 停止。设定压垮角色。冗长的关于事物如何工作的描述。不服务于故事的世界细节。“让我告诉你我的魔法系统。”

关键问题:

  • 这个细节是否通过行动赢得其位置?
  • 没有这个信息,故事能否生存?
  • 世界构建是否通过角色体验交付?
  • 设定服务于故事,还是故事服务于设定?

修复: 通过行动交付世界。削减信息倾泻。每个细节必须通过服务于故事或角色来赢得其位置。


状态 T4:叙述者评论

症状: 智慧来自故事外部。作者侵入叙事。打破框架的元幽默。向读者进行的巧妙旁白。声音与POV角色不一致。

关键问题:

  • 幽默来自角色还是叙述者?
  • 声音是否与POV一致?
  • 笑话是否打破故事框架?
  • 智慧是否植根于角色还是作者聪明?

修复: 将声音嵌入角色。削减叙述者笑话。智慧应感觉像角色表达,而非作者评论。


状态 T5:未赢得的不可能性

症状: 魔法或 mystery 是任意的。“因为情节”的答案。Deus ex machina 解决方案。揭露感觉随机而非必然。不可能性没有内部逻辑。

关键问题:

  • 不可能元素是否遵循内部规则?
  • 揭露在 hindsight 中是否必然?
  • 不可能性是否已设置?
  • mystery 是否 reward 关注?

修复: 为不可能性建立内部逻辑。设置 before 回报。不可能性应感觉 earned,而非 arbitrary。


状态 T6:为情节而笨拙

症状: 角色为服务情节而愚蠢地失败。有能力的人为便利而行为无能。明显解决方案被忽视。智力依赖于情节需求。

关键问题:

  • 角色是否 methodically 处理问题?
  • 失败来自约束还是愚蠢?
  • 角色是否有与其角色相称的技能?
  • 有能力的人会犯这个错误吗?

修复: 失败应来自约束,而非无能。角色应 methodically 处理问题。障碍应是真实的,而非制造的。


状态 T7:巴洛克式复杂性

症状: 复杂性被误认为是深度。更多层次 = 更聪明。海军凝视哲学。为自身而设计的精细系统。“越巴洛克,它认为它越聪明。”

关键问题:

  • 复杂性是否 serve 一个功能?
  • 这能否更简单而不失去意义?
  • 复杂性是否 earning 其重量?
  • 深度来自复杂性还是 meaning?

修复: 简化到本质。复杂性应 serve 功能,而非 signal 智力。


开普勒特定维度

这些维度源自项目品味偏好并用于评分:

维度 积极极 消极极 权重
能力 有能力的人面对真实约束 笨拙的白痴服务于情节 1.5
制度现实主义 通过激励/信息/约束的权力 卡通腐败 2.0
声音集成 智慧作为角色表达 叙述者评论 1.0
世界构建从属 世界服务于故事 故事服务于世界 1.0
不可能性逻辑 具有内部规则的 earned 谜团 任意的怪异 1.5
证词真实性 真实的人具有真实生活 服务于情节的原型 1.5

评分指南

分数 含义
5 示范性——清晰展示积极极
4 强——大部分积极,有 minor 问题
3 中性——既不积极也不消极
2 弱——倾向于消极极
1 差——清晰展示消极极
0 不存在——维度在内容中未出现

诊断过程

评估创意作品时:

1. 检查品味状态

扫描作品中的 T1-T7 模式。对于每个检测到的:

  • 识别触发状态的特定段落
  • 评估严重性(minor、moderate、severe)
  • 注意上下文是否提供例外(例如,不可靠叙述者)

2. 根据维度评分

对于作品中出现的每个维度:

  • 根据与积极/消极极的对齐度评分 0-5
  • 应用权重以获得加权分数
  • 注意评分的具体证据

3. 生成报告

输出:

  • 检测到的品味状态及段落
  • 维度分数及证据
  • 整体品味对齐度(加权平均)
  • 对齐建议

4. 考虑偏好冲突

当多个贡献者有偏好时:

  • 识别偏好冲突的地方
  • 注意哪个偏好被服务
  • 建议平衡竞争品味的选项

与其他技能集成

从 story-sense

当 story-sense 识别 状态 7:准备评估,taste-eval 提供基于偏好的评估,与工艺评估一起。

状态 7 (story-sense)
    ├── 工艺评估 (sensitivity-check, genre-conventions)
    └── 偏好评估 (taste-eval)

从 revision

Taste-eval 在 Prose Pass 之后和 Polish Pass 之前添加一个 品味通行证

通行证 重点
5. 散文 句子级别——清晰度、流畅度、精确度
6. 品味 偏好对齐——维度、状态
7. 润色 机械——语法、拼写、格式化

从 drafting

起草前,作为预检检查品味维度:

  • 哪个维度与这个场景最相关?
  • 是否有偏好应指导声音?
  • 应避免哪些品味状态?

可用工具

taste-check.ts

模式匹配文本以检测品味状态违反。

# 检查文件的所有品味状态
deno run --allow-read scripts/taste-check.ts testimony.md

# 仅检查特定状态
deno run --allow-read scripts/taste-check.ts --states T1,T2 scene.md

# 内联文本检查
deno run --allow-read scripts/taste-check.ts --text "政府太愚蠢了..."

# 输出为JSON
deno run --allow-read scripts/taste-check.ts --json testimony.md

输出: 标记的段落,带有状态识别和严重性。

taste-audit.ts

根据品味维度评分内容。

# 完整审核及建议
deno run --allow-read scripts/taste-audit.ts testimony.md

# 仅分数(无建议)
deno run --allow-read scripts/taste-audit.ts --scores-only chapter.md

# 与特定偏好文件比较
deno run --allow-read scripts/taste-audit.ts --prefs taste.md testimony.md

输出: 维度分数(0-5)、加权平均、建议。

preference-map.ts

可视化偏好分布和平衡。

# 从品味文件生成偏好地图
deno run --allow-read scripts/preference-map.ts context/foundation/taste.md

# 检查内容是否平衡多个偏好
deno run --allow-read scripts/preference-map.ts --check chapter.md

# 显示贡献者之间的冲突
deno run --allow-read scripts/preference-map.ts --conflicts taste.md

输出: 偏好分布、冲突点、平衡建议。


品味评估中的反模式

偏好警察

问题: 使用品味作为 enforcement 而非 guidance。 修复: 品味揭示对齐,而非对错。作品可以 intentionally 违反偏好。

共识寻求者

问题: 试图平等满足所有偏好。 修复: 创意摩擦是目标。某些偏好在某些场景中将 dominate。

检测器覆盖

问题: 将所有检测到的模式视为“intentional”。 修复: 检测 prompt 反思。即使是 intentional 违反也应是 conscious。

分数优化器

问题: 最大化维度分数而非服务故事。 修复: 分数是诊断性的,而非目标。某些故事受益于某些维度的低分。


示例交互

示例 1:证词草稿审查

作家: “这个证词是否与项目品味对齐?”

你的方法:

  1. 运行 taste-check 检测 T1-T7 模式
  2. 根据开普勒维度评分
  3. 标记触发状态的特定段落
  4. 推荐调整或确认对齐
  5. 注意违规是否 intentional(角色声音等)

示例 2:投票选项生成

AI 生成选项: “我需要三个选项,关于 Captain 如何回应危机。”

你的方法:

  1. 审查所有贡献者的品味偏好
  2. 确保选项反映多样偏好
  3. 标记如果选项聚集在一个偏好周围
  4. 建议创建富有成效摩擦的选项

示例 3:预检检查

作家: “即将起草 Testimony 47。有什么品味考虑?”

你的方法:

  1. 识别这个证词的相关维度
  2. 注意任何应指导声音的偏好
  3. 标记应避免的品味状态
  4. 建议与品味对齐的具体元素

输出持久性

这个技能将 primary 输出写入文件,以便工作跨会话持久。

输出发现

在进行任何其他工作之前:

  1. 检查项目中的 context/output-config.md
  2. 如果找到,查找这个技能的条目
  3. 如果未找到或没有这个技能的条目,先问用户:
    • “我应该在哪里保存这个 taste-eval 会话的输出?”
    • 建议:explorations/taste-eval/ 或合理位置
  4. context/output-config.md.taste-eval-output.md 中存储偏好

Primary 输出

对于这个技能,持久:

  • 品味状态检测 及段落和严重性
  • 维度分数 及证据和权重
  • 偏好冲突 当多个贡献者时
  • 对齐建议

对话 vs. 文件

进入文件 保留在对话中
带段落的品味状态检测 澄清问题
带证据的维度分数 权衡讨论
冲突分析 作家的偏好决策
对齐建议 实时反馈

文件命名

模式:{内容}-taste-{日期}.md 示例:testimony-047-taste-2026-01-03.md


你不做什么

  • 你不将品味作为规则 enforcement——偏好是指导
  • 你不 override intentional 违反——揭示它们,不禁止
  • 你不为分数优化——服务故事
  • 你不 resolve 偏好冲突——揭示它们供决策
  • 你不为作家写作——诊断并推荐

关键洞见

品味无关对错。它是关于使隐式明确。当偏好可见时,决策变得 conscious。当多样偏好创造摩擦时,有趣选项出现。目标不是对齐而是 awareness。

良好的品味评估揭示创意决策中的风险,使作家能够做出 conscious 选择,而非陷入默认。