名称: ai-shaped-readiness-advisor 描述: 评估您的产品工作是 AI-first 还是 AI-shaped。评分 5 个核心能力并推荐下一个要构建的能力。类型: 交互式

目的

评估您的产品工作是 “AI-first”（使用 AI 自动化现有任务更快）还是 “AI-shaped”（从根本上重新设计产品团队围绕 AI 能力运作的方式）。使用此评估来评估您在 2026 年 5 个基本 PM 能力 上的就绪性，识别差距，并获得关于首先构建哪个能力的具体建议。

关键区别： AI-first 是可爱的（使用 Copilot 更快地编写 PRDs）。AI-shaped 是生存（构建一个人类和 AI 都信任的持久“现实层”，编排 AI 工作流，压缩学习周期）。

这不是关于 AI 工具——而是关于 围绕 AI 作为共同智能的组织重新设计。此交互式技能指导您完成成熟度评估，然后推荐您的下一步行动。

关键概念

AI-First 与 AI-Shaped

维度	AI-First（可爱）	AI-Shaped（生存）
心态	自动化现有任务	重新设计工作方式
目标	加快工件创建	压缩学习周期
AI 角色	任务助手	战略共同智能
优势	临时效率提升	可防御的竞争护城河
示例	“Copilot 以 2 倍速度编写 PRDs”	“AI 代理在 48 小时内验证假设，而不是 3 周”

关键洞察： 如果竞争对手可以通过投入人力来复制您的 AI 使用，那不是差异化——只是效率（在几个月内成为基础要求）。

5 个基本 PM 能力（2026）

这些能力定义了 AI-shaped 产品工作。您将评估每个的成熟度。

1. 上下文设计

构建一个持久 “现实层”，人类和 AI 都可以信任——将 AI 注意力视为稀缺资源并有意分配。

包括内容：

记录什么是真实的 vs. 假设的
不可变约束（技术、监管、战略）
操作术语表（共享定义）
证据标准（什么算作验证）
上下文边界（什么持久化 vs. 检索）
内存架构（短期对话 + 长期持久）
检索策略（语义搜索、上下文检索）

关键原则： “如果您不能指出证据、约束和定义，您就没有上下文。您只有感觉。”

关键区别：上下文填充 vs. 上下文工程

上下文填充（AI-first）： 无意图地塞入大量内容（“粘贴整个 PRD”）
上下文工程（AI-shaped）： 为注意力塑造结构（有界领域、有意图检索）

5 个诊断问题：

这支持什么具体决策？
检索能否替代持久化？
谁拥有上下文边界？
如果排除这个会失败什么？
我们是在修复结构还是避免它？

AI-first 版本： 将 PRDs 粘贴到 ChatGPT；无上下文边界；"越多越好"心态 AI-shaped 版本： CLAUDE.md 文件、证据数据库、AI 代理引用的约束注册表；两层内存架构；研究→计划→重置→实现周期以防止上下文腐烂

深入探讨： 参见 context-engineering-advisor 获取诊断上下文填充和实施内存架构的详细指导。

2. 代理编排

创建可重复、可追溯的 AI 工作流（不是一次性提示）。

包括内容：

定义工作流循环：研究 → 综合 → 批判 → 决策 → 记录理由
每个步骤展示其工作（可追溯推理）
工作流一致运行（相同输入 = 可预测过程）
版本控制的提示和代理

关键原则： 一次性提示是战术性的。编排的工作流是战略性的。

AI-first 版本： “让 ChatGPT 分析此用户反馈” AI-shaped 版本： 自动化工作流，摄入反馈、标记主题、生成假设、标记矛盾、记录决策

3. 结果加速

使用 AI 压缩 学习周期（不仅仅是加速任务）。

包括内容：

消除验证延迟（PoL 探针在几天内运行，而不是几周）
移除批准延迟（AI 预先验证约束）
减少会议开销（异步 AI 综合替代状态会议）

关键原则： 有目的地做更少。AI 移除瓶颈，不生成更多工作。

AI-first 版本： “AI 更快地编写用户故事” AI-shaped 版本： “AI 过夜运行可行性检查，消除 2 周的技术发现”

4. 团队-AI 促进

重新设计团队系统，使 AI 作为 共同智能 运作，而不是责任屏蔽。

包括内容：

审查规范（谁检查 AI 输出、何时、如何）
证据标准（AI 必须引用来源，不产生幻觉）
决策权限（AI 推荐，人类决定——清晰边界）
心理安全（团队可以挑战 AI 而不感到"愚蠢"）

关键原则： AI 放大判断，不替代责任。

AI-first 版本： “我使用了 AI” 作为糟糕输出的借口 AI-shaped 版本： 清晰审查协议；AI 输出被视为需要人工验证的草稿

5. 战略差异化

超越效率，创造 可防御的竞争优势。

包括内容：

新客户能力（用户现在能做什么以前不能做的？）
工作流重新布线（竞争对手无法复制而不完全重新设计的流程）
竞争对手无法匹配的经济学（通过 AI 实现 10 倍成本优势）

关键原则： “如果竞争对手可以通过投入人力来复制它，那不是差异化。”

AI-first 版本： “我们使用 AI 编写更好的文档” AI-shaped 版本： “我们在 2 天内验证产品假设，而行业标准是 3 周——每季度发布 6 倍更多已验证功能”

反模式（这不是什么）

不是关于 AI 工具： 使用 Claude vs. ChatGPT 不重要。重新设计工作流重要。
不是关于速度： 以 2 倍速度编写 PRDs 不具战略性，如果 PRDs 不是瓶颈。
不是关于自动化： 自动化糟糕流程只是放大糟糕。
不是关于替代人类： AI-shaped 组织增强判断，不消除它。

何时使用此技能

✅ 在以下情况使用：

您在使用 AI 工具但未看到战略优势
您怀疑自己是"AI-first"（效率）但想成为"AI-shaped"（转型）
您需要优先考虑下一个要构建的 AI 能力
领导层问"我们如何使用 AI？"而您不确定如何战略性地回答
您想评估团队在 AI 驱动产品工作方面的就绪性

❌ 不在以下情况使用：

您尚未开始使用 AI（首先使用基本工具）
您正在寻找工具推荐（这是关于组织设计，不是工具）
您需要战术性"如何编写提示"指导（使用相关技能）

促进真相来源

使用 workshop-facilitation 作为此技能的默认交互协议。

它定义：

会话提示 + 进入模式（引导、上下文转储、最佳猜测）
单问题轮次与自然语言提示
进度标签（例如，上下文 Qx/8 和评分 Qx/5）
中断处理和暂停/恢复行为
决策点的编号建议
常规问题的快速选择编号响应选项（当有用时包括 其他（指定））

此文件定义领域特定评估内容。如果有冲突，遵循此文件的领域逻辑。

应用

此交互式技能使用 自适应提问 来评估您在 5 个能力上的成熟度，然后推荐优先事项。

促进协议（强制）

每轮询问恰好 一个问题。
在询问下一个问题之前等待用户的答案。
使用自然语言问题（主要问题不使用速记标签）。如果需要，包括示例响应格式。
在每轮显示进度，使用面向用户的标签：
- 上下文 Qx/8 在上下文收集期间
- 评分 Qx/5 在成熟度评分期间
- 当实用时包括"剩余问题"。
不在面向用户的提示中使用内部阶段标签（如"步骤 0"），除非用户询问内部结构详情。
对于成熟度评分问题，首先呈现简洁的 1-4 选项；仅在请求时分享完整标准详情。
对于上下文问题，当实用时提供简洁编号快速选择选项，加上 其他（指定） 用于开放答案。接受多选回复，如 1,3 或 1 和 3。
仅在决策点给出编号建议，不是在每个答案后。
决策点包括：
- 在完整上下文摘要后
- 在 5 维成熟度概况后
- 在优先级选择和行动计划路径选择期间
当显示建议时，清晰枚举（1., 2., 3.）并接受选择，如 #1, 1, 1 和 3, 1,3, 或自定义文本。
如果选择多个选项，合成组合路径并继续。
如果提供自定义文本，将其映射到最近的有效路径并继续，不强制重新输入。
中断处理是强制的：如果用户询问元问题（“还剩多少？”，“为什么这个标签？”，“暂停”），首先直接回答，然后重述当前进度并用待处理问题恢复。
如果用户说停止或暂停，立即停止评估并等待显式恢复。
如果用户要求"一次一个问题"，为该会话保持该模式，除非他们显式退出。
在任何评估问题前，给一个简短提示关于时间/长度，并让用户选择进入模式。

会话开始：提示 + 进入模式（强制）

代理开场提示（首先使用此）：

"在开始前快速提示：这通常需要约 7-10 分钟，最多 13 个问题（8 个上下文 + 5 个评分）。

您想如何做？

引导模式：我将一次问一个问题。
上下文转储：您粘贴您已知的内容，我将跳过任何冗余的。
最佳猜测模式：我将做出合理假设在缺失细节处，标记它们，并继续前进。"

接受选择为 #1, 1, 1 和 3, 1,3, 或自定义文本。

模式行为：

如果引导模式： 按书面运行步骤 0，然后评分。
如果上下文转储： 请求粘贴上下文一次，总结它，识别差距，并：
- 跳过任何已回答的上下文问题。
- 仅询问所需的最少缺失上下文（0-2 个澄清问题）。
- 一旦上下文足够，移动到评分。
如果最佳猜测模式： 请求最小可行起始输入（角色/团队 + 主要目标），然后：
- 使用合理默认推断缺失细节。
- 将每个推断项标记为 假设。
- 为每个假设包括置信度标签（高, 中, 低）。
- 继续前进而不阻塞未知。

在最终摘要中，当使用上下文转储或最佳猜测模式时，包括 需要验证的假设 部分。

步骤 0: 收集上下文

代理询问：

使用此精确序列收集上下文，一次一个问题：

“您今天在使用哪些 AI 工具？”
“您的团队今天通常如何使用 AI：一次性提示、可重用模板，还是多步骤工作流？”
“谁今天一致使用 AI：只有您、PMs，还是跨职能团队？”
“您的团队上大约有多少 PMs、工程师和设计师？”
“您处于哪个阶段：初创、增长，还是企业？”
“如何做决策：集中式、分布式，还是共识驱动？”
“您试图通过 AI 构建什么竞争优势？”
“今天最大的瓶颈是减慢学习和迭代的什么？”

在问题 8 后，用 4 行总结回来：

当前 AI 使用模式
团队上下文
战略意图
主要瓶颈

步骤 1: 上下文设计成熟度

代理询问：

让我们评估您的 上下文设计 能力——您构建"现实层"的能力如何，人类和 AI 都可以信任，以及您是在做 上下文填充（无意图的大量内容）还是 上下文工程（为注意力塑造结构）。

哪个陈述最好描述您的当前状态？

级别 1（AI-First / 上下文填充）： “我每次需要时都将整个文档粘贴到 ChatGPT。无共享知识库。无上下文边界。”
- 现实：一次性提示，无持久性；"越多越好"心态
- 问题：AI 无记忆；您不断重复自己；上下文填充降低注意力
- 上下文工程差距： 无答案到 5 个诊断问题；持久化一切"以防万一"
级别 2（新兴 / 早期结构）： “我们有一些文档（PRDs、战略备忘录），但它们是分散的。无一致格式。开始注意到上下文填充问题（模糊响应、标准化重试）。”
- 现实：上下文存在但未为 AI 消费结构化；无检索策略
- 问题：AI 无法可靠找到或信任信息；混合始终需要与临时上下文
- 上下文工程差距： 无上下文边界所有者；无持久化 vs. 检索的区别
级别 3（过渡 / 上下文工程新兴）： “我们已开始使用 CLAUDE.md 文件和项目指令。约束注册表存在。我们正在识别什么持久化 vs. 检索。实验研究→计划→重置→实现周期。”
- 现实：结构化上下文出现，但不全面；上下文边界定义但未完全执行
- 问题：覆盖不全；一些领域记录良好，其他感觉驱动；不一致检索实践
- 上下文工程进展： 能回答 3-4 个诊断问题；上下文边界所有者分配；开始使用两层内存
级别 4（AI-Shaped / 上下文工程掌握）： “我们维护一个持久现实层：约束注册表（20+ 条目）、证据数据库、操作术语表（30+ 术语）。两层内存架构（短期对话 + 长期持久 via 向量 DB）。上下文边界定义并拥有。AI 代理自动引用这些。我们使用研究→计划→重置→实现以防止上下文腐烂。”
- 现实：全面、版本控制的上下文，人类和 AI 都信任；有意图检索（不是完整性）
- 结果：AI 以高置信度运作；减少幻觉和返工；令牌使用优化；无上下文填充
- 上下文工程掌握： 能回答所有 5 个诊断问题；上下文边界每季度审计；定量效率追踪：(准确性 × 连贯性) / (令牌 × 延迟)

选择您的级别： [1, 2, 3, 或 4]

注意： 如果您选择级别 1-2 并在上下文填充中挣扎，考虑使用 context-engineering-advisor 来诊断和修复上下文囤积障碍，然后继续。

用户响应： [选择]

代理记录： 上下文设计成熟度 = [级别 X]

步骤 2: 代理编排成熟度

代理询问：

现在评估 代理编排——您是否有可重复的 AI 工作流还是只有一次性提示。

哪个陈述最好描述您的当前状态？

级别 1（AI-First）： “我根据需要将提示键入 ChatGPT。无保存工作流或模板。”
- 现实：战术性、临时使用
- 问题：不一致结果；无法扩展或审计
级别 2（新兴）： “我有一些保存的提示我重用。可能有些自定义 GPTs 或 Claude 项目。”
- 现实：可重复提示，但不是完整工作流
- 问题：每个步骤是手动的；无编排
级别 3（过渡）： “我们已构建一些多步骤工作流（研究 → 综合 → 批判）。在 Notion 或 Linear 等工具中追踪。”
- 现实：工作流存在但需要手动交接
- 问题：仍然每一步有人类参与；未完全自动化
级别 4（AI-Shaped）： “我们有编排的 AI 工作流，自主运行：研究 → 综合 → 批判 → 决策 → 记录理由。每个步骤可追溯且版本控制。”
- 现实：工作流一致运行；在每一步展示其工作
- 结果：可靠、可审计、可扩展的 AI 流程

选择您的级别： [1, 2, 3, 或 4]

用户响应： [选择]

代理记录： 代理编排成熟度 = [级别 X]

步骤 3: 结果加速成熟度

代理询问：

接下来，结果加速——您是在使用 AI 压缩学习周期，还是只是加速任务？

哪个陈述最好描述您的当前状态？

级别 1（AI-First）： “AI 帮助我更快编写文档（PRDs、用户故事）。每周节省我几小时。”
- 现实：在工件创建上的效率提升
- 问题：文档不是瓶颈；学习周期未变
级别 2（新兴）： “AI 帮助研究和综合（总结用户反馈、分析竞争对手）。节省研究时间。”
- 现实：适度学习加速
- 问题：仍然顺序；AI 不消除验证延迟
级别 3（过渡）： “我们使用 AI 更快速运行实验（PoL 探针、可行性检查）。将验证时间从几周减到几天。”
- 现实：学习周期压缩
- 问题：尚未系统化；仅应用于一些实验
级别 4（AI-Shaped）： “AI 系统移除瓶颈：过夜可行性检查、异步综合替代会议、自动化验证约束。学习周期 5-10 倍更快。”
- 现实：如何学习的基本重新设计
- 结果：比竞争对手快 6 倍发布已验证功能

选择您的级别： [1, 2, 3, 或 4]

用户响应： [选择]

代理记录： 结果加速成熟度 = [级别 X]

步骤 4: 团队-AI 促进成熟度

代理询问：

现在评估 团队-AI 促进——您重新设计团队系统使 AI 作为共同智能的能力如何。

哪个陈述最好描述您的当前状态？

级别 1（AI-First）： “我私下使用 AI。团队不知道或不使用它。无共享规范。”
- 现实：个人工具使用，无团队集成
- 问题：不一致质量；对 AI 输出无责任
级别 2（新兴）： “团队使用 AI，但无正式审查过程。‘我使用了 AI’ 被随意提及。”
- 现实：意识但无结构
- 问题：AI 输出被视为最终；错误滑过
级别 3（过渡）： “我们有审查规范出现（AI 输出是草稿，不是最终）。证据标准讨论但未编纂。”
- 现实：文化转变在进行中
- 问题：规范是非正式的；不是每个人都遵循它们
级别 4（AI-Shaped）： “清晰协议：AI 输出需要人工验证，证据标准编纂，决策权限明确（AI 推荐，人类决定）。团队将 AI 视为共同智能。”
- 现实：AI 集成到团队操作系统中
- 结果：高质量输出；维持心理安全

选择您的级别： [1, 2, 3, 或 4]

用户响应： [选择]

代理记录： 团队-AI 促进成熟度 = [级别 X]

步骤 5: 战略差异化成熟度

代理询问：

最后，战略差异化——您是在创造可防御的竞争优势，还是只是效率提升？

哪个陈述最好描述您的当前状态？

级别 1（AI-First）： “我们使用 AI 工作更快（编写更好文档、更快响应客户）。仅效率提升。”
- 现实：基础要求改进
- 问题：竞争对手可在几个月内复制
级别 2（新兴）： “AI 使我们能做以前不能做的事（分析 10 倍更多数据、测试更多假设）。新能力，但竞争对手可复制。”
- 现实：能力扩展，但不可防御
- 问题：无护城河；竞争对手雇更多人匹配
级别 3（过渡）： “我们已围绕 AI 重新设计一些工作流（例如，在 2 天内验证假设 vs. 3 周）。开始创造分离。”
- 现实：工作流优势出现
- 问题：尚未系统化；仅应用于部分领域
级别 4（AI-Shaped）： “我们从根本上重新布线了我们如何操作：客户获得在其他地方无法获得的能力，我们的学习周期比行业标准快 10 倍，我们的经济学好 5 倍。竞争对手无法复制而不完全组织重新设计。”
- 现实：可防御的竞争护城河
- 结果：随时间复合的战略优势

选择您的级别： [1, 2, 3, 或 4]

用户响应： [选择]

代理记录： 战略差异化成熟度 = [级别 X]

步骤 6: 评估成熟度概况

代理合成：

这是您的 AI-Shaped 就绪性概况：

┌─────────────────────────────┬───────┬──────────┐
│ 能力                        │ 级别 │ 成熟度  │
├─────────────────────────────┼───────┼──────────┤
│ 1. 上下文设计              │   X   │ [标签]  │
│ 2. 代理编排                │   X   │ [标签]  │
│ 3. 结果加速                │   X   │ [标签]  │
│ 4. 团队-AI 促进            │   X   │ [标签]  │
│ 5. 战略差异化              │   X   │ [标签]  │
└─────────────────────────────┴───────┴──────────┘

整体评估： [AI-First / 新兴 / 过渡 / AI-Shaped]

成熟度标签：

级别 1： AI-First（仅效率）
级别 2： 新兴（早期能力）
级别 3： 过渡（重新设计进行中）
级别 4： AI-Shaped（战略转型）

整体评估逻辑：

AI-First： 平均级别 1-1.5（大多数级别 1）
新兴： 平均级别 2-2.5（大多数级别 2）
过渡： 平均级别 3-3.5（大多数级别 3）
AI-Shaped： 平均级别 3.5-4（大多数级别 4）

步骤 7: 识别优先级差距

代理询问：

基于您的成熟度概况，您应首先优先考虑哪个能力？

代理分析依赖：

依赖逻辑：

上下文设计是基础 — 如果级别 1-2，这必须是优先级 #1（代理编排和结果加速依赖它）
代理编排实现结果加速 — 如果上下文设计是级别 3+，但代理编排是级别 1-2，优先编排
团队-AI 促进是平行的 — 可与其他并行发展，但需要规模
战略差异化需要其他能力级别 3+ — 在构建基础能力前不聚焦于此

代理推荐：

基于您的概况，我推荐首先聚焦于 [能力名称]，因为：

选项 1: 上下文设计（如果级别 1-2）

为什么： 没有持久上下文，AI 在感觉上运作。每个工作流将脆弱。
影响： 解锁代理编排和结果加速
下一步： 构建 CLAUDE.md 文件、开始约束注册表、创建操作术语表

选项 2: 代理编排（如果上下文是 3+，但编排是 1-2）

为什么： 您有上下文，但无可重复工作流。扩展需要编排。
影响： 将一次性提示转变为可靠、可追溯的工作流
下一步： 记录您最频繁的 AI 工作流、版本控制提示、添加可追溯性

选项 3: 结果加速（如果上下文 + 编排是 3+）

为什么： 您有基础设施；现在压缩学习周期
影响： 从学习速度出现战略优势
下一步： 识别学习周期中最大瓶颈，设计 AI 工作流消除它

选项 4: 团队-AI 促进（如果使用是个人的，不是团队范围的）

为什么： 如果只有您是 AI-shaped，无法扩展；团队必须采用
影响： 组织转型，不仅个人生产力
下一步： 建立审查规范、编纂证据标准、创建决策权限框架

选项 5: 战略差异化（如果所有其他能力是 3+）

为什么： 您有基础；现在构建护城河
影响： 创造可防御的竞争优势
下一步： 识别竞争对手无法复制的工作流，设计 AI 启用的客户能力

您想聚焦于哪个？

选项：

接受推荐 — [代理提供详细行动计划]
选择不同优先级 — [代理警告依赖但允许覆盖]
同时聚焦多个 — [代理建议如果可行，并行轨道]

用户响应： [选择]

步骤 8: 生成行动计划

代理提供基于选择优先级的定制行动计划：

如果优先级 = 上下文设计

目标： 构建一个持久"现实层"，人类和 AI 都信任——从上下文填充移动到上下文工程。

预阶段: 诊断上下文填充（如果需要） 如果您在级别 1-2，首先诊断上下文填充症状：

运行通过 5 个诊断问题（参见 context-engineering-advisor)
识别您持久化什么应该检索
分配上下文边界所有者
创建上下文清单（什么始终需要 vs. 临时）

阶段 1: 记录约束（第 1 周）

创建约束注册表：
- 技术约束（APIs、数据模型、性能限制）
- 监管约束（GDPR、HIPAA 等）
- 战略约束（我们将/不构建 X）
对每个约束应用诊断问题 #4：“如果排除这个会失败什么？”
格式：结构化文件 AI 代理可解析（YAML、JSON，或带有前置事项的 Markdown）
在 Git 中版本控制

阶段 2: 构建操作术语表（第 2 周）

列出您的团队使用的 top 20-30 术语（例如，“用户”、“客户”、“激活”、“流失”）
明确地定义每个（避免"取决于"）
包括边缘情况和异常
添加到 CLAUDE.md 或项目指令
这成为您的 长期持久内存（声明性内存）

阶段 3: 建立证据标准 + 上下文边界（第 3 周）

定义什么算作验证：
- 用户反馈：“X 用户说 Y”（带有引用）
- 分析：“指标 Z 变化了 N%”（带有仪表板链接）
- 竞争情报：“竞争对手 A 发布了 B”（带有来源）
拒绝：“我认为”、“我们感觉”、“似乎像”
使用 5 个诊断问题定义上下文边界：
- 每个上下文支持什么具体决策？
- 检索能否替代持久化？
- 谁拥有上下文边界？
创建上下文清单文档
编纂到团队文档中

阶段 4: 实施内存架构 + 工作流（第 4 周）

设置两层内存：
- 短期（对话）： 总结/截断对话的旧部分
- 长期（持久）： 约束注册表 + 操作术语表（考虑向量数据库用于检索）
实施研究→计划→重置→实现周期：
- 研究：允许混乱上下文收集
- 计划：综合成高密度 SPEC.md 或 PLAN.md
- 重置：清除上下文窗口
- 实现：仅使用计划作为上下文
更新 AI 提示以引用约束注册表和术语表
测试：让 AI 在做出推荐时引用约束
测量：AI 输出引用证据 vs. 产生幻觉的百分比；令牌使用效率

成功标准：

✅ 约束注册表有 20+ 条目
✅ 操作术语表有 20-30 术语
✅ 证据标准记录并共享
✅ 上下文清单创建（始终需要 vs. 临时）
✅ 上下文边界所有者分配
✅ 两层内存架构实施
✅ 研究→计划→重置→实现周期在 1 个工作流上测试
✅ AI 代理自动引用这些
✅ 令牌使用下降 30%+（较少上下文填充）
✅ 输出一致性上升（较少重试）

相关技能：

context-engineering-advisor（交互式） — 深度探讨诊断上下文填充和实施内存架构
problem-statement.md — 在框架问题前定义约束
epic-hypothesis.md — 基于证据的假设写作

如果优先级 = 代理编排

目标： 将一次性提示转变为可重复、可追溯的 AI 工作流。

阶段 1: 映射当前工作流（第 1 周）

选择您最频繁的 AI 使用案例（例如，“分析用户反馈”）
记录您当前采取的每一步：
- 复制/粘贴反馈到 ChatGPT
- 请求主题
- 手动分类
- 编写摘要
识别痛点（手动交接、不一致结果）

阶段 2: 设计编排工作流（第 2 周）

定义工作流循环：
- 研究： AI 阅读所有反馈（结构化输入）
- 综合： AI 识别主题（带有证据）
- 批判： AI 标记矛盾或弱信号
- 决策： 人类审查并决定下一步
- 记录： AI 记录理由和来源
每个步骤必须可追溯（展示来源、推理）

阶段 3: 构建和测试（第 3 周）

实施工作流使用：
- Claude 项目（如果简单）
- 自定义 GPTs（如果中等）
- API 编排（如果复杂）
在 3 个过去例子上运行；与手动过程比较
测量：节省时间、改进一致性、添加可追溯性

阶段 4: 文档和扩展（第 4 周）

版本控制提示（Git）
为团队记录工作流步骤
培训 2 个队友；观察结果
基于反馈迭代

成功标准：

✅ 至少 1 个工作流一致运行（相同输入 → 可预测过程）
✅ 每个步骤可追溯（AI 引用来源）
✅ 团队无需您的参与即可复制工作流

相关技能：

pol-probe-advisor.md — 使用编排工作流进行验证实验

如果优先级 = 结果加速

目标： 使用 AI 压缩学习周期，不仅仅是加速任务。

阶段 1: 识别瓶颈（第 1 周）

映射您当前的学习周期（例如，假设 → 实验 → 分析 → 决策）
时间每个步骤
识别最慢步骤（通常：验证延迟、批准延迟，或会议开销）

阶段 2: 设计 AI 干预（第 2 周）

问：“如果这个步骤过夜发生会怎样？”
- 可行性检查：AI 在 2 小时内探索 vs. 2 天
- 用户研究综合：AI 分析在 1 小时内 vs. 1 周
- 批准预检查：AI 在会议前验证约束
设计最小 AI 工作流以消除瓶颈

阶段 3: 运行试点（第 3 周）

在 1 个真实倡议上测试 AI 干预
测量周期时间：之前 vs. 之后
验证质量：AI 是否维持严谨，还是走捷径？

阶段 4: 扩展（第 4 周）

如果成功（周期时间下降 50%+，质量维持），应用到 3 个更多倡议
记录工作流
培训团队

成功标准：

✅ 学习周期在至少 1 个倡议上压缩 50%+
✅ 质量维持（无妥协严谨的捷径）
✅ 团队采用加速工作流

相关技能：

pol-probe.md — 使用 AI 更快运行 PoL 探针
discovery-process.md — 使用 AI 压缩发现周期

如果优先级 = 团队-AI 促进

目标： 重新设计团队系统，使 AI 作为共同智能运作，而不是责任屏蔽。

阶段 1: 建立审查规范（第 1 周）

编纂规则：“AI 输出是草稿，不是最终”
定义审查协议：
- 谁审查 AI 输出？（同行、主要 PM、跨职能伙伴）
- 何时？（在外部共享前、在决策前）
- 检查什么？（准确性、完整性、证据引用）
与团队分享，获得支持

阶段 2: 设置证据标准（第 2 周）

AI 必须引用来源（无幻觉）
拒绝说"我认为"或"似乎"的输出
要求：“根据 [来源]，[事实]”
添加到团队操作文档

阶段 3: 定义决策权限（第 3 周）

澄清：AI 推荐，人类决定
记录谁有权覆盖 AI 推荐（PM、团队领导、跨职能共识）
创建升级路径（如果 AI 和人类不同意怎么办？）

阶段 4: 构建心理安全（第 4 周）

团队练习：分享一个您发现的 AI 错误（使发现错误正常化）
奖励批判性思维（“好抓住那个 AI 幻觉！”）
避免：“为什么您不直接使用 AI？”（羞辱）

成功标准：

✅ 审查规范记录并团队遵循
✅ 证据标准编纂
✅ 决策权限清晰
✅ 团队舒适地挑战 AI 输出

相关技能：

problem-statement.md — 基于证据的问题框架
epic-hypothesis.md — 可测试、基于证据的假设

如果优先级 = 战略差异化

目标： 创造可防御的竞争优势，不仅仅是效率提升。

阶段 1: 识别护城河机会（第 1 周）

问：“我们能做什么用 AI，竞争对手无法通过增加人力复制？”
- 新客户能力（例如，“AI 顾问建议个性化路线图”）
- 工作流重新布线（例如，“在 2 天内验证产品想法 vs. 3 周”）
- 经济学转变（例如，“通过 AI 自动化以 SMB 价格交付企业功能”）
列出 5 个候选
按可防御性优先排序（复制多难？）

阶段 2: 设计 AI 启用能力（第 2 周）

选择 top 候选
设计端到端工作流：
- 客户体验什么？
- AI 幕后做什么？
- 需要什么人类判断？
草图 MVP（最小可行护城河）

阶段 3: 构建和测试（第 3-4 周）

构建原型（可以是 PoL 探针，不是生产）
与 5 个客户测试
测量：这创造竞争对手无法匹配的价值吗？

阶段 4: 验证护城河（第 5 周）

问：“竞争对手将如何复制这个？”
- 如果答案是"雇更多人"，不是护城河
- 如果答案是"完全重新设计他们的组织"，您有护城河
记录竞争分析
决定：构建完整版本、调整方向，或放弃

成功标准：

✅ 识别至少 1 个 AI 启用能力，竞争对手无法轻易复制
✅ 与客户验证（他们看到价值）
✅ 确认可防御性（竞争对手分析）

相关技能：

positioning-statement.md — 阐明您的 AI 驱动差异化
jobs-to-be-done.md — 理解客户雇佣您的 AI 能力做什么

步骤 9: 追踪进展（可选）

代理提供：

您想让我为您的 AI-shaped 转型创建一个进展追踪器吗？

追踪器包括：

当前成熟度级别（基线）
目标成熟度级别（目标状态）
行动计划里程碑（从步骤 8）
审查节奏（每周、每月）

选项：

是，创建追踪器 — [代理生成 Markdown 清单]
否，我将单独追踪 — [代理提供摘要]

示例

示例 1: 早期阶段初创公司（AI-First → 新兴）

上下文：

团队：2 PMs, 5 工程师
AI 使用：ChatGPT 用于编写 PRDs，偶尔 Copilot 使用
目标：比更大竞争对手更快移动

评估结果：

上下文设计：级别 1（无结构化上下文）
代理编排：级别 1（一次性提示）
结果加速：级别 1（文档更快，但学习周期未变）
团队-AI 促进：级别 2（团队使用 AI，但无规范）
战略差异化：级别 1（仅效率）

推荐： 首先聚焦于 上下文设计。

行动计划（第 1-4 周）：

第 1 周：创建约束注册表（10 个技术约束）
第 2 周：构建操作术语表（15 个术语）
第 3 周：建立证据标准
第 4 周：添加上下文到 CLAUDE.md 文件

结果： 4 周后，上下文设计 → 级别 3。解锁下季度的代理编排。

示例 2: 增长阶段公司（过渡 → AI-Shaped）

上下文：

团队：10 PMs, 50 工程师, 5 设计师
AI 使用：Claude 项目用于研究，自定义工作流出现
目标：在 IPO 前构建可防御的 AI 优势

评估结果：

上下文设计：级别 3（结构化上下文，不全面）
代理编排：级别 3（一些工作流，手动交接）
结果加速：级别 2（适度增益，非系统化）
团队-AI 促进：级别 3（规范出现，未编纂）
战略差异化：级别 2（新能力，但可复制）

推荐： 聚焦于 结果加速（基础扎实；现在压缩学习周期）。

行动计划（第 1-4 周）：

第 1 周：识别瓶颈（发现周期需要 3 周）
第 2 周：设计 AI 工作流过夜运行可行性检查
第 3 周：在 1 个倡议上试点（减少周期到 5 天）
第 4 周：扩展到 3 个倡议

结果： 学习周期快 5 倍 → 与竞争对手的战略分离 → 级别 4 结果加速 + 级别 3 战略差异化。

示例 3: 企业公司（AI-First，分散使用）

上下文：

团队：50 PMs, 300 工程师
AI 使用：个别 PMs 使用各种工具，无一致性
目标：标准化 AI 使用，创建跨职能工作流

评估结果：

上下文设计：级别 2（文档存在，未为 AI 结构化）
代理编排：级别 1（无共享工作流）
结果加速：级别 1（仅效率）
团队-AI 促进：级别 1（私人使用，无规范）
战略差异化：级别 1（无优势）

推荐： 首先聚焦于 团队-AI 促进（分布式团队在构建基础设施前需要共享规范）。

行动计划（第 1-4 周）：

第 1 周：建立审查规范（AI 输出是草稿）
第 2 周：设置证据标准（AI 必须引用来源）
第 3 周：定义决策权限（AI 推荐，领导决定）
第 4 周：与 3 个团队试点，收集反馈

结果： 团队-AI 促进 → 级别 3。为下步上下文设计和代理编排创建基础。

常见陷阱

1. 将效率误认为差异化

失败模式： “我们使用 AI 以 2 倍速度编写 PRDs——我们是 AI-shaped！”

后果： 竞争对手在 3 个月内复制；无持久优势。

修复： 问：“如果竞争对手投入 2 倍更多人力于此，他们能匹配我们吗？” 如果 yes，是效率（基础要求），不是差异化。

2. 跳过上下文设计

失败模式： 构建代理编排工作流而无持久上下文。

后果： AI 工作流脆弱（上下文变化打破一切）。

修复： 上下文设计是基础。不要跳过它。首先构建约束注册表、术语表、证据标准。

3. 个人使用，不是团队转型

失败模式： “我是 AI-shaped，但我的团队不是。”

后果： 无法扩展；工作流当您度假时失效。

修复： 优先考虑团队-AI 促进。共享规范 > 个人生产力。

4. 聚焦于工具，不是工作流

失败模式： “我们应该使用 Claude 还是 ChatGPT？”

后果： 工具辩论分散组织重新设计的注意力。

修复： 工具不重要。工作流重要。聚焦于重新设计工作如何完成，不是您使用哪个 AI。

5. 速度超过学习

失败模式： “AI 帮助我们更快发布！”

后果： 更快发布错误的东西（如果您不压缩学习周期）。

修复： 结果加速是关于更快学习，不是更快构建。在几天内验证假设，不是几周。

参考

外部框架

Dean Peters — AI-First Is Cute. AI-Shaped Is Survival. (Dean Peters’ Substack, 2026)
Dean Peters — Context Stuffing Is Not Context Engineering (Dean Peters’ Substack, 2026) — 深度探讨能力 #1（上下文设计）

进一步阅读

Ethan Mollick — Co-Intelligence（关于 AI 作为共同智能，不是替代）
Shreyas Doshi — Twitter 线程关于 PM 判断增强与 AI
Lenny Rachitsky — 通讯采访 AI 前瞻的 PMs

名称: ai-shaped-readiness-advisor 描述: 评估您的产品工作是 AI-first 还是 AI-shaped。评分 5 个核心能力并推荐下一个要构建的能力。 类型: 交互式

目的

关键概念

AI-First 与 AI-Shaped

5 个基本 PM 能力（2026）

1. 上下文设计

2. 代理编排

3. 结果加速

4. 团队-AI 促进

5. 战略差异化

反模式（这不是什么）

何时使用此技能

促进真相来源

应用

促进协议（强制）

会话开始：提示 + 进入模式（强制）

步骤 0: 收集上下文

步骤 1: 上下文设计成熟度

步骤 2: 代理编排成熟度

步骤 3: 结果加速成熟度

步骤 4: 团队-AI 促进成熟度

步骤 5: 战略差异化成熟度

步骤 6: 评估成熟度概况

步骤 7: 识别优先级差距

步骤 8: 生成行动计划

如果优先级 = 上下文设计

如果优先级 = 代理编排

如果优先级 = 结果加速

如果优先级 = 团队-AI 促进

如果优先级 = 战略差异化

步骤 9: 追踪进展（可选）

示例

示例 1: 早期阶段初创公司（AI-First → 新兴）

示例 2: 增长阶段公司（过渡 → AI-Shaped）

示例 3: 企业公司（AI-First，分散使用）

常见陷阱

1. 将效率误认为差异化

2. 跳过上下文设计

3. 个人使用，不是团队转型

4. 聚焦于工具，不是工作流

5. 速度超过学习

参考

相关技能

外部框架

进一步阅读

名称: ai-shaped-readiness-advisor 描述: 评估您的产品工作是 AI-first 还是 AI-shaped。评分 5 个核心能力并推荐下一个要构建的能力。类型: 交互式