名称: ai-shaped-readiness-advisor 描述: 评估您的产品工作是 AI-first 还是 AI-shaped。评分 5 个核心能力并推荐下一个要构建的能力。 类型: 交互式
目的
评估您的产品工作是 “AI-first”(使用 AI 自动化现有任务更快)还是 “AI-shaped”(从根本上重新设计产品团队围绕 AI 能力运作的方式)。使用此评估来评估您在 2026 年 5 个基本 PM 能力 上的就绪性,识别差距,并获得关于首先构建哪个能力的具体建议。
关键区别: AI-first 是可爱的(使用 Copilot 更快地编写 PRDs)。AI-shaped 是生存(构建一个人类和 AI 都信任的持久“现实层”,编排 AI 工作流,压缩学习周期)。
这不是关于 AI 工具——而是关于 围绕 AI 作为共同智能的组织重新设计。此交互式技能指导您完成成熟度评估,然后推荐您的下一步行动。
关键概念
AI-First 与 AI-Shaped
| 维度 | AI-First(可爱) | AI-Shaped(生存) |
|---|---|---|
| 心态 | 自动化现有任务 | 重新设计工作方式 |
| 目标 | 加快工件创建 | 压缩学习周期 |
| AI 角色 | 任务助手 | 战略共同智能 |
| 优势 | 临时效率提升 | 可防御的竞争护城河 |
| 示例 | “Copilot 以 2 倍速度编写 PRDs” | “AI 代理在 48 小时内验证假设,而不是 3 周” |
关键洞察: 如果竞争对手可以通过投入人力来复制您的 AI 使用,那不是差异化——只是效率(在几个月内成为基础要求)。
5 个基本 PM 能力(2026)
这些能力定义了 AI-shaped 产品工作。您将评估每个的成熟度。
1. 上下文设计
构建一个持久 “现实层”,人类和 AI 都可以信任——将 AI 注意力视为稀缺资源并有意分配。
包括内容:
- 记录什么是真实的 vs. 假设的
- 不可变约束(技术、监管、战略)
- 操作术语表(共享定义)
- 证据标准(什么算作验证)
- 上下文边界(什么持久化 vs. 检索)
- 内存架构(短期对话 + 长期持久)
- 检索策略(语义搜索、上下文检索)
关键原则: “如果您不能指出证据、约束和定义,您就没有上下文。您只有感觉。”
关键区别:上下文填充 vs. 上下文工程
- 上下文填充(AI-first): 无意图地塞入大量内容(“粘贴整个 PRD”)
- 上下文工程(AI-shaped): 为注意力塑造结构(有界领域、有意图检索)
5 个诊断问题:
- 这支持什么具体决策?
- 检索能否替代持久化?
- 谁拥有上下文边界?
- 如果排除这个会失败什么?
- 我们是在修复结构还是避免它?
AI-first 版本: 将 PRDs 粘贴到 ChatGPT;无上下文边界;"越多越好"心态 AI-shaped 版本: CLAUDE.md 文件、证据数据库、AI 代理引用的约束注册表;两层内存架构;研究→计划→重置→实现周期以防止上下文腐烂
深入探讨: 参见 context-engineering-advisor 获取诊断上下文填充和实施内存架构的详细指导。
2. 代理编排
创建可重复、可追溯的 AI 工作流(不是一次性提示)。
包括内容:
- 定义工作流循环:研究 → 综合 → 批判 → 决策 → 记录理由
- 每个步骤展示其工作(可追溯推理)
- 工作流一致运行(相同输入 = 可预测过程)
- 版本控制的提示和代理
关键原则: 一次性提示是战术性的。编排的工作流是战略性的。
AI-first 版本: “让 ChatGPT 分析此用户反馈” AI-shaped 版本: 自动化工作流,摄入反馈、标记主题、生成假设、标记矛盾、记录决策
3. 结果加速
使用 AI 压缩 学习周期(不仅仅是加速任务)。
包括内容:
- 消除验证延迟(PoL 探针在几天内运行,而不是几周)
- 移除批准延迟(AI 预先验证约束)
- 减少会议开销(异步 AI 综合替代状态会议)
关键原则: 有目的地做更少。AI 移除瓶颈,不生成更多工作。
AI-first 版本: “AI 更快地编写用户故事” AI-shaped 版本: “AI 过夜运行可行性检查,消除 2 周的技术发现”
4. 团队-AI 促进
重新设计团队系统,使 AI 作为 共同智能 运作,而不是责任屏蔽。
包括内容:
- 审查规范(谁检查 AI 输出、何时、如何)
- 证据标准(AI 必须引用来源,不产生幻觉)
- 决策权限(AI 推荐,人类决定——清晰边界)
- 心理安全(团队可以挑战 AI 而不感到"愚蠢")
关键原则: AI 放大判断,不替代责任。
AI-first 版本: “我使用了 AI” 作为糟糕输出的借口 AI-shaped 版本: 清晰审查协议;AI 输出被视为需要人工验证的草稿
5. 战略差异化
超越效率,创造 可防御的竞争优势。
包括内容:
- 新客户能力(用户现在能做什么以前不能做的?)
- 工作流重新布线(竞争对手无法复制而不完全重新设计的流程)
- 竞争对手无法匹配的经济学(通过 AI 实现 10 倍成本优势)
关键原则: “如果竞争对手可以通过投入人力来复制它,那不是差异化。”
AI-first 版本: “我们使用 AI 编写更好的文档” AI-shaped 版本: “我们在 2 天内验证产品假设,而行业标准是 3 周——每季度发布 6 倍更多已验证功能”
反模式(这不是什么)
- 不是关于 AI 工具: 使用 Claude vs. ChatGPT 不重要。重新设计工作流重要。
- 不是关于速度: 以 2 倍速度编写 PRDs 不具战略性,如果 PRDs 不是瓶颈。
- 不是关于自动化: 自动化糟糕流程只是放大糟糕。
- 不是关于替代人类: AI-shaped 组织增强判断,不消除它。
何时使用此技能
✅ 在以下情况使用:
- 您在使用 AI 工具但未看到战略优势
- 您怀疑自己是"AI-first"(效率)但想成为"AI-shaped"(转型)
- 您需要优先考虑下一个要构建的 AI 能力
- 领导层问"我们如何使用 AI?"而您不确定如何战略性地回答
- 您想评估团队在 AI 驱动产品工作方面的就绪性
❌ 不在以下情况使用:
- 您尚未开始使用 AI(首先使用基本工具)
- 您正在寻找工具推荐(这是关于组织设计,不是工具)
- 您需要战术性"如何编写提示"指导(使用相关技能)
促进真相来源
使用 workshop-facilitation 作为此技能的默认交互协议。
它定义:
- 会话提示 + 进入模式(引导、上下文转储、最佳猜测)
- 单问题轮次与自然语言提示
- 进度标签(例如,上下文 Qx/8 和评分 Qx/5)
- 中断处理和暂停/恢复行为
- 决策点的编号建议
- 常规问题的快速选择编号响应选项(当有用时包括
其他(指定))
此文件定义领域特定评估内容。如果有冲突,遵循此文件的领域逻辑。
应用
此交互式技能使用 自适应提问 来评估您在 5 个能力上的成熟度,然后推荐优先事项。
促进协议(强制)
- 每轮询问恰好 一个问题。
- 在询问下一个问题之前等待用户的答案。
- 使用自然语言问题(主要问题不使用速记标签)。如果需要,包括示例响应格式。
- 在每轮显示进度,使用面向用户的标签:
上下文 Qx/8在上下文收集期间评分 Qx/5在成熟度评分期间- 当实用时包括"剩余问题"。
- 不在面向用户的提示中使用内部阶段标签(如"步骤 0"),除非用户询问内部结构详情。
- 对于成熟度评分问题,首先呈现简洁的 1-4 选项;仅在请求时分享完整标准详情。
- 对于上下文问题,当实用时提供简洁编号快速选择选项,加上
其他(指定)用于开放答案。接受多选回复,如1,3或1 和 3。 - 仅在决策点给出编号建议,不是在每个答案后。
- 决策点包括:
- 在完整上下文摘要后
- 在 5 维成熟度概况后
- 在优先级选择和行动计划路径选择期间
- 当显示建议时,清晰枚举(
1.,2.,3.)并接受选择,如#1,1,1 和 3,1,3, 或自定义文本。 - 如果选择多个选项,合成组合路径并继续。
- 如果提供自定义文本,将其映射到最近的有效路径并继续,不强制重新输入。
- 中断处理是强制的:如果用户询问元问题(“还剩多少?”,“为什么这个标签?”,“暂停”),首先直接回答,然后重述当前进度并用待处理问题恢复。
- 如果用户说停止或暂停,立即停止评估并等待显式恢复。
- 如果用户要求"一次一个问题",为该会话保持该模式,除非他们显式退出。
- 在任何评估问题前,给一个简短提示关于时间/长度,并让用户选择进入模式。
会话开始:提示 + 进入模式(强制)
代理开场提示(首先使用此):
"在开始前快速提示:这通常需要约 7-10 分钟,最多 13 个问题(8 个上下文 + 5 个评分)。
您想如何做?
- 引导模式:我将一次问一个问题。
- 上下文转储:您粘贴您已知的内容,我将跳过任何冗余的。
- 最佳猜测模式:我将做出合理假设在缺失细节处,标记它们,并继续前进。"
接受选择为 #1, 1, 1 和 3, 1,3, 或自定义文本。
模式行为:
- 如果引导模式: 按书面运行步骤 0,然后评分。
- 如果上下文转储: 请求粘贴上下文一次,总结它,识别差距,并:
- 跳过任何已回答的上下文问题。
- 仅询问所需的最少缺失上下文(0-2 个澄清问题)。
- 一旦上下文足够,移动到评分。
- 如果最佳猜测模式: 请求最小可行起始输入(角色/团队 + 主要目标),然后:
- 使用合理默认推断缺失细节。
- 将每个推断项标记为
假设。 - 为每个假设包括置信度标签(
高,中,低)。 - 继续前进而不阻塞未知。
在最终摘要中,当使用上下文转储或最佳猜测模式时,包括 需要验证的假设 部分。
步骤 0: 收集上下文
代理询问:
使用此精确序列收集上下文,一次一个问题:
- “您今天在使用哪些 AI 工具?”
- “您的团队今天通常如何使用 AI:一次性提示、可重用模板,还是多步骤工作流?”
- “谁今天一致使用 AI:只有您、PMs,还是跨职能团队?”
- “您的团队上大约有多少 PMs、工程师和设计师?”
- “您处于哪个阶段:初创、增长,还是企业?”
- “如何做决策:集中式、分布式,还是共识驱动?”
- “您试图通过 AI 构建什么竞争优势?”
- “今天最大的瓶颈是减慢学习和迭代的什么?”
在问题 8 后,用 4 行总结回来:
- 当前 AI 使用模式
- 团队上下文
- 战略意图
- 主要瓶颈
步骤 1: 上下文设计成熟度
代理询问:
让我们评估您的 上下文设计 能力——您构建"现实层"的能力如何,人类和 AI 都可以信任,以及您是在做 上下文填充(无意图的大量内容)还是 上下文工程(为注意力塑造结构)。
哪个陈述最好描述您的当前状态?
-
级别 1(AI-First / 上下文填充): “我每次需要时都将整个文档粘贴到 ChatGPT。无共享知识库。无上下文边界。”
- 现实:一次性提示,无持久性;"越多越好"心态
- 问题:AI 无记忆;您不断重复自己;上下文填充降低注意力
- 上下文工程差距: 无答案到 5 个诊断问题;持久化一切"以防万一"
-
级别 2(新兴 / 早期结构): “我们有一些文档(PRDs、战略备忘录),但它们是分散的。无一致格式。开始注意到上下文填充问题(模糊响应、标准化重试)。”
- 现实:上下文存在但未为 AI 消费结构化;无检索策略
- 问题:AI 无法可靠找到或信任信息;混合始终需要与临时上下文
- 上下文工程差距: 无上下文边界所有者;无持久化 vs. 检索的区别
-
级别 3(过渡 / 上下文工程新兴): “我们已开始使用 CLAUDE.md 文件和项目指令。约束注册表存在。我们正在识别什么持久化 vs. 检索。实验研究→计划→重置→实现周期。”
- 现实:结构化上下文出现,但不全面;上下文边界定义但未完全执行
- 问题:覆盖不全;一些领域记录良好,其他感觉驱动;不一致检索实践
- 上下文工程进展: 能回答 3-4 个诊断问题;上下文边界所有者分配;开始使用两层内存
-
级别 4(AI-Shaped / 上下文工程掌握): “我们维护一个持久现实层:约束注册表(20+ 条目)、证据数据库、操作术语表(30+ 术语)。两层内存架构(短期对话 + 长期持久 via 向量 DB)。上下文边界定义并拥有。AI 代理自动引用这些。我们使用研究→计划→重置→实现以防止上下文腐烂。”
- 现实:全面、版本控制的上下文,人类和 AI 都信任;有意图检索(不是完整性)
- 结果:AI 以高置信度运作;减少幻觉和返工;令牌使用优化;无上下文填充
- 上下文工程掌握: 能回答所有 5 个诊断问题;上下文边界每季度审计;定量效率追踪:(准确性 × 连贯性) / (令牌 × 延迟)
选择您的级别: [1, 2, 3, 或 4]
注意: 如果您选择级别 1-2 并在上下文填充中挣扎,考虑使用 context-engineering-advisor 来诊断和修复上下文囤积障碍,然后继续。
用户响应: [选择]
代理记录: 上下文设计成熟度 = [级别 X]
步骤 2: 代理编排成熟度
代理询问:
现在评估 代理编排——您是否有可重复的 AI 工作流还是只有一次性提示。
哪个陈述最好描述您的当前状态?
-
级别 1(AI-First): “我根据需要将提示键入 ChatGPT。无保存工作流或模板。”
- 现实:战术性、临时使用
- 问题:不一致结果;无法扩展或审计
-
级别 2(新兴): “我有一些保存的提示我重用。可能有些自定义 GPTs 或 Claude 项目。”
- 现实:可重复提示,但不是完整工作流
- 问题:每个步骤是手动的;无编排
-
级别 3(过渡): “我们已构建一些多步骤工作流(研究 → 综合 → 批判)。在 Notion 或 Linear 等工具中追踪。”
- 现实:工作流存在但需要手动交接
- 问题:仍然每一步有人类参与;未完全自动化
-
级别 4(AI-Shaped): “我们有编排的 AI 工作流,自主运行:研究 → 综合 → 批判 → 决策 → 记录理由。每个步骤可追溯且版本控制。”
- 现实:工作流一致运行;在每一步展示其工作
- 结果:可靠、可审计、可扩展的 AI 流程
选择您的级别: [1, 2, 3, 或 4]
用户响应: [选择]
代理记录: 代理编排成熟度 = [级别 X]
步骤 3: 结果加速成熟度
代理询问:
接下来,结果加速——您是在使用 AI 压缩学习周期,还是只是加速任务?
哪个陈述最好描述您的当前状态?
-
级别 1(AI-First): “AI 帮助我更快编写文档(PRDs、用户故事)。每周节省我几小时。”
- 现实:在工件创建上的效率提升
- 问题:文档不是瓶颈;学习周期未变
-
级别 2(新兴): “AI 帮助研究和综合(总结用户反馈、分析竞争对手)。节省研究时间。”
- 现实:适度学习加速
- 问题:仍然顺序;AI 不消除验证延迟
-
级别 3(过渡): “我们使用 AI 更快速运行实验(PoL 探针、可行性检查)。将验证时间从几周减到几天。”
- 现实:学习周期压缩
- 问题:尚未系统化;仅应用于一些实验
-
级别 4(AI-Shaped): “AI 系统移除瓶颈:过夜可行性检查、异步综合替代会议、自动化验证约束。学习周期 5-10 倍更快。”
- 现实:如何学习的基本重新设计
- 结果:比竞争对手快 6 倍发布已验证功能
选择您的级别: [1, 2, 3, 或 4]
用户响应: [选择]
代理记录: 结果加速成熟度 = [级别 X]
步骤 4: 团队-AI 促进成熟度
代理询问:
现在评估 团队-AI 促进——您重新设计团队系统使 AI 作为共同智能的能力如何。
哪个陈述最好描述您的当前状态?
-
级别 1(AI-First): “我私下使用 AI。团队不知道或不使用它。无共享规范。”
- 现实:个人工具使用,无团队集成
- 问题:不一致质量;对 AI 输出无责任
-
级别 2(新兴): “团队使用 AI,但无正式审查过程。‘我使用了 AI’ 被随意提及。”
- 现实:意识但无结构
- 问题:AI 输出被视为最终;错误滑过
-
级别 3(过渡): “我们有审查规范出现(AI 输出是草稿,不是最终)。证据标准讨论但未编纂。”
- 现实:文化转变在进行中
- 问题:规范是非正式的;不是每个人都遵循它们
-
级别 4(AI-Shaped): “清晰协议:AI 输出需要人工验证,证据标准编纂,决策权限明确(AI 推荐,人类决定)。团队将 AI 视为共同智能。”
- 现实:AI 集成到团队操作系统中
- 结果:高质量输出;维持心理安全
选择您的级别: [1, 2, 3, 或 4]
用户响应: [选择]
代理记录: 团队-AI 促进成熟度 = [级别 X]
步骤 5: 战略差异化成熟度
代理询问:
最后,战略差异化——您是在创造可防御的竞争优势,还是只是效率提升?
哪个陈述最好描述您的当前状态?
-
级别 1(AI-First): “我们使用 AI 工作更快(编写更好文档、更快响应客户)。仅效率提升。”
- 现实:基础要求改进
- 问题:竞争对手可在几个月内复制
-
级别 2(新兴): “AI 使我们能做以前不能做的事(分析 10 倍更多数据、测试更多假设)。新能力,但竞争对手可复制。”
- 现实:能力扩展,但不可防御
- 问题:无护城河;竞争对手雇更多人匹配
-
级别 3(过渡): “我们已围绕 AI 重新设计一些工作流(例如,在 2 天内验证假设 vs. 3 周)。开始创造分离。”
- 现实:工作流优势出现
- 问题:尚未系统化;仅应用于部分领域
-
级别 4(AI-Shaped): “我们从根本上重新布线了我们如何操作:客户获得在其他地方无法获得的能力,我们的学习周期比行业标准快 10 倍,我们的经济学好 5 倍。竞争对手无法复制而不完全组织重新设计。”
- 现实:可防御的竞争护城河
- 结果:随时间复合的战略优势
选择您的级别: [1, 2, 3, 或 4]
用户响应: [选择]
代理记录: 战略差异化成熟度 = [级别 X]
步骤 6: 评估成熟度概况
代理合成:
这是您的 AI-Shaped 就绪性概况:
┌─────────────────────────────┬───────┬──────────┐
│ 能力 │ 级别 │ 成熟度 │
├─────────────────────────────┼───────┼──────────┤
│ 1. 上下文设计 │ X │ [标签] │
│ 2. 代理编排 │ X │ [标签] │
│ 3. 结果加速 │ X │ [标签] │
│ 4. 团队-AI 促进 │ X │ [标签] │
│ 5. 战略差异化 │ X │ [标签] │
└─────────────────────────────┴───────┴──────────┘
整体评估: [AI-First / 新兴 / 过渡 / AI-Shaped]
成熟度标签:
- 级别 1: AI-First(仅效率)
- 级别 2: 新兴(早期能力)
- 级别 3: 过渡(重新设计进行中)
- 级别 4: AI-Shaped(战略转型)
整体评估逻辑:
- AI-First: 平均级别 1-1.5(大多数级别 1)
- 新兴: 平均级别 2-2.5(大多数级别 2)
- 过渡: 平均级别 3-3.5(大多数级别 3)
- AI-Shaped: 平均级别 3.5-4(大多数级别 4)
步骤 7: 识别优先级差距
代理询问:
基于您的成熟度概况,您应首先优先考虑哪个能力?
代理分析依赖:
依赖逻辑:
- 上下文设计是基础 — 如果级别 1-2,这必须是优先级 #1(代理编排和结果加速依赖它)
- 代理编排实现结果加速 — 如果上下文设计是级别 3+,但代理编排是级别 1-2,优先编排
- 团队-AI 促进是平行的 — 可与其他并行发展,但需要规模
- 战略差异化需要其他能力级别 3+ — 在构建基础能力前不聚焦于此
代理推荐:
基于您的概况,我推荐首先聚焦于 [能力名称],因为:
选项 1: 上下文设计(如果级别 1-2)
- 为什么: 没有持久上下文,AI 在感觉上运作。每个工作流将脆弱。
- 影响: 解锁代理编排和结果加速
- 下一步: 构建 CLAUDE.md 文件、开始约束注册表、创建操作术语表
选项 2: 代理编排(如果上下文是 3+,但编排是 1-2)
- 为什么: 您有上下文,但无可重复工作流。扩展需要编排。
- 影响: 将一次性提示转变为可靠、可追溯的工作流
- 下一步: 记录您最频繁的 AI 工作流、版本控制提示、添加可追溯性
选项 3: 结果加速(如果上下文 + 编排是 3+)
- 为什么: 您有基础设施;现在压缩学习周期
- 影响: 从学习速度出现战略优势
- 下一步: 识别学习周期中最大瓶颈,设计 AI 工作流消除它
选项 4: 团队-AI 促进(如果使用是个人的,不是团队范围的)
- 为什么: 如果只有您是 AI-shaped,无法扩展;团队必须采用
- 影响: 组织转型,不仅个人生产力
- 下一步: 建立审查规范、编纂证据标准、创建决策权限框架
选项 5: 战略差异化(如果所有其他能力是 3+)
- 为什么: 您有基础;现在构建护城河
- 影响: 创造可防御的竞争优势
- 下一步: 识别竞争对手无法复制的工作流,设计 AI 启用的客户能力
您想聚焦于哪个?
选项:
- 接受推荐 — [代理提供详细行动计划]
- 选择不同优先级 — [代理警告依赖但允许覆盖]
- 同时聚焦多个 — [代理建议如果可行,并行轨道]
用户响应: [选择]
步骤 8: 生成行动计划
代理提供基于选择优先级的定制行动计划:
如果优先级 = 上下文设计
目标: 构建一个持久"现实层",人类和 AI 都信任——从上下文填充移动到上下文工程。
预阶段: 诊断上下文填充(如果需要) 如果您在级别 1-2,首先诊断上下文填充症状:
- 运行通过 5 个诊断问题(参见
context-engineering-advisor) - 识别您持久化什么应该检索
- 分配上下文边界所有者
- 创建上下文清单(什么始终需要 vs. 临时)
阶段 1: 记录约束(第 1 周)
- 创建约束注册表:
- 技术约束(APIs、数据模型、性能限制)
- 监管约束(GDPR、HIPAA 等)
- 战略约束(我们将/不构建 X)
- 对每个约束应用诊断问题 #4:“如果排除这个会失败什么?”
- 格式:结构化文件 AI 代理可解析(YAML、JSON,或带有前置事项的 Markdown)
- 在 Git 中版本控制
阶段 2: 构建操作术语表(第 2 周)
- 列出您的团队使用的 top 20-30 术语(例如,“用户”、“客户”、“激活”、“流失”)
- 明确地定义每个(避免"取决于")
- 包括边缘情况和异常
- 添加到 CLAUDE.md 或项目指令
- 这成为您的 长期持久内存(声明性内存)
阶段 3: 建立证据标准 + 上下文边界(第 3 周)
- 定义什么算作验证:
- 用户反馈:“X 用户说 Y”(带有引用)
- 分析:“指标 Z 变化了 N%”(带有仪表板链接)
- 竞争情报:“竞争对手 A 发布了 B”(带有来源)
- 拒绝:“我认为”、“我们感觉”、“似乎像”
- 使用 5 个诊断问题定义上下文边界:
- 每个上下文支持什么具体决策?
- 检索能否替代持久化?
- 谁拥有上下文边界?
- 创建上下文清单文档
- 编纂到团队文档中
阶段 4: 实施内存架构 + 工作流(第 4 周)
- 设置两层内存:
- 短期(对话): 总结/截断对话的旧部分
- 长期(持久): 约束注册表 + 操作术语表(考虑向量数据库用于检索)
- 实施研究→计划→重置→实现周期:
- 更新 AI 提示以引用约束注册表和术语表
- 测试:让 AI 在做出推荐时引用约束
- 测量:AI 输出引用证据 vs. 产生幻觉的百分比;令牌使用效率
成功标准:
- ✅ 约束注册表有 20+ 条目
- ✅ 操作术语表有 20-30 术语
- ✅ 证据标准记录并共享
- ✅ 上下文清单创建(始终需要 vs. 临时)
- ✅ 上下文边界所有者分配
- ✅ 两层内存架构实施
- ✅ 研究→计划→重置→实现周期在 1 个工作流上测试
- ✅ AI 代理自动引用这些
- ✅ 令牌使用下降 30%+(较少上下文填充)
- ✅ 输出一致性上升(较少重试)
相关技能:
context-engineering-advisor(交互式) — 深度探讨诊断上下文填充和实施内存架构problem-statement.md— 在框架问题前定义约束epic-hypothesis.md— 基于证据的假设写作
如果优先级 = 代理编排
目标: 将一次性提示转变为可重复、可追溯的 AI 工作流。
阶段 1: 映射当前工作流(第 1 周)
- 选择您最频繁的 AI 使用案例(例如,“分析用户反馈”)
- 记录您当前采取的每一步:
- 复制/粘贴反馈到 ChatGPT
- 请求主题
- 手动分类
- 编写摘要
- 识别痛点(手动交接、不一致结果)
阶段 2: 设计编排工作流(第 2 周)
- 定义工作流循环:
- 研究: AI 阅读所有反馈(结构化输入)
- 综合: AI 识别主题(带有证据)
- 批判: AI 标记矛盾或弱信号
- 决策: 人类审查并决定下一步
- 记录: AI 记录理由和来源
- 每个步骤必须可追溯(展示来源、推理)
阶段 3: 构建和测试(第 3 周)
- 实施工作流使用:
- Claude 项目(如果简单)
- 自定义 GPTs(如果中等)
- API 编排(如果复杂)
- 在 3 个过去例子上运行;与手动过程比较
- 测量:节省时间、改进一致性、添加可追溯性
阶段 4: 文档和扩展(第 4 周)
- 版本控制提示(Git)
- 为团队记录工作流步骤
- 培训 2 个队友;观察结果
- 基于反馈迭代
成功标准:
- ✅ 至少 1 个工作流一致运行(相同输入 → 可预测过程)
- ✅ 每个步骤可追溯(AI 引用来源)
- ✅ 团队无需您的参与即可复制工作流
相关技能:
pol-probe-advisor.md— 使用编排工作流进行验证实验
如果优先级 = 结果加速
目标: 使用 AI 压缩学习周期,不仅仅是加速任务。
阶段 1: 识别瓶颈(第 1 周)
- 映射您当前的学习周期(例如,假设 → 实验 → 分析 → 决策)
- 时间每个步骤
- 识别最慢步骤(通常:验证延迟、批准延迟,或会议开销)
阶段 2: 设计 AI 干预(第 2 周)
- 问:“如果这个步骤过夜发生会怎样?”
- 可行性检查:AI 在 2 小时内探索 vs. 2 天
- 用户研究综合:AI 分析在 1 小时内 vs. 1 周
- 批准预检查:AI 在会议前验证约束
- 设计最小 AI 工作流以消除瓶颈
阶段 3: 运行试点(第 3 周)
- 在 1 个真实倡议上测试 AI 干预
- 测量周期时间:之前 vs. 之后
- 验证质量:AI 是否维持严谨,还是走捷径?
阶段 4: 扩展(第 4 周)
- 如果成功(周期时间下降 50%+,质量维持),应用到 3 个更多倡议
- 记录工作流
- 培训团队
成功标准:
- ✅ 学习周期在至少 1 个倡议上压缩 50%+
- ✅ 质量维持(无妥协严谨的捷径)
- ✅ 团队采用加速工作流
相关技能:
pol-probe.md— 使用 AI 更快运行 PoL 探针discovery-process.md— 使用 AI 压缩发现周期
如果优先级 = 团队-AI 促进
目标: 重新设计团队系统,使 AI 作为共同智能运作,而不是责任屏蔽。
阶段 1: 建立审查规范(第 1 周)
- 编纂规则:“AI 输出是草稿,不是最终”
- 定义审查协议:
- 谁审查 AI 输出?(同行、主要 PM、跨职能伙伴)
- 何时?(在外部共享前、在决策前)
- 检查什么?(准确性、完整性、证据引用)
- 与团队分享,获得支持
阶段 2: 设置证据标准(第 2 周)
- AI 必须引用来源(无幻觉)
- 拒绝说"我认为"或"似乎"的输出
- 要求:“根据 [来源],[事实]”
- 添加到团队操作文档
阶段 3: 定义决策权限(第 3 周)
- 澄清:AI 推荐,人类决定
- 记录谁有权覆盖 AI 推荐(PM、团队领导、跨职能共识)
- 创建升级路径(如果 AI 和人类不同意怎么办?)
阶段 4: 构建心理安全(第 4 周)
- 团队练习:分享一个您发现的 AI 错误(使发现错误正常化)
- 奖励批判性思维(“好抓住那个 AI 幻觉!”)
- 避免:“为什么您不直接使用 AI?”(羞辱)
成功标准:
- ✅ 审查规范记录并团队遵循
- ✅ 证据标准编纂
- ✅ 决策权限清晰
- ✅ 团队舒适地挑战 AI 输出
相关技能:
problem-statement.md— 基于证据的问题框架epic-hypothesis.md— 可测试、基于证据的假设
如果优先级 = 战略差异化
目标: 创造可防御的竞争优势,不仅仅是效率提升。
阶段 1: 识别护城河机会(第 1 周)
- 问:“我们能做什么用 AI,竞争对手无法通过增加人力复制?”
- 新客户能力(例如,“AI 顾问建议个性化路线图”)
- 工作流重新布线(例如,“在 2 天内验证产品想法 vs. 3 周”)
- 经济学转变(例如,“通过 AI 自动化以 SMB 价格交付企业功能”)
- 列出 5 个候选
- 按可防御性优先排序(复制多难?)
阶段 2: 设计 AI 启用能力(第 2 周)
- 选择 top 候选
- 设计端到端工作流:
- 客户体验什么?
- AI 幕后做什么?
- 需要什么人类判断?
- 草图 MVP(最小可行护城河)
阶段 3: 构建和测试(第 3-4 周)
- 构建原型(可以是 PoL 探针,不是生产)
- 与 5 个客户测试
- 测量:这创造竞争对手无法匹配的价值吗?
阶段 4: 验证护城河(第 5 周)
- 问:“竞争对手将如何复制这个?”
- 如果答案是"雇更多人",不是护城河
- 如果答案是"完全重新设计他们的组织",您有护城河
- 记录竞争分析
- 决定:构建完整版本、调整方向,或放弃
成功标准:
- ✅ 识别至少 1 个 AI 启用能力,竞争对手无法轻易复制
- ✅ 与客户验证(他们看到价值)
- ✅ 确认可防御性(竞争对手分析)
相关技能:
positioning-statement.md— 阐明您的 AI 驱动差异化jobs-to-be-done.md— 理解客户雇佣您的 AI 能力做什么
步骤 9: 追踪进展(可选)
代理提供:
您想让我为您的 AI-shaped 转型创建一个进展追踪器吗?
追踪器包括:
- 当前成熟度级别(基线)
- 目标成熟度级别(目标状态)
- 行动计划里程碑(从步骤 8)
- 审查节奏(每周、每月)
选项:
- 是,创建追踪器 — [代理生成 Markdown 清单]
- 否,我将单独追踪 — [代理提供摘要]
示例
示例 1: 早期阶段初创公司(AI-First → 新兴)
上下文:
- 团队:2 PMs, 5 工程师
- AI 使用:ChatGPT 用于编写 PRDs,偶尔 Copilot 使用
- 目标:比更大竞争对手更快移动
评估结果:
- 上下文设计:级别 1(无结构化上下文)
- 代理编排:级别 1(一次性提示)
- 结果加速:级别 1(文档更快,但学习周期未变)
- 团队-AI 促进:级别 2(团队使用 AI,但无规范)
- 战略差异化:级别 1(仅效率)
推荐: 首先聚焦于 上下文设计。
行动计划(第 1-4 周):
- 第 1 周:创建约束注册表(10 个技术约束)
- 第 2 周:构建操作术语表(15 个术语)
- 第 3 周:建立证据标准
- 第 4 周:添加上下文到 CLAUDE.md 文件
结果: 4 周后,上下文设计 → 级别 3。解锁下季度的代理编排。
示例 2: 增长阶段公司(过渡 → AI-Shaped)
上下文:
- 团队:10 PMs, 50 工程师, 5 设计师
- AI 使用:Claude 项目用于研究,自定义工作流出现
- 目标:在 IPO 前构建可防御的 AI 优势
评估结果:
- 上下文设计:级别 3(结构化上下文,不全面)
- 代理编排:级别 3(一些工作流,手动交接)
- 结果加速:级别 2(适度增益,非系统化)
- 团队-AI 促进:级别 3(规范出现,未编纂)
- 战略差异化:级别 2(新能力,但可复制)
推荐: 聚焦于 结果加速(基础扎实;现在压缩学习周期)。
行动计划(第 1-4 周):
- 第 1 周:识别瓶颈(发现周期需要 3 周)
- 第 2 周:设计 AI 工作流过夜运行可行性检查
- 第 3 周:在 1 个倡议上试点(减少周期到 5 天)
- 第 4 周:扩展到 3 个倡议
结果: 学习周期快 5 倍 → 与竞争对手的战略分离 → 级别 4 结果加速 + 级别 3 战略差异化。
示例 3: 企业公司(AI-First,分散使用)
上下文:
- 团队:50 PMs, 300 工程师
- AI 使用:个别 PMs 使用各种工具,无一致性
- 目标:标准化 AI 使用,创建跨职能工作流
评估结果:
- 上下文设计:级别 2(文档存在,未为 AI 结构化)
- 代理编排:级别 1(无共享工作流)
- 结果加速:级别 1(仅效率)
- 团队-AI 促进:级别 1(私人使用,无规范)
- 战略差异化:级别 1(无优势)
推荐: 首先聚焦于 团队-AI 促进(分布式团队在构建基础设施前需要共享规范)。
行动计划(第 1-4 周):
- 第 1 周:建立审查规范(AI 输出是草稿)
- 第 2 周:设置证据标准(AI 必须引用来源)
- 第 3 周:定义决策权限(AI 推荐,领导决定)
- 第 4 周:与 3 个团队试点,收集反馈
结果: 团队-AI 促进 → 级别 3。为下步上下文设计和代理编排创建基础。
常见陷阱
1. 将效率误认为差异化
失败模式: “我们使用 AI 以 2 倍速度编写 PRDs——我们是 AI-shaped!”
后果: 竞争对手在 3 个月内复制;无持久优势。
修复: 问:“如果竞争对手投入 2 倍更多人力于此,他们能匹配我们吗?” 如果 yes,是效率(基础要求),不是差异化。
2. 跳过上下文设计
失败模式: 构建代理编排工作流而无持久上下文。
后果: AI 工作流脆弱(上下文变化打破一切)。
修复: 上下文设计是基础。不要跳过它。首先构建约束注册表、术语表、证据标准。
3. 个人使用,不是团队转型
失败模式: “我是 AI-shaped,但我的团队不是。”
后果: 无法扩展;工作流当您度假时失效。
修复: 优先考虑团队-AI 促进。共享规范 > 个人生产力。
4. 聚焦于工具,不是工作流
失败模式: “我们应该使用 Claude 还是 ChatGPT?”
后果: 工具辩论分散组织重新设计的注意力。
修复: 工具不重要。工作流重要。聚焦于重新设计工作如何完成,不是您使用哪个 AI。
5. 速度超过学习
失败模式: “AI 帮助我们更快发布!”
后果: 更快发布错误的东西(如果您不压缩学习周期)。
修复: 结果加速是关于更快学习,不是更快构建。在几天内验证假设,不是几周。
参考
相关技能
- context-engineering-advisor(交互式) — 深度探讨上下文设计能力: 诊断上下文填充、实施内存架构、使用研究→计划→重置→实现周期
- problem-statement(组件) — 基于证据的问题框架(上下文设计)
- epic-hypothesis(组件) — 带有证据标准的可测试假设
- pol-probe-advisor(交互式) — 使用 AI 压缩验证周期(结果加速)
- discovery-process(工作流) — 应用 AI-shaped 原则到发现
- positioning-statement(组件) — 阐明您的 AI 驱动差异化(战略差异化)
外部框架
- Dean Peters — AI-First Is Cute. AI-Shaped Is Survival. (Dean Peters’ Substack, 2026)
- Dean Peters — Context Stuffing Is Not Context Engineering (Dean Peters’ Substack, 2026) — 深度探讨能力 #1(上下文设计)
进一步阅读
- Ethan Mollick — Co-Intelligence(关于 AI 作为共同智能,不是替代)
- Shreyas Doshi — Twitter 线程关于 PM 判断增强与 AI
- Lenny Rachitsky — 通讯采访 AI 前瞻的 PMs