AI就绪性评估顾问Skill ai-shaped-readiness-advisor

这个技能用于评估产品团队在人工智能应用方面的成熟度,区分AI-first(效率导向)和AI-shaped(战略转型)模式。通过评估五个核心产品经理能力,提供个性化改进建议和具体行动计划,帮助团队构建可防御的竞争优势。关键词:AI评估,产品管理,AI就绪性,PM能力,AI-shaped,AI-first,人工智能应用,战略转型。

AI应用 0 次安装 0 次浏览 更新于 3/18/2026

名称: ai-shaped-readiness-advisor 描述: 评估您的产品工作是 AI-first 还是 AI-shaped。评分 5 个核心能力并推荐下一个要构建的能力。 类型: 交互式

目的

评估您的产品工作是 “AI-first”(使用 AI 自动化现有任务更快)还是 “AI-shaped”(从根本上重新设计产品团队围绕 AI 能力运作的方式)。使用此评估来评估您在 2026 年 5 个基本 PM 能力 上的就绪性,识别差距,并获得关于首先构建哪个能力的具体建议。

关键区别: AI-first 是可爱的(使用 Copilot 更快地编写 PRDs)。AI-shaped 是生存(构建一个人类和 AI 都信任的持久“现实层”,编排 AI 工作流,压缩学习周期)。

这不是关于 AI 工具——而是关于 围绕 AI 作为共同智能的组织重新设计。此交互式技能指导您完成成熟度评估,然后推荐您的下一步行动。

关键概念

AI-First 与 AI-Shaped

维度 AI-First(可爱) AI-Shaped(生存)
心态 自动化现有任务 重新设计工作方式
目标 加快工件创建 压缩学习周期
AI 角色 任务助手 战略共同智能
优势 临时效率提升 可防御的竞争护城河
示例 “Copilot 以 2 倍速度编写 PRDs” “AI 代理在 48 小时内验证假设,而不是 3 周”

关键洞察: 如果竞争对手可以通过投入人力来复制您的 AI 使用,那不是差异化——只是效率(在几个月内成为基础要求)。


5 个基本 PM 能力(2026)

这些能力定义了 AI-shaped 产品工作。您将评估每个的成熟度。

1. 上下文设计

构建一个持久 “现实层”,人类和 AI 都可以信任——将 AI 注意力视为稀缺资源并有意分配。

包括内容:

  • 记录什么是真实的 vs. 假设的
  • 不可变约束(技术、监管、战略)
  • 操作术语表(共享定义)
  • 证据标准(什么算作验证)
  • 上下文边界(什么持久化 vs. 检索)
  • 内存架构(短期对话 + 长期持久)
  • 检索策略(语义搜索、上下文检索)

关键原则: “如果您不能指出证据、约束和定义,您就没有上下文。您只有感觉。”

关键区别:上下文填充 vs. 上下文工程

  • 上下文填充(AI-first): 无意图地塞入大量内容(“粘贴整个 PRD”)
  • 上下文工程(AI-shaped): 为注意力塑造结构(有界领域、有意图检索)

5 个诊断问题:

  1. 这支持什么具体决策?
  2. 检索能否替代持久化?
  3. 谁拥有上下文边界?
  4. 如果排除这个会失败什么?
  5. 我们是在修复结构还是避免它?

AI-first 版本: 将 PRDs 粘贴到 ChatGPT;无上下文边界;"越多越好"心态 AI-shaped 版本: CLAUDE.md 文件、证据数据库、AI 代理引用的约束注册表;两层内存架构;研究→计划→重置→实现周期以防止上下文腐烂

深入探讨: 参见 context-engineering-advisor 获取诊断上下文填充和实施内存架构的详细指导。


2. 代理编排

创建可重复、可追溯的 AI 工作流(不是一次性提示)。

包括内容:

  • 定义工作流循环:研究 → 综合 → 批判 → 决策 → 记录理由
  • 每个步骤展示其工作(可追溯推理)
  • 工作流一致运行(相同输入 = 可预测过程)
  • 版本控制的提示和代理

关键原则: 一次性提示是战术性的。编排的工作流是战略性的。

AI-first 版本: “让 ChatGPT 分析此用户反馈” AI-shaped 版本: 自动化工作流,摄入反馈、标记主题、生成假设、标记矛盾、记录决策


3. 结果加速

使用 AI 压缩 学习周期(不仅仅是加速任务)。

包括内容:

  • 消除验证延迟(PoL 探针在几天内运行,而不是几周)
  • 移除批准延迟(AI 预先验证约束)
  • 减少会议开销(异步 AI 综合替代状态会议)

关键原则: 有目的地做更少。AI 移除瓶颈,不生成更多工作。

AI-first 版本: “AI 更快地编写用户故事” AI-shaped 版本: “AI 过夜运行可行性检查,消除 2 周的技术发现”


4. 团队-AI 促进

重新设计团队系统,使 AI 作为 共同智能 运作,而不是责任屏蔽。

包括内容:

  • 审查规范(谁检查 AI 输出、何时、如何)
  • 证据标准(AI 必须引用来源,不产生幻觉)
  • 决策权限(AI 推荐,人类决定——清晰边界)
  • 心理安全(团队可以挑战 AI 而不感到"愚蠢")

关键原则: AI 放大判断,不替代责任。

AI-first 版本: “我使用了 AI” 作为糟糕输出的借口 AI-shaped 版本: 清晰审查协议;AI 输出被视为需要人工验证的草稿


5. 战略差异化

超越效率,创造 可防御的竞争优势

包括内容:

  • 新客户能力(用户现在能做什么以前不能做的?)
  • 工作流重新布线(竞争对手无法复制而不完全重新设计的流程)
  • 竞争对手无法匹配的经济学(通过 AI 实现 10 倍成本优势)

关键原则: “如果竞争对手可以通过投入人力来复制它,那不是差异化。”

AI-first 版本: “我们使用 AI 编写更好的文档” AI-shaped 版本: “我们在 2 天内验证产品假设,而行业标准是 3 周——每季度发布 6 倍更多已验证功能”


反模式(这不是什么)

  • 不是关于 AI 工具: 使用 Claude vs. ChatGPT 不重要。重新设计工作流重要。
  • 不是关于速度: 以 2 倍速度编写 PRDs 不具战略性,如果 PRDs 不是瓶颈。
  • 不是关于自动化: 自动化糟糕流程只是放大糟糕。
  • 不是关于替代人类: AI-shaped 组织增强判断,不消除它。

何时使用此技能

在以下情况使用:

  • 您在使用 AI 工具但未看到战略优势
  • 您怀疑自己是"AI-first"(效率)但想成为"AI-shaped"(转型)
  • 您需要优先考虑下一个要构建的 AI 能力
  • 领导层问"我们如何使用 AI?"而您不确定如何战略性地回答
  • 您想评估团队在 AI 驱动产品工作方面的就绪性

不在以下情况使用:

  • 您尚未开始使用 AI(首先使用基本工具)
  • 您正在寻找工具推荐(这是关于组织设计,不是工具)
  • 您需要战术性"如何编写提示"指导(使用相关技能)

促进真相来源

使用 workshop-facilitation 作为此技能的默认交互协议。

它定义:

  • 会话提示 + 进入模式(引导、上下文转储、最佳猜测)
  • 单问题轮次与自然语言提示
  • 进度标签(例如,上下文 Qx/8 和评分 Qx/5)
  • 中断处理和暂停/恢复行为
  • 决策点的编号建议
  • 常规问题的快速选择编号响应选项(当有用时包括 其他(指定)

此文件定义领域特定评估内容。如果有冲突,遵循此文件的领域逻辑。

应用

此交互式技能使用 自适应提问 来评估您在 5 个能力上的成熟度,然后推荐优先事项。

促进协议(强制)

  1. 每轮询问恰好 一个问题
  2. 在询问下一个问题之前等待用户的答案。
  3. 使用自然语言问题(主要问题不使用速记标签)。如果需要,包括示例响应格式。
  4. 在每轮显示进度,使用面向用户的标签:
    • 上下文 Qx/8 在上下文收集期间
    • 评分 Qx/5 在成熟度评分期间
    • 当实用时包括"剩余问题"。
  5. 不在面向用户的提示中使用内部阶段标签(如"步骤 0"),除非用户询问内部结构详情。
  6. 对于成熟度评分问题,首先呈现简洁的 1-4 选项;仅在请求时分享完整标准详情。
  7. 对于上下文问题,当实用时提供简洁编号快速选择选项,加上 其他(指定) 用于开放答案。接受多选回复,如 1,31 和 3
  8. 仅在决策点给出编号建议,不是在每个答案后。
  9. 决策点包括:
    • 在完整上下文摘要后
    • 在 5 维成熟度概况后
    • 在优先级选择和行动计划路径选择期间
  10. 当显示建议时,清晰枚举(1., 2., 3.)并接受选择,如 #1, 1, 1 和 3, 1,3, 或自定义文本。
  11. 如果选择多个选项,合成组合路径并继续。
  12. 如果提供自定义文本,将其映射到最近的有效路径并继续,不强制重新输入。
  13. 中断处理是强制的:如果用户询问元问题(“还剩多少?”,“为什么这个标签?”,“暂停”),首先直接回答,然后重述当前进度并用待处理问题恢复。
  14. 如果用户说停止或暂停,立即停止评估并等待显式恢复。
  15. 如果用户要求"一次一个问题",为该会话保持该模式,除非他们显式退出。
  16. 在任何评估问题前,给一个简短提示关于时间/长度,并让用户选择进入模式。

会话开始:提示 + 进入模式(强制)

代理开场提示(首先使用此):

"在开始前快速提示:这通常需要约 7-10 分钟,最多 13 个问题(8 个上下文 + 5 个评分)。

您想如何做?

  1. 引导模式:我将一次问一个问题。
  2. 上下文转储:您粘贴您已知的内容,我将跳过任何冗余的。
  3. 最佳猜测模式:我将做出合理假设在缺失细节处,标记它们,并继续前进。"

接受选择为 #1, 1, 1 和 3, 1,3, 或自定义文本。

模式行为:

  • 如果引导模式: 按书面运行步骤 0,然后评分。
  • 如果上下文转储: 请求粘贴上下文一次,总结它,识别差距,并:
    • 跳过任何已回答的上下文问题。
    • 仅询问所需的最少缺失上下文(0-2 个澄清问题)。
    • 一旦上下文足够,移动到评分。
  • 如果最佳猜测模式: 请求最小可行起始输入(角色/团队 + 主要目标),然后:
    • 使用合理默认推断缺失细节。
    • 将每个推断项标记为 假设
    • 为每个假设包括置信度标签(, , )。
    • 继续前进而不阻塞未知。

在最终摘要中,当使用上下文转储或最佳猜测模式时,包括 需要验证的假设 部分。


步骤 0: 收集上下文

代理询问:

使用此精确序列收集上下文,一次一个问题:

  1. “您今天在使用哪些 AI 工具?”
  2. “您的团队今天通常如何使用 AI:一次性提示、可重用模板,还是多步骤工作流?”
  3. “谁今天一致使用 AI:只有您、PMs,还是跨职能团队?”
  4. “您的团队上大约有多少 PMs、工程师和设计师?”
  5. “您处于哪个阶段:初创、增长,还是企业?”
  6. “如何做决策:集中式、分布式,还是共识驱动?”
  7. “您试图通过 AI 构建什么竞争优势?”
  8. “今天最大的瓶颈是减慢学习和迭代的什么?”

在问题 8 后,用 4 行总结回来:

  • 当前 AI 使用模式
  • 团队上下文
  • 战略意图
  • 主要瓶颈

步骤 1: 上下文设计成熟度

代理询问:

让我们评估您的 上下文设计 能力——您构建"现实层"的能力如何,人类和 AI 都可以信任,以及您是在做 上下文填充(无意图的大量内容)还是 上下文工程(为注意力塑造结构)。

哪个陈述最好描述您的当前状态?

  1. 级别 1(AI-First / 上下文填充): “我每次需要时都将整个文档粘贴到 ChatGPT。无共享知识库。无上下文边界。”

    • 现实:一次性提示,无持久性;"越多越好"心态
    • 问题:AI 无记忆;您不断重复自己;上下文填充降低注意力
    • 上下文工程差距: 无答案到 5 个诊断问题;持久化一切"以防万一"
  2. 级别 2(新兴 / 早期结构): “我们有一些文档(PRDs、战略备忘录),但它们是分散的。无一致格式。开始注意到上下文填充问题(模糊响应、标准化重试)。”

    • 现实:上下文存在但未为 AI 消费结构化;无检索策略
    • 问题:AI 无法可靠找到或信任信息;混合始终需要与临时上下文
    • 上下文工程差距: 无上下文边界所有者;无持久化 vs. 检索的区别
  3. 级别 3(过渡 / 上下文工程新兴): “我们已开始使用 CLAUDE.md 文件和项目指令。约束注册表存在。我们正在识别什么持久化 vs. 检索。实验研究→计划→重置→实现周期。”

    • 现实:结构化上下文出现,但不全面;上下文边界定义但未完全执行
    • 问题:覆盖不全;一些领域记录良好,其他感觉驱动;不一致检索实践
    • 上下文工程进展: 能回答 3-4 个诊断问题;上下文边界所有者分配;开始使用两层内存
  4. 级别 4(AI-Shaped / 上下文工程掌握): “我们维护一个持久现实层:约束注册表(20+ 条目)、证据数据库、操作术语表(30+ 术语)。两层内存架构(短期对话 + 长期持久 via 向量 DB)。上下文边界定义并拥有。AI 代理自动引用这些。我们使用研究→计划→重置→实现以防止上下文腐烂。”

    • 现实:全面、版本控制的上下文,人类和 AI 都信任;有意图检索(不是完整性)
    • 结果:AI 以高置信度运作;减少幻觉和返工;令牌使用优化;无上下文填充
    • 上下文工程掌握: 能回答所有 5 个诊断问题;上下文边界每季度审计;定量效率追踪:(准确性 × 连贯性) / (令牌 × 延迟)

选择您的级别: [1, 2, 3, 或 4]

注意: 如果您选择级别 1-2 并在上下文填充中挣扎,考虑使用 context-engineering-advisor 来诊断和修复上下文囤积障碍,然后继续。

用户响应: [选择]

代理记录: 上下文设计成熟度 = [级别 X]


步骤 2: 代理编排成熟度

代理询问:

现在评估 代理编排——您是否有可重复的 AI 工作流还是只有一次性提示。

哪个陈述最好描述您的当前状态?

  1. 级别 1(AI-First): “我根据需要将提示键入 ChatGPT。无保存工作流或模板。”

    • 现实:战术性、临时使用
    • 问题:不一致结果;无法扩展或审计
  2. 级别 2(新兴): “我有一些保存的提示我重用。可能有些自定义 GPTs 或 Claude 项目。”

    • 现实:可重复提示,但不是完整工作流
    • 问题:每个步骤是手动的;无编排
  3. 级别 3(过渡): “我们已构建一些多步骤工作流(研究 → 综合 → 批判)。在 Notion 或 Linear 等工具中追踪。”

    • 现实:工作流存在但需要手动交接
    • 问题:仍然每一步有人类参与;未完全自动化
  4. 级别 4(AI-Shaped): “我们有编排的 AI 工作流,自主运行:研究 → 综合 → 批判 → 决策 → 记录理由。每个步骤可追溯且版本控制。”

    • 现实:工作流一致运行;在每一步展示其工作
    • 结果:可靠、可审计、可扩展的 AI 流程

选择您的级别: [1, 2, 3, 或 4]

用户响应: [选择]

代理记录: 代理编排成熟度 = [级别 X]


步骤 3: 结果加速成熟度

代理询问:

接下来,结果加速——您是在使用 AI 压缩学习周期,还是只是加速任务?

哪个陈述最好描述您的当前状态?

  1. 级别 1(AI-First): “AI 帮助我更快编写文档(PRDs、用户故事)。每周节省我几小时。”

    • 现实:在工件创建上的效率提升
    • 问题:文档不是瓶颈;学习周期未变
  2. 级别 2(新兴): “AI 帮助研究和综合(总结用户反馈、分析竞争对手)。节省研究时间。”

    • 现实:适度学习加速
    • 问题:仍然顺序;AI 不消除验证延迟
  3. 级别 3(过渡): “我们使用 AI 更快速运行实验(PoL 探针、可行性检查)。将验证时间从几周减到几天。”

    • 现实:学习周期压缩
    • 问题:尚未系统化;仅应用于一些实验
  4. 级别 4(AI-Shaped): “AI 系统移除瓶颈:过夜可行性检查、异步综合替代会议、自动化验证约束。学习周期 5-10 倍更快。”

    • 现实:如何学习的基本重新设计
    • 结果:比竞争对手快 6 倍发布已验证功能

选择您的级别: [1, 2, 3, 或 4]

用户响应: [选择]

代理记录: 结果加速成熟度 = [级别 X]


步骤 4: 团队-AI 促进成熟度

代理询问:

现在评估 团队-AI 促进——您重新设计团队系统使 AI 作为共同智能的能力如何。

哪个陈述最好描述您的当前状态?

  1. 级别 1(AI-First): “我私下使用 AI。团队不知道或不使用它。无共享规范。”

    • 现实:个人工具使用,无团队集成
    • 问题:不一致质量;对 AI 输出无责任
  2. 级别 2(新兴): “团队使用 AI,但无正式审查过程。‘我使用了 AI’ 被随意提及。”

    • 现实:意识但无结构
    • 问题:AI 输出被视为最终;错误滑过
  3. 级别 3(过渡): “我们有审查规范出现(AI 输出是草稿,不是最终)。证据标准讨论但未编纂。”

    • 现实:文化转变在进行中
    • 问题:规范是非正式的;不是每个人都遵循它们
  4. 级别 4(AI-Shaped): “清晰协议:AI 输出需要人工验证,证据标准编纂,决策权限明确(AI 推荐,人类决定)。团队将 AI 视为共同智能。”

    • 现实:AI 集成到团队操作系统中
    • 结果:高质量输出;维持心理安全

选择您的级别: [1, 2, 3, 或 4]

用户响应: [选择]

代理记录: 团队-AI 促进成熟度 = [级别 X]


步骤 5: 战略差异化成熟度

代理询问:

最后,战略差异化——您是在创造可防御的竞争优势,还是只是效率提升?

哪个陈述最好描述您的当前状态?

  1. 级别 1(AI-First): “我们使用 AI 工作更快(编写更好文档、更快响应客户)。仅效率提升。”

    • 现实:基础要求改进
    • 问题:竞争对手可在几个月内复制
  2. 级别 2(新兴): “AI 使我们能做以前不能做的事(分析 10 倍更多数据、测试更多假设)。新能力,但竞争对手可复制。”

    • 现实:能力扩展,但不可防御
    • 问题:无护城河;竞争对手雇更多人匹配
  3. 级别 3(过渡): “我们已围绕 AI 重新设计一些工作流(例如,在 2 天内验证假设 vs. 3 周)。开始创造分离。”

    • 现实:工作流优势出现
    • 问题:尚未系统化;仅应用于部分领域
  4. 级别 4(AI-Shaped): “我们从根本上重新布线了我们如何操作:客户获得在其他地方无法获得的能力,我们的学习周期比行业标准快 10 倍,我们的经济学好 5 倍。竞争对手无法复制而不完全组织重新设计。”

    • 现实:可防御的竞争护城河
    • 结果:随时间复合的战略优势

选择您的级别: [1, 2, 3, 或 4]

用户响应: [选择]

代理记录: 战略差异化成熟度 = [级别 X]


步骤 6: 评估成熟度概况

代理合成:

这是您的 AI-Shaped 就绪性概况:

┌─────────────────────────────┬───────┬──────────┐
│ 能力                        │ 级别 │ 成熟度  │
├─────────────────────────────┼───────┼──────────┤
│ 1. 上下文设计              │   X   │ [标签]  │
│ 2. 代理编排                │   X   │ [标签]  │
│ 3. 结果加速                │   X   │ [标签]  │
│ 4. 团队-AI 促进            │   X   │ [标签]  │
│ 5. 战略差异化              │   X   │ [标签]  │
└─────────────────────────────┴───────┴──────────┘

整体评估: [AI-First / 新兴 / 过渡 / AI-Shaped]

成熟度标签:

  • 级别 1: AI-First(仅效率)
  • 级别 2: 新兴(早期能力)
  • 级别 3: 过渡(重新设计进行中)
  • 级别 4: AI-Shaped(战略转型)

整体评估逻辑:

  • AI-First: 平均级别 1-1.5(大多数级别 1)
  • 新兴: 平均级别 2-2.5(大多数级别 2)
  • 过渡: 平均级别 3-3.5(大多数级别 3)
  • AI-Shaped: 平均级别 3.5-4(大多数级别 4)

步骤 7: 识别优先级差距

代理询问:

基于您的成熟度概况,您应首先优先考虑哪个能力?

代理分析依赖:

依赖逻辑:

  1. 上下文设计是基础 — 如果级别 1-2,这必须是优先级 #1(代理编排和结果加速依赖它)
  2. 代理编排实现结果加速 — 如果上下文设计是级别 3+,但代理编排是级别 1-2,优先编排
  3. 团队-AI 促进是平行的 — 可与其他并行发展,但需要规模
  4. 战略差异化需要其他能力级别 3+ — 在构建基础能力前不聚焦于此

代理推荐:

基于您的概况,我推荐首先聚焦于 [能力名称],因为:

选项 1: 上下文设计(如果级别 1-2)

  • 为什么: 没有持久上下文,AI 在感觉上运作。每个工作流将脆弱。
  • 影响: 解锁代理编排和结果加速
  • 下一步: 构建 CLAUDE.md 文件、开始约束注册表、创建操作术语表

选项 2: 代理编排(如果上下文是 3+,但编排是 1-2)

  • 为什么: 您有上下文,但无可重复工作流。扩展需要编排。
  • 影响: 将一次性提示转变为可靠、可追溯的工作流
  • 下一步: 记录您最频繁的 AI 工作流、版本控制提示、添加可追溯性

选项 3: 结果加速(如果上下文 + 编排是 3+)

  • 为什么: 您有基础设施;现在压缩学习周期
  • 影响: 从学习速度出现战略优势
  • 下一步: 识别学习周期中最大瓶颈,设计 AI 工作流消除它

选项 4: 团队-AI 促进(如果使用是个人的,不是团队范围的)

  • 为什么: 如果只有您是 AI-shaped,无法扩展;团队必须采用
  • 影响: 组织转型,不仅个人生产力
  • 下一步: 建立审查规范、编纂证据标准、创建决策权限框架

选项 5: 战略差异化(如果所有其他能力是 3+)

  • 为什么: 您有基础;现在构建护城河
  • 影响: 创造可防御的竞争优势
  • 下一步: 识别竞争对手无法复制的工作流,设计 AI 启用的客户能力

您想聚焦于哪个?

选项:

  1. 接受推荐 — [代理提供详细行动计划]
  2. 选择不同优先级 — [代理警告依赖但允许覆盖]
  3. 同时聚焦多个 — [代理建议如果可行,并行轨道]

用户响应: [选择]


步骤 8: 生成行动计划

代理提供基于选择优先级的定制行动计划:


如果优先级 = 上下文设计

目标: 构建一个持久"现实层",人类和 AI 都信任——从上下文填充移动到上下文工程。

预阶段: 诊断上下文填充(如果需要) 如果您在级别 1-2,首先诊断上下文填充症状:

  1. 运行通过 5 个诊断问题(参见 context-engineering-advisor)
  2. 识别您持久化什么应该检索
  3. 分配上下文边界所有者
  4. 创建上下文清单(什么始终需要 vs. 临时)

阶段 1: 记录约束(第 1 周)

  1. 创建约束注册表:
    • 技术约束(APIs、数据模型、性能限制)
    • 监管约束(GDPR、HIPAA 等)
    • 战略约束(我们将/不构建 X)
  2. 对每个约束应用诊断问题 #4:“如果排除这个会失败什么?”
  3. 格式:结构化文件 AI 代理可解析(YAML、JSON,或带有前置事项的 Markdown)
  4. 在 Git 中版本控制

阶段 2: 构建操作术语表(第 2 周)

  1. 列出您的团队使用的 top 20-30 术语(例如,“用户”、“客户”、“激活”、“流失”)
  2. 明确地定义每个(避免"取决于")
  3. 包括边缘情况和异常
  4. 添加到 CLAUDE.md 或项目指令
  5. 这成为您的 长期持久内存(声明性内存)

阶段 3: 建立证据标准 + 上下文边界(第 3 周)

  1. 定义什么算作验证:
    • 用户反馈:“X 用户说 Y”(带有引用)
    • 分析:“指标 Z 变化了 N%”(带有仪表板链接)
    • 竞争情报:“竞争对手 A 发布了 B”(带有来源)
  2. 拒绝:“我认为”、“我们感觉”、“似乎像”
  3. 使用 5 个诊断问题定义上下文边界:
    • 每个上下文支持什么具体决策?
    • 检索能否替代持久化?
    • 谁拥有上下文边界?
  4. 创建上下文清单文档
  5. 编纂到团队文档中

阶段 4: 实施内存架构 + 工作流(第 4 周)

  1. 设置两层内存:
    • 短期(对话): 总结/截断对话的旧部分
    • 长期(持久): 约束注册表 + 操作术语表(考虑向量数据库用于检索)
  2. 实施研究→计划→重置→实现周期:
    • 研究:允许混乱上下文收集
    • 计划:综合成高密度 SPEC.mdPLAN.md
    • 重置:清除上下文窗口
    • 实现:仅使用计划作为上下文
  3. 更新 AI 提示以引用约束注册表和术语表
  4. 测试:让 AI 在做出推荐时引用约束
  5. 测量:AI 输出引用证据 vs. 产生幻觉的百分比;令牌使用效率

成功标准:

  • ✅ 约束注册表有 20+ 条目
  • ✅ 操作术语表有 20-30 术语
  • ✅ 证据标准记录并共享
  • ✅ 上下文清单创建(始终需要 vs. 临时)
  • ✅ 上下文边界所有者分配
  • ✅ 两层内存架构实施
  • ✅ 研究→计划→重置→实现周期在 1 个工作流上测试
  • ✅ AI 代理自动引用这些
  • ✅ 令牌使用下降 30%+(较少上下文填充)
  • ✅ 输出一致性上升(较少重试)

相关技能:

  • context-engineering-advisor(交互式) — 深度探讨诊断上下文填充和实施内存架构
  • problem-statement.md — 在框架问题前定义约束
  • epic-hypothesis.md — 基于证据的假设写作

如果优先级 = 代理编排

目标: 将一次性提示转变为可重复、可追溯的 AI 工作流。

阶段 1: 映射当前工作流(第 1 周)

  1. 选择您最频繁的 AI 使用案例(例如,“分析用户反馈”)
  2. 记录您当前采取的每一步:
    • 复制/粘贴反馈到 ChatGPT
    • 请求主题
    • 手动分类
    • 编写摘要
  3. 识别痛点(手动交接、不一致结果)

阶段 2: 设计编排工作流(第 2 周)

  1. 定义工作流循环:
    • 研究: AI 阅读所有反馈(结构化输入)
    • 综合: AI 识别主题(带有证据)
    • 批判: AI 标记矛盾或弱信号
    • 决策: 人类审查并决定下一步
    • 记录: AI 记录理由和来源
  2. 每个步骤必须可追溯(展示来源、推理)

阶段 3: 构建和测试(第 3 周)

  1. 实施工作流使用:
    • Claude 项目(如果简单)
    • 自定义 GPTs(如果中等)
    • API 编排(如果复杂)
  2. 在 3 个过去例子上运行;与手动过程比较
  3. 测量:节省时间、改进一致性、添加可追溯性

阶段 4: 文档和扩展(第 4 周)

  1. 版本控制提示(Git)
  2. 为团队记录工作流步骤
  3. 培训 2 个队友;观察结果
  4. 基于反馈迭代

成功标准:

  • ✅ 至少 1 个工作流一致运行(相同输入 → 可预测过程)
  • ✅ 每个步骤可追溯(AI 引用来源)
  • ✅ 团队无需您的参与即可复制工作流

相关技能:

  • pol-probe-advisor.md — 使用编排工作流进行验证实验

如果优先级 = 结果加速

目标: 使用 AI 压缩学习周期,不仅仅是加速任务。

阶段 1: 识别瓶颈(第 1 周)

  1. 映射您当前的学习周期(例如,假设 → 实验 → 分析 → 决策)
  2. 时间每个步骤
  3. 识别最慢步骤(通常:验证延迟、批准延迟,或会议开销)

阶段 2: 设计 AI 干预(第 2 周)

  1. 问:“如果这个步骤过夜发生会怎样?”
    • 可行性检查:AI 在 2 小时内探索 vs. 2 天
    • 用户研究综合:AI 分析在 1 小时内 vs. 1 周
    • 批准预检查:AI 在会议前验证约束
  2. 设计最小 AI 工作流以消除瓶颈

阶段 3: 运行试点(第 3 周)

  1. 在 1 个真实倡议上测试 AI 干预
  2. 测量周期时间:之前 vs. 之后
  3. 验证质量:AI 是否维持严谨,还是走捷径?

阶段 4: 扩展(第 4 周)

  1. 如果成功(周期时间下降 50%+,质量维持),应用到 3 个更多倡议
  2. 记录工作流
  3. 培训团队

成功标准:

  • ✅ 学习周期在至少 1 个倡议上压缩 50%+
  • ✅ 质量维持(无妥协严谨的捷径)
  • ✅ 团队采用加速工作流

相关技能:

  • pol-probe.md — 使用 AI 更快运行 PoL 探针
  • discovery-process.md — 使用 AI 压缩发现周期

如果优先级 = 团队-AI 促进

目标: 重新设计团队系统,使 AI 作为共同智能运作,而不是责任屏蔽。

阶段 1: 建立审查规范(第 1 周)

  1. 编纂规则:“AI 输出是草稿,不是最终”
  2. 定义审查协议:
    • 谁审查 AI 输出?(同行、主要 PM、跨职能伙伴)
    • 何时?(在外部共享前、在决策前)
    • 检查什么?(准确性、完整性、证据引用)
  3. 与团队分享,获得支持

阶段 2: 设置证据标准(第 2 周)

  1. AI 必须引用来源(无幻觉)
  2. 拒绝说"我认为"或"似乎"的输出
  3. 要求:“根据 [来源],[事实]”
  4. 添加到团队操作文档

阶段 3: 定义决策权限(第 3 周)

  1. 澄清:AI 推荐,人类决定
  2. 记录谁有权覆盖 AI 推荐(PM、团队领导、跨职能共识)
  3. 创建升级路径(如果 AI 和人类不同意怎么办?)

阶段 4: 构建心理安全(第 4 周)

  1. 团队练习:分享一个您发现的 AI 错误(使发现错误正常化)
  2. 奖励批判性思维(“好抓住那个 AI 幻觉!”)
  3. 避免:“为什么您不直接使用 AI?”(羞辱)

成功标准:

  • ✅ 审查规范记录并团队遵循
  • ✅ 证据标准编纂
  • ✅ 决策权限清晰
  • ✅ 团队舒适地挑战 AI 输出

相关技能:

  • problem-statement.md — 基于证据的问题框架
  • epic-hypothesis.md — 可测试、基于证据的假设

如果优先级 = 战略差异化

目标: 创造可防御的竞争优势,不仅仅是效率提升。

阶段 1: 识别护城河机会(第 1 周)

  1. 问:“我们能做什么用 AI,竞争对手无法通过增加人力复制?”
    • 新客户能力(例如,“AI 顾问建议个性化路线图”)
    • 工作流重新布线(例如,“在 2 天内验证产品想法 vs. 3 周”)
    • 经济学转变(例如,“通过 AI 自动化以 SMB 价格交付企业功能”)
  2. 列出 5 个候选
  3. 按可防御性优先排序(复制多难?)

阶段 2: 设计 AI 启用能力(第 2 周)

  1. 选择 top 候选
  2. 设计端到端工作流:
    • 客户体验什么?
    • AI 幕后做什么?
    • 需要什么人类判断?
  3. 草图 MVP(最小可行护城河)

阶段 3: 构建和测试(第 3-4 周)

  1. 构建原型(可以是 PoL 探针,不是生产)
  2. 与 5 个客户测试
  3. 测量:这创造竞争对手无法匹配的价值吗?

阶段 4: 验证护城河(第 5 周)

  1. 问:“竞争对手将如何复制这个?”
    • 如果答案是"雇更多人",不是护城河
    • 如果答案是"完全重新设计他们的组织",您有护城河
  2. 记录竞争分析
  3. 决定:构建完整版本、调整方向,或放弃

成功标准:

  • ✅ 识别至少 1 个 AI 启用能力,竞争对手无法轻易复制
  • ✅ 与客户验证(他们看到价值)
  • ✅ 确认可防御性(竞争对手分析)

相关技能:

  • positioning-statement.md — 阐明您的 AI 驱动差异化
  • jobs-to-be-done.md — 理解客户雇佣您的 AI 能力做什么

步骤 9: 追踪进展(可选)

代理提供:

您想让我为您的 AI-shaped 转型创建一个进展追踪器吗?

追踪器包括:

  • 当前成熟度级别(基线)
  • 目标成熟度级别(目标状态)
  • 行动计划里程碑(从步骤 8)
  • 审查节奏(每周、每月)

选项:

  1. 是,创建追踪器 — [代理生成 Markdown 清单]
  2. 否,我将单独追踪 — [代理提供摘要]

示例

示例 1: 早期阶段初创公司(AI-First → 新兴)

上下文:

  • 团队:2 PMs, 5 工程师
  • AI 使用:ChatGPT 用于编写 PRDs,偶尔 Copilot 使用
  • 目标:比更大竞争对手更快移动

评估结果:

  • 上下文设计:级别 1(无结构化上下文)
  • 代理编排:级别 1(一次性提示)
  • 结果加速:级别 1(文档更快,但学习周期未变)
  • 团队-AI 促进:级别 2(团队使用 AI,但无规范)
  • 战略差异化:级别 1(仅效率)

推荐: 首先聚焦于 上下文设计

行动计划(第 1-4 周):

  • 第 1 周:创建约束注册表(10 个技术约束)
  • 第 2 周:构建操作术语表(15 个术语)
  • 第 3 周:建立证据标准
  • 第 4 周:添加上下文到 CLAUDE.md 文件

结果: 4 周后,上下文设计 → 级别 3。解锁下季度的代理编排。


示例 2: 增长阶段公司(过渡 → AI-Shaped)

上下文:

  • 团队:10 PMs, 50 工程师, 5 设计师
  • AI 使用:Claude 项目用于研究,自定义工作流出现
  • 目标:在 IPO 前构建可防御的 AI 优势

评估结果:

  • 上下文设计:级别 3(结构化上下文,不全面)
  • 代理编排:级别 3(一些工作流,手动交接)
  • 结果加速:级别 2(适度增益,非系统化)
  • 团队-AI 促进:级别 3(规范出现,未编纂)
  • 战略差异化:级别 2(新能力,但可复制)

推荐: 聚焦于 结果加速(基础扎实;现在压缩学习周期)。

行动计划(第 1-4 周):

  • 第 1 周:识别瓶颈(发现周期需要 3 周)
  • 第 2 周:设计 AI 工作流过夜运行可行性检查
  • 第 3 周:在 1 个倡议上试点(减少周期到 5 天)
  • 第 4 周:扩展到 3 个倡议

结果: 学习周期快 5 倍 → 与竞争对手的战略分离 → 级别 4 结果加速 + 级别 3 战略差异化。


示例 3: 企业公司(AI-First,分散使用)

上下文:

  • 团队:50 PMs, 300 工程师
  • AI 使用:个别 PMs 使用各种工具,无一致性
  • 目标:标准化 AI 使用,创建跨职能工作流

评估结果:

  • 上下文设计:级别 2(文档存在,未为 AI 结构化)
  • 代理编排:级别 1(无共享工作流)
  • 结果加速:级别 1(仅效率)
  • 团队-AI 促进:级别 1(私人使用,无规范)
  • 战略差异化:级别 1(无优势)

推荐: 首先聚焦于 团队-AI 促进(分布式团队在构建基础设施前需要共享规范)。

行动计划(第 1-4 周):

  • 第 1 周:建立审查规范(AI 输出是草稿)
  • 第 2 周:设置证据标准(AI 必须引用来源)
  • 第 3 周:定义决策权限(AI 推荐,领导决定)
  • 第 4 周:与 3 个团队试点,收集反馈

结果: 团队-AI 促进 → 级别 3。为下步上下文设计和代理编排创建基础。


常见陷阱

1. 将效率误认为差异化

失败模式: “我们使用 AI 以 2 倍速度编写 PRDs——我们是 AI-shaped!”

后果: 竞争对手在 3 个月内复制;无持久优势。

修复: 问:“如果竞争对手投入 2 倍更多人力于此,他们能匹配我们吗?” 如果 yes,是效率(基础要求),不是差异化。


2. 跳过上下文设计

失败模式: 构建代理编排工作流而无持久上下文。

后果: AI 工作流脆弱(上下文变化打破一切)。

修复: 上下文设计是基础。不要跳过它。首先构建约束注册表、术语表、证据标准。


3. 个人使用,不是团队转型

失败模式: “我是 AI-shaped,但我的团队不是。”

后果: 无法扩展;工作流当您度假时失效。

修复: 优先考虑团队-AI 促进。共享规范 > 个人生产力。


4. 聚焦于工具,不是工作流

失败模式: “我们应该使用 Claude 还是 ChatGPT?”

后果: 工具辩论分散组织重新设计的注意力。

修复: 工具不重要。工作流重要。聚焦于重新设计工作如何完成,不是您使用哪个 AI。


5. 速度超过学习

失败模式: “AI 帮助我们更快发布!”

后果: 更快发布错误的东西(如果您不压缩学习周期)。

修复: 结果加速是关于更快学习,不是更快构建。在几天内验证假设,不是几周。


参考

相关技能

  • context-engineering-advisor(交互式) — 深度探讨上下文设计能力: 诊断上下文填充、实施内存架构、使用研究→计划→重置→实现周期
  • problem-statement(组件) — 基于证据的问题框架(上下文设计)
  • epic-hypothesis(组件) — 带有证据标准的可测试假设
  • pol-probe-advisor(交互式) — 使用 AI 压缩验证周期(结果加速)
  • discovery-process(工作流) — 应用 AI-shaped 原则到发现
  • positioning-statement(组件) — 阐明您的 AI 驱动差异化(战略差异化)

外部框架

进一步阅读

  • Ethan MollickCo-Intelligence(关于 AI 作为共同智能,不是替代)
  • Shreyas Doshi — Twitter 线程关于 PM 判断增强与 AI
  • Lenny Rachitsky — 通讯采访 AI 前瞻的 PMs