name: prototyping-pretotyping description: 当在构建前廉价测试想法时使用（预原型使用假门、管家式MVP、纸质原型）以验证可取性/可行性，选择适当的原型保真度（纸质/可点击/编码），运行实验测试假设（需求、定价、工作流程），或当用户提到原型、MVP、假门测试、管家、Wizard of Oz、落地页测试、烟雾测试，或询问“如何在构建前验证这个想法？”。

原型设计与预原型设计

目的

在投入全面开发前测试假设和验证想法。使用最便宜/最快的方法回答关键问题：人们想要这个吗？他们会付费吗？我们能构建它吗？它解决问题吗？预原型（用最小实现测试想法）在原型（构建部分版本）之前，原型在产品（构建完整版本）之前。

何时使用

使用此技能当：

高不确定性：关于客户需求、付费意愿或技术可行性的未验证假设
构建前：在承诺资源进行全面开发前需要证据
功能优先级：多个想法，资源有限，想要数据决定
转向评估：考虑重大方向变更，需要快速验证
利益相关者认可：需要证据说服高管/投资者想法值得追求
定价不确定性：不知道客户会支付多少
工作流程验证：不确定提议的解决方案是否适合用户心智模型
技术未知：新技术、集成或架构方法需要验证

常见触发点：

“我们应该构建这个功能吗？”
“客户会为此付费吗？”
“我们能在构建前验证需求吗？”
“测试这个想法的最便宜方式是什么？”
“我们如何知道用户想要这个？”

这是什么？

预原型（Alberto Savoia）：在构建前测试人们是否想要它

伪造：落地页、“立即购买”按钮显示“即将推出”、模拟视频
管家：在自动化前手动提供服务（例如，在构建算法前手动策划结果）
Wizard of Oz：表面自动化但幕后人工驱动

原型设计：构建部分/简化版本来测试假设

纸质原型：草图、线框图（测试工作流程/结构）
可点击原型：Figma/InVision（测试交互/流程）
编码原型：具有有限功能的工作软件（测试可行性/性能）

示例 - 测试餐包配送服务：

预原型（第1周）：落地页“注册农场到餐桌餐包，即将推出” → 测量注册数
管家式MVP（第2-4周）：手动采购原料，打包盒子，交付给10个注册者 → 验证付费意愿，学习工作流程
原型（第2-3个月）：为50个客户构建供应商数据库、基本物流系统 → 测试可扩展性
产品（第4个月+）：具有自动采购、路由、订阅管理的完整平台

工作流程

复制此清单并跟踪进度：

原型设计进度：
- [ ] 步骤1：识别要测试的最风险假设
- [ ] 步骤2：选择预原型/原型方法
- [ ] 步骤3：设计和构建最小测试
- [ ] 步骤4：运行实验并收集数据
- [ ] 步骤5：分析结果并决定（转向/坚持/迭代）

步骤1：识别最风险假设

列出所有假设（需求、定价、可行性、工作流程），按风险排名（错误的概率 × 如果错误的影响）。首先测试最高风险假设。参见常见模式了解按领域的典型假设。

步骤2：选择方法

将测试方法与假设和可用时间/预算匹配。参见保真度阶梯选择适当的保真度。使用resources/template.md进行实验设计。

步骤3：设计和构建最小测试

创建测试假设的最简单工件（落地页、纸质原型、手动服务交付）。参见resources/methodology.md了解具体技术（假门、管家、Wizard of Oz、纸质原型设计）。

步骤4：运行实验

部署测试，招募参与者，收集定量数据（注册数、点击、支付）和定性反馈（访谈、观察）。瞄准最小可行数据（定性 n=5-10，定量 n=100+ 以获得置信度）。

步骤5：分析并决定

比较结果与成功标准（例如，“10% 转化验证需求”）。决定：转向（假设错误，改变方向），坚持（假设验证，构建它），或迭代（混合结果，改进并重新测试）。

常见模式

按假设类型：

需求假设（“人们想要这个”）：

测试：假门（落地页带“立即购买” → “即将推出”）、预购、等待列表注册
成功标准：X% 转化，Z 天内 Y 注册
示例：“2 周内 10% 访客注册等待列表” → 验证需求

定价假设（“人们会支付 $X”）：

测试：落地页上的价格，提供多个价格层级，A/B 测试价格
成功标准：目标价格下 Z% 转化
示例：“5% 以 $49/月转化” → 验证定价

工作流程假设（“这以直观方式解决用户问题”）：

测试：纸质原型，使用可点击原型完成任务
成功标准：X% 在没有帮助的情况下完成任务，<Y 错误
示例：“8/10 用户在 <2 分钟内完成结账，0 错误” → 验证工作流程

可行性假设（“我们可以构建/扩展这个”）：

测试：技术尖峰，使用真实数据的概念验证，先手动管家
成功标准：性能达到目标，成本在预算内
示例：“API 在 100 请求/秒下响应 <500ms” → 验证架构

价值主张假设（“客户偏好我们的方法而非替代方案”）：

测试：A/B 测试消息传递，带不同价值主张的假门，竞争对手比较
成功标准：X% 选择我们的方法而非替代方案
示例：“60% 选择 AI 驱动 vs 手动策划” → 验证差异化

保真度阶梯

为你的问题选择适当的保真度：

级别0 - 预原型（小时到天，$0-100）：

什么：在构建任何真实东西前伪造它
何时：测试需求、定价、价值主张假设
方法：带注册的落地页、假门测试、手动管家、视频模拟
示例：Dropbox 视频在产品构建前展示它（3-4 分钟视频，70K→75K 注册过夜）
优点：最快、最便宜，测试真实行为（非意见）
缺点：无法详细测试工作流程/可用性，如果太欺骗性有伦理问题

级别1 - 纸质原型（小时到天，$0-50）：

什么：手绘草图、打印屏幕、索引卡
何时：测试工作流程、信息架构、屏幕结构
方法：用户“点击”纸张，你交换屏幕，观察混淆点
示例：银行应用 - 10 个纸质屏幕，用户模拟存款支票，识别 3 个工作流程问题
优点：非常快速迭代（几分钟重绘），迫使专注于结构而非抛光
缺点：无法测试真实交互（手势、动画），用户感觉“假”

级别2 - 可点击原型（天到周，$100-500）：

什么：在 Figma、InVision、Adobe XD 中的交互式模拟（无真实代码）
何时：测试用户流、UI 模式、交互设计
方法：用户完成任务，测量成功率/时间/错误，收集反馈
示例：电子商务结账 - 8 个屏幕，20 用户，15% 在发货时放弃 → 在编码前修复
优点：看起来真实，易于更改，测试真实交互
缺点：无法测试性能、可扩展性、后端复杂性

级别3 - 编码原型（周到月，$1K-10K）：

什么：具有有限功能的工作软件，数据子集，快捷方式
何时：测试技术可行性、性能、集成复杂性
方法：真实用户真实任务，测量延迟/错误，验证架构
示例：搜索引擎 - 10K 文档（非 10M），50 用户，<1s 响应时间 → 验证方法
优点：测试真实技术约束，揭示集成问题
缺点：更昂贵/耗时，如果错误更难丢弃

级别4 - 最小可行产品（月，$10K-100K+）：

什么：向真实客户交付核心价值的最简单版本
何时：假设大部分验证，准备市场反馈
方法：发布给小段，测量保留/收入，基于数据迭代
示例：Instagram v1 - 仅照片滤镜（无视频、故事、reels），发布给小群
优点：真实市场验证、收入、学习
缺点：昂贵、时间线长、公开承诺

防护栏

确保质量：

首先测试最风险假设：不要测试你自信的
- ✓ “客户会支付 $X 吗？”（高不确定性）在“我们能让按钮变蓝吗？”（琐碎）之前
- ❌ 在验证核心价值前测试次要细节
匹配保真度到问题：不要为手头问题过度构建
- ✓ 纸质原型用于测试工作流程（小时），编码原型用于测试延迟（周）
- ❌ 构建编码原型测试用户是否喜欢颜色方案（过度）
在测试前设成功标准：避免确认偏误
- ✓ “10% 转化验证需求”（测试前决定）
- ❌ “7% 转化？那很好！”（测试后移动目标）
用真实目标用户测试：朋友/家人不代表
- ✓ 从目标段招募（例如，企业 IT 买家用于 B2B SaaS）
- ❌ 测试任何可用的人（创始人的礼貌朋友）
观察行为，非意见：人们做什么 > 人们说什么
- ✓ “50% 点击‘立即购买’但 0% 完成支付”（真实行为 → 定价/摩擦问题）
- ❌ “用户说他们会支付 $99/月”（意见，不可靠预测器）
对伪造透明：伦理预原型
- ✓ “注册早期访问”或“即将推出”（诚实）
- ❌ 为假产品收费信用卡，承诺不会构建的功能（欺诈）
丢弃原型：不要将原型代码转为生产
- ✓ 验证后以适当架构重建
- ❌ 发布原型代码（技术债、安全问题、可扩展性问题）
快速迭代：多个廉价测试 > 一个昂贵测试
- ✓ 1 周内 5 个纸质原型（测试 5 种方法）
- ❌ 1 个月内 1 个编码原型（锁定一种方法）

快速参考

资源：

快速开始：resources/template.md - 预原型/原型实验模板
高级技术：resources/methodology.md - 假门、管家、Wizard of Oz、纸质原型设计、A/B 测试
质量检查：resources/evaluators/rubric_prototyping_pretotyping.json - 评估标准

成功标准：

✓ 识别 3-5 个最风险假设按风险排名（错误的概率 × 如果错误的影响）
✓ 用所需最小保真度测试最高风险假设
✓ 在测试前设定量化成功标准（例如，“10% 转化”）
✓ 招募真实目标用户（定性 n=5-10，定量 n=100+）
✓ 收集行为数据（点击、转化、任务完成），非仅意见
✓ 结果清晰到足以做出转向/坚持/迭代决定
✓ 记录学习并与团队分享

常见错误：

❌ 在风险假设前测试琐碎假设
❌ 过度构建（编码原型当落地页足够）
❌ 无成功标准（测试后移动目标）
❌ 用错误用户测试（朋友/家人，非目标段）
❌ 依赖意见（“用户说他们喜欢它”）非行为
❌ 分析瘫痪（完美原型在测试前）
❌ 发布原型代码（技术债灾难）
❌ 测试一件事当可以测试多件（廉价测试串行/并行运行）

何时使用替代方案：

A/B 测试：当有现有产品/流量，想比较变体
调查：当需要规模化定量意见（但记住：意见 ≠ 行为）
客户访谈：当理解问题/背景，非测试解决方案
Beta 测试：当产品大部分构建，需要反馈抛光/错误
烟雾测试：同预原型（在构建前测量兴趣）

原型设计与预原型设计Skill prototyping-pretotyping