name: prototyping-pretotyping description: 当在构建前廉价测试想法时使用(预原型使用假门、管家式MVP、纸质原型)以验证可取性/可行性,选择适当的原型保真度(纸质/可点击/编码),运行实验测试假设(需求、定价、工作流程),或当用户提到原型、MVP、假门测试、管家、Wizard of Oz、落地页测试、烟雾测试,或询问“如何在构建前验证这个想法?”。
原型设计与预原型设计
目录
目的
在投入全面开发前测试假设和验证想法。使用最便宜/最快的方法回答关键问题:人们想要这个吗?他们会付费吗?我们能构建它吗?它解决问题吗?预原型(用最小实现测试想法)在原型(构建部分版本)之前,原型在产品(构建完整版本)之前。
何时使用
使用此技能当:
- 高不确定性:关于客户需求、付费意愿或技术可行性的未验证假设
- 构建前:在承诺资源进行全面开发前需要证据
- 功能优先级:多个想法,资源有限,想要数据决定
- 转向评估:考虑重大方向变更,需要快速验证
- 利益相关者认可:需要证据说服高管/投资者想法值得追求
- 定价不确定性:不知道客户会支付多少
- 工作流程验证:不确定提议的解决方案是否适合用户心智模型
- 技术未知:新技术、集成或架构方法需要验证
常见触发点:
- “我们应该构建这个功能吗?”
- “客户会为此付费吗?”
- “我们能在构建前验证需求吗?”
- “测试这个想法的最便宜方式是什么?”
- “我们如何知道用户想要这个?”
这是什么?
预原型(Alberto Savoia):在构建前测试人们是否想要它
- 伪造:落地页、“立即购买”按钮显示“即将推出”、模拟视频
- 管家:在自动化前手动提供服务(例如,在构建算法前手动策划结果)
- Wizard of Oz:表面自动化但幕后人工驱动
原型设计:构建部分/简化版本来测试假设
- 纸质原型:草图、线框图(测试工作流程/结构)
- 可点击原型:Figma/InVision(测试交互/流程)
- 编码原型:具有有限功能的工作软件(测试可行性/性能)
示例 - 测试餐包配送服务:
- 预原型(第1周):落地页“注册农场到餐桌餐包,即将推出” → 测量注册数
- 管家式MVP(第2-4周):手动采购原料,打包盒子,交付给10个注册者 → 验证付费意愿,学习工作流程
- 原型(第2-3个月):为50个客户构建供应商数据库、基本物流系统 → 测试可扩展性
- 产品(第4个月+):具有自动采购、路由、订阅管理的完整平台
工作流程
复制此清单并跟踪进度:
原型设计进度:
- [ ] 步骤1:识别要测试的最风险假设
- [ ] 步骤2:选择预原型/原型方法
- [ ] 步骤3:设计和构建最小测试
- [ ] 步骤4:运行实验并收集数据
- [ ] 步骤5:分析结果并决定(转向/坚持/迭代)
步骤1:识别最风险假设
列出所有假设(需求、定价、可行性、工作流程),按风险排名(错误的概率 × 如果错误的影响)。首先测试最高风险假设。参见常见模式了解按领域的典型假设。
步骤2:选择方法
将测试方法与假设和可用时间/预算匹配。参见保真度阶梯选择适当的保真度。使用resources/template.md进行实验设计。
步骤3:设计和构建最小测试
创建测试假设的最简单工件(落地页、纸质原型、手动服务交付)。参见resources/methodology.md了解具体技术(假门、管家、Wizard of Oz、纸质原型设计)。
步骤4:运行实验
部署测试,招募参与者,收集定量数据(注册数、点击、支付)和定性反馈(访谈、观察)。瞄准最小可行数据(定性 n=5-10,定量 n=100+ 以获得置信度)。
步骤5:分析并决定
比较结果与成功标准(例如,“10% 转化验证需求”)。决定:转向(假设错误,改变方向),坚持(假设验证,构建它),或迭代(混合结果,改进并重新测试)。
常见模式
按假设类型:
需求假设(“人们想要这个”):
- 测试:假门(落地页带“立即购买” → “即将推出”)、预购、等待列表注册
- 成功标准:X% 转化,Z 天内 Y 注册
- 示例:“2 周内 10% 访客注册等待列表” → 验证需求
定价假设(“人们会支付 $X”):
- 测试:落地页上的价格,提供多个价格层级,A/B 测试价格
- 成功标准:目标价格下 Z% 转化
- 示例:“5% 以 $49/月 转化” → 验证定价
工作流程假设(“这以直观方式解决用户问题”):
- 测试:纸质原型,使用可点击原型完成任务
- 成功标准:X% 在没有帮助的情况下完成任务,<Y 错误
- 示例:“8/10 用户在 <2 分钟内完成结账,0 错误” → 验证工作流程
可行性假设(“我们可以构建/扩展这个”):
- 测试:技术尖峰,使用真实数据的概念验证,先手动管家
- 成功标准:性能达到目标,成本在预算内
- 示例:“API 在 100 请求/秒下响应 <500ms” → 验证架构
价值主张假设(“客户偏好我们的方法而非替代方案”):
- 测试:A/B 测试消息传递,带不同价值主张的假门,竞争对手比较
- 成功标准:X% 选择我们的方法而非替代方案
- 示例:“60% 选择 AI 驱动 vs 手动策划” → 验证差异化
保真度阶梯
为你的问题选择适当的保真度:
级别0 - 预原型(小时到天,$0-100):
- 什么:在构建任何真实东西前伪造它
- 何时:测试需求、定价、价值主张假设
- 方法:带注册的落地页、假门测试、手动管家、视频模拟
- 示例:Dropbox 视频在产品构建前展示它(3-4 分钟视频,70K→75K 注册过夜)
- 优点:最快、最便宜,测试真实行为(非意见)
- 缺点:无法详细测试工作流程/可用性,如果太欺骗性有伦理问题
级别1 - 纸质原型(小时到天,$0-50):
- 什么:手绘草图、打印屏幕、索引卡
- 何时:测试工作流程、信息架构、屏幕结构
- 方法:用户“点击”纸张,你交换屏幕,观察混淆点
- 示例:银行应用 - 10 个纸质屏幕,用户模拟存款支票,识别 3 个工作流程问题
- 优点:非常快速迭代(几分钟重绘),迫使专注于结构而非抛光
- 缺点:无法测试真实交互(手势、动画),用户感觉“假”
级别2 - 可点击原型(天到周,$100-500):
- 什么:在 Figma、InVision、Adobe XD 中的交互式模拟(无真实代码)
- 何时:测试用户流、UI 模式、交互设计
- 方法:用户完成任务,测量成功率/时间/错误,收集反馈
- 示例:电子商务结账 - 8 个屏幕,20 用户,15% 在发货时放弃 → 在编码前修复
- 优点:看起来真实,易于更改,测试真实交互
- 缺点:无法测试性能、可扩展性、后端复杂性
级别3 - 编码原型(周到月,$1K-10K):
- 什么:具有有限功能的工作软件,数据子集,快捷方式
- 何时:测试技术可行性、性能、集成复杂性
- 方法:真实用户真实任务,测量延迟/错误,验证架构
- 示例:搜索引擎 - 10K 文档(非 10M),50 用户,<1s 响应时间 → 验证方法
- 优点:测试真实技术约束,揭示集成问题
- 缺点:更昂贵/耗时,如果错误更难丢弃
级别4 - 最小可行产品(月,$10K-100K+):
- 什么:向真实客户交付核心价值的最简单版本
- 何时:假设大部分验证,准备市场反馈
- 方法:发布给小段,测量保留/收入,基于数据迭代
- 示例:Instagram v1 - 仅照片滤镜(无视频、故事、reels),发布给小群
- 优点:真实市场验证、收入、学习
- 缺点:昂贵、时间线长、公开承诺
防护栏
确保质量:
-
首先测试最风险假设:不要测试你自信的
- ✓ “客户会支付 $X 吗?”(高不确定性)在“我们能让按钮变蓝吗?”(琐碎)之前
- ❌ 在验证核心价值前测试次要细节
-
匹配保真度到问题:不要为手头问题过度构建
- ✓ 纸质原型用于测试工作流程(小时),编码原型用于测试延迟(周)
- ❌ 构建编码原型测试用户是否喜欢颜色方案(过度)
-
在测试前设成功标准:避免确认偏误
- ✓ “10% 转化验证需求”(测试前决定)
- ❌ “7% 转化?那很好!”(测试后移动目标)
-
用真实目标用户测试:朋友/家人不代表
- ✓ 从目标段招募(例如,企业 IT 买家用于 B2B SaaS)
- ❌ 测试任何可用的人(创始人的礼貌朋友)
-
观察行为,非意见:人们做什么 > 人们说什么
- ✓ “50% 点击‘立即购买’但 0% 完成支付”(真实行为 → 定价/摩擦问题)
- ❌ “用户说他们会支付 $99/月”(意见,不可靠预测器)
-
对伪造透明:伦理预原型
- ✓ “注册早期访问”或“即将推出”(诚实)
- ❌ 为假产品收费信用卡,承诺不会构建的功能(欺诈)
-
丢弃原型:不要将原型代码转为生产
- ✓ 验证后以适当架构重建
- ❌ 发布原型代码(技术债、安全问题、可扩展性问题)
-
快速迭代:多个廉价测试 > 一个昂贵测试
- ✓ 1 周内 5 个纸质原型(测试 5 种方法)
- ❌ 1 个月内 1 个编码原型(锁定一种方法)
快速参考
资源:
- 快速开始:resources/template.md - 预原型/原型实验模板
- 高级技术:resources/methodology.md - 假门、管家、Wizard of Oz、纸质原型设计、A/B 测试
- 质量检查:resources/evaluators/rubric_prototyping_pretotyping.json - 评估标准
成功标准:
- ✓ 识别 3-5 个最风险假设按风险排名(错误的概率 × 如果错误的影响)
- ✓ 用所需最小保真度测试最高风险假设
- ✓ 在测试前设定量化成功标准(例如,“10% 转化”)
- ✓ 招募真实目标用户(定性 n=5-10,定量 n=100+)
- ✓ 收集行为数据(点击、转化、任务完成),非仅意见
- ✓ 结果清晰到足以做出转向/坚持/迭代决定
- ✓ 记录学习并与团队分享
常见错误:
- ❌ 在风险假设前测试琐碎假设
- ❌ 过度构建(编码原型当落地页足够)
- ❌ 无成功标准(测试后移动目标)
- ❌ 用错误用户测试(朋友/家人,非目标段)
- ❌ 依赖意见(“用户说他们喜欢它”)非行为
- ❌ 分析瘫痪(完美原型在测试前)
- ❌ 发布原型代码(技术债灾难)
- ❌ 测试一件事当可以测试多件(廉价测试串行/并行运行)
何时使用替代方案:
- A/B 测试:当有现有产品/流量,想比较变体
- 调查:当需要规模化定量意见(但记住:意见 ≠ 行为)
- 客户访谈:当理解问题/背景,非测试解决方案
- Beta 测试:当产品大部分构建,需要反馈抛光/错误
- 烟雾测试:同预原型(在构建前测量兴趣)