名称: 费米估算 描述: 在不确定性下进行快速数量级估算时使用(市场 sizing、资源规划、可行性检查),将复杂数量分解为可估算部分,用上下限界定未知数,合理性检查战略假设,或当用户提到费米估算、草稿计算、数量级、粗略估计、三角测量时,或在详细分析前需要评估可行性。
费米估算
目录
目的
费米估算通过将看似不可能的问题分解为更小、可估算的部分,提供快速的数量级答案。本技能指导您通过分解策略、界定技术、合理性检查和三角测量,在数据稀缺、时间有限或决策不需要精确性时做出可辩护的估算。
何时使用
在以下情况下使用此技能:
- 市场 sizing:估算产品发布的总可寻址市场(TAM)/可服务市场(SAM)/可获得市场(SOM)、新功能的可寻址市场、竞争市场份额
- 资源规划:基础设施容量(服务器、存储、带宽)、人员需求、预算分配、库存需求
- 可行性检查:我们能在6个月内构建这个吗?客户会支付X美元吗?这个市场足够大吗?
- 战略决策:构建与购买权衡、进入新市场评估、融资/跑道计算、定价验证
- 业务指标:收入预测、客户获取成本、终身价值估算、单位经济学、盈亏平衡分析
- 影响评估:碳足迹、能源消耗、社会影响力、倡议的成本节约
- 面试问题:咨询案例面试(芝加哥的钢琴调音师)、产品意识问题、分析推理测试
- 快速验证:合理性检查详细模型、压力测试假设、在投资精确性前获取方向性答案
触发短语:“粗略估计”、“数量级”、“草稿计算”、“大约有多少”、“可行性检查”、“直觉检查”、“三角测量”、“合理性检查”
这是什么?
费米估算(以物理学家恩里科·费米命名)将复杂未知数分解为可以使用常识、约束和推理估算的更简单组件。目标不是精确性,而是快速"正确到数量级以内"。
快速示例:
问题:芝加哥有多少钢琴调音师?
费米分解:
- 人口:芝加哥约300万人
- 家庭:300万人 ÷ 3人/家庭 = 100万家庭
- 钢琴:约1/20家庭有钢琴 = 50,000架钢琴
- 调音频率:钢琴平均每年调音一次
- 调音需求:50,000次调音/年
- 调音师容量:调音师每年工作250天,每天4次调音 = 每位调音师每年1,000次调音
- 所需调音师:50,000 ÷ 1,000 = 约50名钢琴调音师
实际:芝加哥约80-100名钢琴调音师(在数量级内 ✓)
业务示例 - 市场 sizing:
问题:美国B2B销售自动化SaaS的总可寻址市场是多少?
分解:
- 美国总企业数:约3000万家
- 有销售团队的企业:约10% = 300万家企业
- 员工>10人的企业(能负担SaaS):约200万家企业
- 可寻址企业(科技意识强,非企业级自定义解决方案):约50万家企业
- 价格点:平均每月500美元
- 总可寻址市场:50万家 × 500美元/月 × 12 = 每年30亿美元
验证:快速搜索确认B2B销售技术市场约50-70亿美元(相同数量级 ✓)
工作流程
复制此检查清单并跟踪进度:
费米估算进度:
- [ ] 步骤1:澄清问题并定义指标
- [ ] 步骤2:分解为可估算组件
- [ ] 步骤3:使用锚点估算组件
- [ ] 步骤4:用上下限界定
- [ ] 步骤5:计算并合理性检查
- [ ] 步骤6:用替代路径三角测量
步骤1:澄清问题并定义指标
精确重述问题(单位、范围、时间范围)。识别决策依赖的估算(方向性答案足够?数量级?)。参见resources/template.md获取问题澄清框架。
步骤2:分解为可估算组件
将未知数分解为可知部分的乘积/商。选择分解策略(自上而下、自下而上、维度分析)。参见resources/template.md获取分解模式。
步骤3:使用锚点估算组件
基于已知数量(人口、物理常数、市场规模、个人经验)进行估算。明确陈述假设。参见resources/methodology.md获取锚点来源和校准。
步骤4:用上下限界定
计算乐观(上限)和悲观(下限)边界以界定答案。检查决策是否在范围内变化。参见resources/methodology.md获取基于约束的界定。
步骤5:计算并合理性检查
计算估算,四舍五入到1-2位有效数字。合理性检查与现实对比(答案通过嗅觉测试吗?)。参见resources/template.md获取验证标准。
步骤6:用替代路径三角测量
使用不同分解重新估算以验证。检查两条路径是否产生相同数量级。使用resources/evaluators/rubric_estimation_fermi.json验证。最低标准:平均分数 ≥ 3.5。
常见模式
模式1:市场 Sizing(TAM/SAM/SOM)
- 分解:总人口 → 目标细分 → 可寻址 → 可达到 → 价格点
- 锚点:人口普查数据、行业报告、类似市场、渗透率
- 边界:乐观(高渗透、溢价定价) vs 悲观(低渗透、折扣定价)
- 合理性检查:与空间内公共公司收入、VC市场规模估算对比
- 示例:电子商务总可寻址市场 = 美国人口 × 在线购物% × 平均年支出
模式2:基础设施容量
- 分解:用户 → 每个用户的请求 → 每个请求的计算/存储 → 开销
- 锚点:类似服务(Instagram、Twitter)、已知容量(EC2实例限制)、负载测试数据
- 边界:峰值(黑色星期五) vs 平均负载、增长轨迹(每年2倍 vs 10倍)
- 合理性检查:每个用户的成本应 < 终身价值,与类似规模的公共云账单对比
- 示例:所需服务器 = (日活跃用户 × 每个用户的请求 × 毫秒/请求) ÷ (实例容量 × 利用率)
模式3:人员配置/人数
- 分解:待完成工作(功能、票证、客户) → 每人生产力 → 开销(会议、支持)
- 锚点:行业基准(每X用户工程师、每Y客户支持代理)、团队速度、招聘时间线
- 边界:经验丰富的团队(高生产力) vs 新团队(启动时间)、激进时间线(加班) vs 可持续节奏
- 合理性检查:人数增长应与收入增长曲线匹配,与类似规模的同行对比
- 示例:所需工程师 = (路线图中的故事点 ÷ 每个工程师的速度) + 20% 开销
模式4:财务预测
- 分解:收入 = 用户 × 转化率 × 每用户平均收入,成本 = 销货成本 + 销售/营销 + 研发 + 一般与行政费用
- 锚点:队列数据、行业客户获取成本/终身价值基准、可比公司指标、历史增长
- 边界:牛势案例(高增长、高效扩展) vs 熊势案例(缓慢增长、成本上升)
- 合理性检查:利润率在规模上应接近行业规范,增长率应遵循S曲线而非永远指数增长
- 示例:第2年收入 = 第1年收入 × (1 + 增长率) × (1 - 流失率)
模式5:影响评估
- 分解:总影响 = 受影响的单位 × 每个单位的影响 × 持续时间
- 锚点:排放因子(千克二氧化碳/千瓦时)、转化率(计划 → 行为改变)、先例研究
- 边界:保守(低采用、小效果) vs 乐观(高采用、大效果)
- 合理性检查:影响应线性或亚线性扩展(收益递减),与类似干预措施对比
- 示例:碳节省 = (切换用户 × 年行驶里程 × 每英里排放) - 基线
护栏
关键要求:
-
明确陈述假设:每个费米估算都基于假设。使它们可见(“假设每年250个工作日”、“如果转化率约3%”)。允许他人挑战/优化。未陈述的假设创建虚假精确性。
-
目标为数量级,而非精确性:目标是10^X,而非X.XX。四舍五入到1-2位有效数字(50而非47.3,300万而非2,847,291)。虚假精确性浪费时间和误导。如果决策需要精确性,不要使用费米估算——获取真实数据。
-
分解直到组件可估算:分解直到达到可以从知识/经验估算的数量。如果一个组件仍然是"我怎么会知道?",进一步分解。避免为复杂子问题插入胡乱猜测。
-
使用多条路径(三角测量):通过不同分解估算相同数量(自上而下 vs 自下而上、供应方 vs 需求方)。如果路径在因子3内一致,置信度增加。如果它们差异10倍以上,调查哪个分解有缺陷。
-
界定答案:计算乐观和悲观案例以界定现实。如果决策在范围内相同(市场是10亿美元或100亿美元,无论如何我们进入),边界重要性较低。如果决策翻转(在1000万美元盈利,在100万美元不盈利),需要精确性或更好估算。
-
合理性检查与现实对比:答案通过嗅觉测试吗?与已知数量对比(您对星巴克收入的估算应在实际约350亿美元的10倍内)。使用维度分析(单位应正确抵消)。检查极端情况(如果每个人都做X?是否违反物理定律?)。
-
在已知问题上校准:在有可验证答案的问题上练习(美国人口、迪士尼世界出席人数、小麦产量)。识别您的偏见(高估?低估?锚定?)。改善未来估算。
-
承认不确定性范围:当适当时,将估算表达为范围或置信区间(“10-100万用户”、“可能100-500万美元”)。传达认知谦逊。避免虚假精确性陷阱。
常见陷阱:
- ❌ 锚定在错误数字上:使用不相关或有偏的起始点。如果有人说"是100万吗?"您锚定在那里,即使没有理由。
- ❌ 双重计数:在分解中包括相同数量两次(计数企业和员工时,企业已经包括员工)。
- ❌ 单位错误:混合每日和每年,混淆百万和十亿,错误货币转换。始终检查单位。
- ❌ 幸存者偏差:基于成功案例估算(从独角兽的平均初创收入,不包括失败)。
- ❌ 线性外推:当指数增长时假设线性增长(或反之)。增长率随时间变化。
- ❌ 忽略约束:物理限制(不能超过光速)、经济限制(市场增长不能永远快于GDP)。
快速参考
关键资源:
- resources/template.md:澄清框架、分解策略、估算模板、合理性检查标准
- resources/methodology.md:锚定技术、界定方法、三角测量方法、校准练习
- resources/evaluators/rubric_estimation_fermi.json:分解、假设、边界、合理性检查的质量标准
常见锚点:
人口统计:
- 美国人口:约3.3亿,家庭:约1.3亿,劳动力:约1.65亿
- 世界人口:约80亿,城市:约55%,互联网用户:约50亿
业务:
- 财富500强收入:10万美元到6000亿美元(中位数约300亿美元)
- 初创估值:种子轮约500-1000万美元,A轮约3000-5000万美元,独角兽 >10亿美元
- SaaS指标:客户获取成本约1000-5000美元,终身价值/客户获取成本比率 >3,流失率 <5%/年
技术:
- AWS EC2实例:约10,000请求/秒,S3存储:0.023美元/GB/月
- 移动应用:约5-10屏幕/天/用户,50-100 API调用/会话
- 网站:约2-3页面/会话,1-2分钟会话持续时间
物理:
- 人:约70千克,2000千卡/天,8小时睡眠
- 汽车:约25英里/加仑,12,000英里/年,30,000美元新车,20万英里寿命
- 房屋:约2000平方英尺,美国中位数300,000美元,30年抵押贷款
转换因子:
- 1年 ≈ 250个工作日 ≈ 2000个工作小时
- 100万秒 ≈ 11.5天,10亿秒 ≈ 32年
- 1英里 ≈ 1.6公里,1千克 ≈ 2.2磅,1加仑 ≈ 3.8升
分解策略:
- 自上而下:从总人口开始,向下筛选(美国人口 → 车主 → 电动汽车买家)
- 自下而上:从单位开始,向上扩展(1家商店收入 × 商店数量)
- 速率 × 时间:流率 × 持续时间(客户/天 × 天数/年)
- 密度 × 面积/体积:浓度 × 空间(人/平方英里 × 城市面积)
- 类似扩展:已知类似系统,根据大小调整(竞争对手收入 × 我们的市场份额)
典型估算时间:
- 简单问题(1-2层分解):3-5分钟
- 市场 sizing(3-4层):10-15分钟
- 复杂业务案例(多个指标、三角测量):20-30分钟
何时升级:
- 决策需要精确性(< 因子2的不确定性)
- 即使有边界,估算跨度 >2个数量级
- 没有合理的分解路径(太多未知数)
- 利益相关者需要置信区间和统计严谨性 → 投资数据收集、详细建模、专家咨询
所需输入:
- 问题(我们估算什么?单位?范围?)
- 决策上下文(什么决策依赖此估算?所需精确性?)
- 已知锚点(我们知道哪些相关数量?)
产生输出:
estimation-fermi.md:问题、分解、假设、计算、边界、合理性检查、三角测量、最终估算与置信范围