参考类预测Skill reference-class-forecasting

参考类预测是一种统计预测技能,通过识别相似历史事件的类别,使用其统计频率作为基线预测。它用于避免主观偏见,建立客观预测基准,适用于金融评估、项目预测、决策分析等场景。关键词:预测建模、统计基线、参考类、外部视角、避免偏见、历史数据、量化评估。

预测建模 0 次安装 0 次浏览 更新于 3/22/2026

名称: reference-class-forecasting 描述: 在开始预测时使用,以在分析具体情况之前建立统计基线(基础率)。当需要将预测锚定在历史现实中、避免“这次不同”偏见或在内部视角分析之前建立外部视角时调用。当用户提到基础率、参考类、外部视角或开始新预测时使用。

参考类预测

目录


什么是参考类预测?

参考类预测是通过识别相似过去事件的类别并使用其统计频率作为起点,将预测锚定在历史现实中的实践。这是“外部视角”——在关注“此案例”的具体细节之前,看看这类事物通常会发生什么。

核心原则: 假设此事件是平均的,直到你有具体证据证明否则。

为什么重要:

  • 克服“内部视角”偏见(认为你的案例是独特的)
  • 防止基础率忽视(忽略统计基线)
  • 在主观分析之前提供客观锚点
  • 强制谦逊和统计思维

何时使用此技能

使用此技能当:

  • 开始任何预测 - 首先建立基础率
  • 有人说“这次不同” - 测试是否真的如此
  • 预测成功/失败 - 查找历史频率
  • 评估初创公司/项目结果 - 基于类别统计锚定
  • 面临自信预测挑战 - 基于现实基础
  • 在详细分析之前 - 获取外部视角基线

不使用当:

  • 事件从未发生过(新颖情况)
  • 使用确定性物理定律
  • 纯粹混乱无模式

交互式菜单

你想做什么?

核心工作流程

1. 查找我的基础率 - 识别参考类并获取统计基线

  • 引导过程选择正确参考类
  • 查找历史频率的搜索策略
  • 验证你是否有正确的锚点

2. 测试“这次不同” - 挑战独特性主张

  • 独特性偏见的反向测试
  • 相似性匹配框架
  • 举证责任计算器

3. 计算漏斗基础率 - 多阶段概率链

  • 当没有单一基础率存在时
  • 顺序概率建模
  • 复合事件的产品规则

4. 验证我的参考类 - 确保选择了正确的比较集

  • 太宽 vs 太窄测试
  • 同质性检查
  • 样本大小评估

5. 学习框架 - 深入方法学

6. 退出 - 返回主要预测工作流程


1. 查找我的基础率

让我们建立你的统计基线。

步骤1: 你在预测什么?

告诉我你预测的具体事件或结果。

示例提示:

  • “这家初创公司会成功吗?”
  • “这项法案会在国会通过吗?”
  • “这个项目会按时启动吗?”

步骤2: 识别参考类

我将帮助你识别这属于哪个桶。

框架:

  • 太宽: “所有公司” → 无意义
  • 刚好: “种子阶段B2B SaaS金融科技初创公司”
  • 太窄: “2024年由名为史蒂夫的人创立的公司” → 无数据

关键问题:

  1. 这是什么类型的实体?(公司、法案、项目、人等)
  2. 什么阶段/规模/类别?
  3. 什么行业/领域?
  4. 相关时间段是什么?

我将与你合作,精炼到我们有一个具体、可搜索的类别。


步骤3: 搜索历史数据

我将帮助你使用以下方式查找基础率:

  • 网络搜索 获取已发布统计数据
  • 学术研究 关于成功率
  • 政府/行业报告
  • 代理指标 如果直接数据不可用

搜索策略:

“历史成功率 [参考类]”
“失败统计 [参考类]”
“生存率 [参考类]”
“什么百分比 [参考类]”

步骤4: 设置你的锚点

一旦我们找到基础率,那就成为你的起始概率

规则:

在你有具体、基于证据的理由进行“内部视角”分析之前,你不允许从这个基础率移动。

如果未找到数据的默认锚点:

  • 新颖创新:10-20%(大多数创新失败)
  • 成熟行业:50%(不确定)
  • 受监管/已验证流程:70-80%(系统有效)

下一步: 返回菜单或继续内部视角分析。


2. 测试“这次不同”

挑战独特性偏见。

当某人(包括你自己)认为“这个案例特殊”时,我们需要压力测试这个信念。

独特性审计

问题1: 相似性匹配

  • 哪5个历史案例最类似于这个?
  • 每个的结果是什么?
  • 你的案例与这些有何实质性不同?

问题2: 反向测试

  • 如果某人声称另一个案例“独特”,原因与你声称的相同,你会接受吗?
  • 你在进行特殊辩护吗?

问题3: 举证责任 基础率说[X]%。你声称应该是[Y]%。

计算差距:|Y - X|

所需证据强度:

  • 差距 < 10%:需要最少证据
  • 差距 10-30%:需要中等证据(2-3个具体因素)
  • 差距 > 30%:需要特别强证据(多个独立强信号)

输出

我将告诉你:

  1. “这次不同”是否合理
  2. 你从基础率可以合理调整多少
  3. 需要什么证据来证明更大调整

下一步: 返回菜单


3. 计算漏斗基础率

对于没有单一基础率的多阶段流程。

何时使用

  • 不存在直接统计数据(例如,“X的成功率”)
  • 事件需要多个顺序步骤
  • 每个阶段有独立概率

漏斗方法

示例:“法案X会成为法律吗?”

没有“法案X成功率”的直接数据,但我们可以建模漏斗:

  1. 阶段1: 引入的法案 → 达到委员会的法案

    • P(委员会 | 引入) = ?
  2. 阶段2: 委员会中的法案 → 达到投票的法案

    • P(投票 | 委员会) = ?
  3. 阶段3: 投票的法案 → 通过的法案

    • P(通过 | 投票) = ?

最终基础率:

P(法律) = P(委员会) × P(投票) × P(通过)

流程

我将帮助你:

  1. 分解 事件为顺序阶段
  2. 搜索 每个阶段的统计数据
  3. 乘法 概率使用产品规则
  4. 验证 模型(阶段是否真正独立?)

常见漏斗

  • 初创公司成功:种子 → A轮 → 盈利 → 退出
  • 药物批准:发现 → 试验 → FDA → 市场
  • 项目交付:规划 → 开发 → 测试 → 启动

下一步: 返回菜单


4. 验证我的参考类

确保选择了正确的比较集。

三个测试

测试1: 同质性

  • 这个类别的成员是否足够相似?
  • 结果是否有高方差?
  • 应该进一步细分吗?

示例: “科技初创公司”太宽(消费者vs B2B vs 硬件非常不同)。细分。


测试2: 样本大小

  • 你有足够的历史案例吗?
  • 最小:20-30个案例用于有意义的统计
  • 如果N < 20:扩大类别或承认高不确定性

测试3: 相关性

  • 自历史数据以来条件是否改变?
  • 是否有结构差异(监管、技术、市场)?
  • 时间衰减:>10年前的数据可能过时

验证清单

我将引导你完成:

  • [ ] 类别有20+历史示例
  • [ ] 成员合理同质
  • [ ] 数据来自相关时间段
  • [ ] 自数据收集以来无重大结构变化
  • [ ] 类别足够具体有含义
  • [ ] 类别足够广泛有数据

输出: 参考类置信度(高/中/低)

下一步: 返回菜单


5. 学习框架

深入方法学。

资源文件

📄 外部视角原则

  • 统计思维vs叙事思维
  • 为什么外部视角胜过专家
  • 卡尼曼的规划谬误研究
  • 外部视角何时失败

📄 参考类选择指南

  • 选择比较集的系统方法
  • 平衡具体性与数据可用性
  • 相似性度量和匹配
  • 边缘案例和判断调用

📄 常见陷阱

  • 基础率忽视示例
  • “这次不同”偏见
  • 小样本过拟合
  • 忽略回归均值
  • 类选择中的可用性偏见

下一步: 返回菜单


快速参考

外部视角戒律

  1. 基础率优先: 在分析具体之前建立统计基线
  2. 假设平均: 将案例视为典型,直到证明否则
  3. 举证责任: 从基础率大幅偏差需要强证据
  4. 类别精确: 参考类应具体但数据丰富
  5. 无叙事: 抵抗引人入胜的故事;信任频率

一句话总结

找出这类事物通常发生什么,从那里开始,只在有证据时移动。

与其他技能集成

  • 之前: 如果需要从组件计算基础率,使用estimation-fermi
  • 之后: 使用bayesian-reasoning-calibration基于新证据更新基础率
  • 伴随: 使用scout-mindset-bias-check验证你未樱桃挑选参考类

资源文件

📁 resources/


准备好开始了吗?从上面的菜单选择一个数字。