name: scout-mindset-bias-check description: 用于检测和去除推理中的认知偏见。当预测感觉情绪化、困在50/50,或想要验证预测过程时调用。当用户提到侦察心态、士兵心态、偏见检查、反转测试、范围敏感性或认知扭曲时使用。
侦察心态与偏见检查
目录
什么是侦察心态?
侦察心态(Julia Galef)是一种动机,旨在看到事物本来的样子,而不是你希望它们成为的样子。与士兵心态形成对比,后者不顾证据地捍卫立场。
核心原则: 你的目标是准确地图领土,而不是赢得争论。
为什么重要:
- 预测需要智力诚实
- 偏见系统性地扭曲概率
- 情感依恋蒙蔽判断
- 动机推理导致过度自信
何时使用此技能
在以下情况下使用此技能:
- 预测感觉情绪化 - 你希望某个结果发生
- 困在50/50 - 犹豫不决,无法确定概率
- 捍卫立场 - 为你的预测辩护,而不是质疑它
- 内部视图分析后 - 使用了具体细节,需要进行偏见检查
- 与他人分歧时 - 不同人,不同概率
- 最终确定前 - 最后的理智检查
当风险高、你有强烈先验,或预测影响你个人时,不要跳过此步骤。
交互式菜单
你想做什么?
核心工作流
1. 运行反转测试 - 检查你是否会接受相反的证据
- 检测动机推理
- 验证证据标准
- 暴露特殊辩护
2. 检查范围敏感性 - 确保概率随输入合理缩放
- 线性缩放测试
- 参考点校准
- 幅度评估
3. 测试现状偏见 - 挑战“无变化”假设
- 熵原则
- 变化与稳定能量
- 默认状态反转
4. 审计置信区间 - 验证CI宽度
- 惊喜测试
- 历史校准
- 过度自信检查
5. 运行完整偏见审计 - 全面的偏见扫描
- 所有主要认知偏见
- 系统性检查清单
- 优先级修复
6. 学习框架 - 深入探讨方法论
7. 退出 - 返回主预测工作流
1. 运行反转测试
检查你是否会接受指向相反方向的证据。
反转测试进度:
- [ ] 步骤1:陈述你当前的结论
- [ ] 步骤2:识别支持证据
- [ ] 步骤3:反转证据
- [ ] 步骤4:问“我还会接受它吗?”
- [ ] 步骤5:调整双重标准
步骤1:陈述你当前的结论
你在预测什么?
- 预测:[事件]
- 概率:[X]%
- 方向:[高/低信心]
步骤2:识别支持证据
列出支持你结论的证据。
示例: 候选人A将获胜(75%)
- 民意调查显示A领先5%
- A有更多竞选资金
- 专家评论员支持A
- A有更好的辩论评分
步骤3:反转证据
想象同样的证据指向相反的方向。
反转: 如果民意调查显示B领先,B有更多资金,专家支持B,B有更好评分呢?
步骤4:问“我还会接受它吗?”
关键问题:
如果存在这种反转证据,我会接受它作为有效并改变我的预测吗?
三种可能答案:
A) 是 - 我会接受反转证据 ✓ 未检测到偏见,继续当前推理
B) 否 - 我会驳回反转证据 ⚠ 警告: 动机推理 - 当证据支持你时接受,当不支持时驳回等效证据(特殊辩护)
C) 不确定 - 我需要思考 ⚠ 警告: 不对称证据标准表明合理化,而非推理
步骤5:调整双重标准
如果你回答B或C:
问: 为什么我会在一个方向上驳回这个证据,但在另一个方向上接受它?是客观原因,还是出于偏好动机?
常见合理化:
- “这个来源有偏见”(仅在它不同意时)
- “样本太小”(仅用于不利的民意调查)
- “异常数据”(仅用于你不喜欢的数据)
- “上下文重要”(选择性引用)
修复:
- 选项1: 完全拒绝证据(如果你不信任反转的,现在也别信任)
- 选项2: 在两个方向上都接受(无论方向如何都信任证据)
- 选项3: 适当加权(可能它在这两个方向上都是弱证据)
概率调整: 如果检测到双重标准,将概率向50%移动10-15%
下一步: 返回菜单
2. 检查范围敏感性
确保你的概率随幅度合理缩放。
范围敏感性进度:
- [ ] 步骤1:识别变量尺度
- [ ] 步骤2:测试线性缩放
- [ ] 步骤3:检查参考点校准
- [ ] 步骤4:验证幅度评估
- [ ] 步骤5:调整范围不敏感性
步骤1:识别变量尺度
哪个维度有幅度?
- 人数(100 vs 10,000 vs 1,000,000)
- 金额($1K vs $100K vs $10M)
- 时间长度(1月 vs 1年 vs 10年)
步骤2:测试线性缩放
线性测试: 加倍输入,检查影响是否加倍。
示例:创业资金
- 如果筹集$1M:___%
- 如果筹集$10M:___%
- 如果筹集$100M:___%
范围敏感性检查: 概率是否合理缩放?如果几乎没有变化 → 范围不敏感
步骤3:检查参考点校准
锚定测试: 你是否从一个数字开始(基准率、他人的预测、整数)并且调整不足?
修复:
- 不看他人,从头生成概率
- 然后比较并调和差异
- 不要只是“折中” - 推理估计不同的原因
步骤4:验证幅度评估
“1 vs 10 vs 100”测试: 对于你的预测,将尺度变化10倍。
示例:项目时间线
- 1月:P(成功) = ___%
- 10月:P(成功) = ___%
- 100月:P(成功) = ___%
预期: 概率应显著变化。如果所有三个估计在10个百分点内 → 范围不敏感性
步骤5:调整范围不敏感性
问题: 你的情感系统对类别响应,而不是对幅度。
修复:
方法1:对数缩放 - 使用对数尺度进行直觉
方法2:按尺度参考类 - 不要使用“创业公司”作为参考类。使用“筹集了$1M的创业公司”(10%成功) vs “筹集了$100M的创业公司”(60%成功)
方法3:显式校准 - 使用公式:P(成功) = 基准率 + k × log(金额)
下一步: 返回菜单
3. 测试现状偏见
挑战“无变化”是默认的假设。
现状偏见进度:
- [ ] 步骤1:识别现状预测
- [ ] 步骤2:计算维持现状的能量
- [ ] 步骤3:反转默认
- [ ] 步骤4:应用熵原则
- [ ] 步骤5:调整概率
步骤1:识别现状预测
你在预测“无变化”吗? 示例:“这个趋势将持续,” “市场份额将保持不变,” “政策不会改变”
现状预测通常获得膨胀的概率,因为变化感觉风险高。
步骤2:计算维持现状的能量
熵原则: 在没有主动能量输入的情况下,系统倾向于无序衰减。
问题: “保持事物相同需要什么努力?”
示例:
- 市场份额: 保持需要匹配竞争对手的创新 → 所需能量:高 → 现状是难的
- 政策: 保持不需要提出变化的提案 → 所需能量:低 → 现状更容易
步骤3:反转默认
心理练习:
- 正常框架: “X会改变吗?”(默认=否)
- 反转框架: “X会保持不变吗?”(默认=否)
偏见检查: 如果P(改变) + P(相同) ≠ 100%,你有现状偏见。
步骤4:应用熵原则
热力学第二定律(应用于预测):
问:
- 这个系统是开放还是封闭?
- 是否有能量输入来维持/改进?
- 这个能量足够吗?
步骤5:调整概率
如果你检测到现状偏见:
对于需要高能量的“无变化”预测:
- 减少P(现状) 10-20%
- 相应地增加P(改变)
对于惯性真正有帮助的预测: 无需调整
启发式: 如果维持现状需要主动努力,衰减比你想象的更可能。
下一步: 返回菜单
4. 审计置信区间
验证你的CI宽度反映真实不确定性。
置信区间审计进度:
- [ ] 步骤1:陈述当前CI
- [ ] 步骤2:运行惊喜测试
- [ ] 步骤3:检查历史校准
- [ ] 步骤4:比较参考类方差
- [ ] 步骤5:调整CI宽度
步骤1:陈述当前CI
当前置信区间:
- 点估计:___%
- 下界:___%
- 上界:___%
- 宽度:___ 个百分点
- 置信水平:___(通常80%或90%)
步骤2:运行惊喜测试
惊喜测试: “如果真实值落在我置信区间外,我会真正感到惊讶吗?”
校准:
- 80% CI → 应该20%的时间感到惊讶
- 90% CI → 应该10%的时间感到惊讶
测试: 想象结果刚好低于你的下界或刚好高于你的上界。
三种可能答案:
- A) “是,我会非常惊讶” - ✓ CI 适当校准
- B) “不,没那么惊讶” - ⚠ CI 太窄(过度自信) → 扩大区间
- C) “如果它落在范围内,我会惊讶” - ⚠ CI 太宽 → 缩小区间
步骤3:检查历史校准
查看你过去的预测:
- 收集最后20-50个带有CI的预测
- 计算实际结果落在你CI外的数量
- 与理论期望比较
| CI 水平 | 期望外部 | 你的实际 |
|---|---|---|
| 80% | 20% | ___% |
| 90% | 10% | ___% |
诊断: 实际 > 期望 → CI 太窄(过度自信) - 最常见
步骤4:比较参考类方差
如果你有参考类数据:
- 计算参考类结果的标准差
- 你的CI应大致匹配该方差
示例: 参考类 SD = 12%,你的80% CI ≈ 点估计 ± 15%
如果你的CI比参考类方差窄,你声称知道比平均更多。证明为什么,或扩大CI。
步骤5:调整CI宽度
调整规则:
- 如果过度自信: 将当前宽度乘以1.5×到2×
- 如果缺乏自信: 减少宽度0.5×到0.75×
下一步: 返回菜单
5. 运行完整偏见审计
主要认知偏见的全面扫描。
完整偏见审计进度:
- [ ] 步骤1:确认偏见检查
- [ ] 步骤2:可得性偏见检查
- [ ] 步骤3:锚定偏见检查
- [ ] 步骤4:情感启发式检查
- [ ] 步骤5:过度自信检查
- [ ] 步骤6:归因错误检查
- [ ] 步骤7:优先和修复
参见认知偏见目录获取详细描述。
快速审计问题:
1. 确认偏见
- [ ] 我是否寻求了相反的证据?
- [ ] 我是否对反对我立场的证据给予同等权重?
- [ ] 我是否主动尝试证明自己错误?
如果任何答案为否 → 检测到确认偏见
2. 可得性偏见
- [ ] 我是否依赖近期/难忘的例子?
- [ ] 我是否使用系统性数据而不是“想到什么”?
- [ ] 我是否检查了我的例子是否具有代表性?
如果任何答案为否 → 检测到可得性偏见
3. 锚定偏见
- [ ] 我是否首先生成我的独立估计?
- [ ] 我是否避免了受他人数字的影响?
- [ ] 我是否从初始锚点充分调整?
如果任何答案为否 → 检测到锚定偏见
4. 情感启发式
- [ ] 我是否有对结果的情感偏好?
- [ ] 我是否分离了“我想要”和“会发生什么”?
- [ ] 如果激励反转,我会做出相同的预测吗?
如果任何答案为否 → 检测到情感启发式
5. 过度自信
- [ ] 我是否运行了事前分析?
- [ ] 我的CI是否足够宽(惊喜测试)?
- [ ] 我是否识别了我可能错误的方式?
如果任何答案为否 → 检测到过度自信
6. 基本归因错误
- [ ] 我是否适当归因成功于技能与运气?
- [ ] 我是否考虑了情境因素,而不仅仅是个人特质?
- [ ] 我是否避免了“伟人”叙事?
如果任何答案为否 → 检测到归因错误
步骤7:优先和修复
对于每个检测到的偏见:
- 严重性: 高 / 中 / 低
- 方向: 推高概率还是降低?
- 幅度: 估计的百分点影响
修复示例:
| 偏见 | 严重性 | 方向 | 调整 |
|---|---|---|---|
| 确认 | 高 | 上 | -15% |
| 可得性 | 中 | 上 | -10% |
| 情感启发式 | 高 | 上 | -20% |
净调整: -45% → 将概率下调45点(例如,80% → 35%)
下一步: 返回菜单
6. 学习框架
深入探讨方法论。
资源文件
📄 侦察vs士兵心态
- Julia Galef的框架
- 动机推理
- 智力诚实
- 身份和信念
📄 认知偏见目录
- 20+ 主要偏见
- 它们如何影响预测
- 检测方法
- 修复策略
📄 去偏见技术
- 系统性去偏见过程
- 预先承诺策略
- 外部问责
- 算法辅助
下一步: 返回菜单
快速参考
侦察戒律
- 真理胜过舒适 - 准确性击败愿望思维
- 寻求相反证据 - 尝试证明自己错误
- 轻持信念 - 概率性,而非二元
- 逐步更新 - 根据证据改变主意
- 分离想要与期待 - 愿望 ≠ 预测
- 检查你的工作 - 定期运行偏见审计
- 保持校准 - 跟踪准确性随时间变化
侦察心态是一种看到事物本来的样子,而不是你希望它们成为的样子的驱动力。
资源文件
📁 resources/
- scout-vs-soldier.md - 心态框架
- cognitive-bias-catalog.md - 全面偏见参考
- debiasing-techniques.md - 修复策略
准备开始?从上面的菜单选择一个数字。