name: scout-mindset-bias-check description: 用于检测和去除推理中的认知偏见。当预测感觉情绪化、困在50/50，或想要验证预测过程时调用。当用户提到侦察心态、士兵心态、偏见检查、反转测试、范围敏感性或认知扭曲时使用。

侦察心态与偏见检查

什么是侦察心态？

侦察心态（Julia Galef）是一种动机，旨在看到事物本来的样子，而不是你希望它们成为的样子。与士兵心态形成对比，后者不顾证据地捍卫立场。

核心原则： 你的目标是准确地图领土，而不是赢得争论。

为什么重要：

预测需要智力诚实
偏见系统性地扭曲概率
情感依恋蒙蔽判断
动机推理导致过度自信

何时使用此技能

在以下情况下使用此技能：

预测感觉情绪化 - 你希望某个结果发生
困在50/50 - 犹豫不决，无法确定概率
捍卫立场 - 为你的预测辩护，而不是质疑它
内部视图分析后 - 使用了具体细节，需要进行偏见检查
与他人分歧时 - 不同人，不同概率
最终确定前 - 最后的理智检查

当风险高、你有强烈先验，或预测影响你个人时，不要跳过此步骤。

交互式菜单

你想做什么？

核心工作流

1. 运行反转测试 - 检查你是否会接受相反的证据

检测动机推理
验证证据标准
暴露特殊辩护

2. 检查范围敏感性 - 确保概率随输入合理缩放

线性缩放测试
参考点校准
幅度评估

3. 测试现状偏见 - 挑战“无变化”假设

熵原则
变化与稳定能量
默认状态反转

4. 审计置信区间 - 验证CI宽度

惊喜测试
历史校准
过度自信检查

5. 运行完整偏见审计 - 全面的偏见扫描

所有主要认知偏见
系统性检查清单
优先级修复

6. 学习框架 - 深入探讨方法论

7. 退出 - 返回主预测工作流

1. 运行反转测试

检查你是否会接受指向相反方向的证据。

反转测试进度：
- [ ] 步骤1：陈述你当前的结论
- [ ] 步骤2：识别支持证据
- [ ] 步骤3：反转证据
- [ ] 步骤4：问“我还会接受它吗？”
- [ ] 步骤5：调整双重标准

步骤1：陈述你当前的结论

你在预测什么？

预测：[事件]
概率：[X]%
方向：[高/低信心]

步骤2：识别支持证据

列出支持你结论的证据。

示例： 候选人A将获胜（75%）

民意调查显示A领先5%
A有更多竞选资金
专家评论员支持A
A有更好的辩论评分

步骤3：反转证据

想象同样的证据指向相反的方向。

反转： 如果民意调查显示B领先，B有更多资金，专家支持B，B有更好评分呢？

步骤4：问“我还会接受它吗？”

关键问题：

如果存在这种反转证据，我会接受它作为有效并改变我的预测吗？

三种可能答案：

A) 是 - 我会接受反转证据 ✓ 未检测到偏见，继续当前推理

B) 否 - 我会驳回反转证据 ⚠ 警告： 动机推理 - 当证据支持你时接受，当不支持时驳回等效证据（特殊辩护）

C) 不确定 - 我需要思考 ⚠ 警告： 不对称证据标准表明合理化，而非推理

步骤5：调整双重标准

如果你回答B或C：

问：为什么我会在一个方向上驳回这个证据，但在另一个方向上接受它？是客观原因，还是出于偏好动机？

常见合理化：

“这个来源有偏见”（仅在它不同意时）
“样本太小”（仅用于不利的民意调查）
“异常数据”（仅用于你不喜欢的数据）
“上下文重要”（选择性引用）

修复：

选项1： 完全拒绝证据（如果你不信任反转的，现在也别信任）
选项2： 在两个方向上都接受（无论方向如何都信任证据）
选项3： 适当加权（可能它在这两个方向上都是弱证据）

概率调整： 如果检测到双重标准，将概率向50%移动10-15%

下一步： 返回菜单

2. 检查范围敏感性

确保你的概率随幅度合理缩放。

范围敏感性进度：
- [ ] 步骤1：识别变量尺度
- [ ] 步骤2：测试线性缩放
- [ ] 步骤3：检查参考点校准
- [ ] 步骤4：验证幅度评估
- [ ] 步骤5：调整范围不敏感性

步骤1：识别变量尺度

哪个维度有幅度？

人数（100 vs 10,000 vs 1,000,000）
金额（$1K vs $100K vs $10M）
时间长度（1月 vs 1年 vs 10年）

步骤2：测试线性缩放

线性测试： 加倍输入，检查影响是否加倍。

示例：创业资金

如果筹集$1M：___%
如果筹集$10M：___%
如果筹集$100M：___%

范围敏感性检查： 概率是否合理缩放？如果几乎没有变化 → 范围不敏感

步骤3：检查参考点校准

锚定测试： 你是否从一个数字开始（基准率、他人的预测、整数）并且调整不足？

修复：

不看他人，从头生成概率
然后比较并调和差异
不要只是“折中” - 推理估计不同的原因

步骤4：验证幅度评估

“1 vs 10 vs 100”测试： 对于你的预测，将尺度变化10倍。

示例：项目时间线

1月：P(成功) = ___%
10月：P(成功) = ___%
100月：P(成功) = ___%

预期： 概率应显著变化。如果所有三个估计在10个百分点内 → 范围不敏感性

步骤5：调整范围不敏感性

问题： 你的情感系统对类别响应，而不是对幅度。

修复：

方法1：对数缩放 - 使用对数尺度进行直觉

方法2：按尺度参考类 - 不要使用“创业公司”作为参考类。使用“筹集了$1M的创业公司”（10%成功） vs “筹集了$100M的创业公司”（60%成功）

方法3：显式校准 - 使用公式：P(成功) = 基准率 + k × log(金额)

下一步： 返回菜单

3. 测试现状偏见

挑战“无变化”是默认的假设。

现状偏见进度：
- [ ] 步骤1：识别现状预测
- [ ] 步骤2：计算维持现状的能量
- [ ] 步骤3：反转默认
- [ ] 步骤4：应用熵原则
- [ ] 步骤5：调整概率

步骤1：识别现状预测

你在预测“无变化”吗？ 示例：“这个趋势将持续，” “市场份额将保持不变，” “政策不会改变”

现状预测通常获得膨胀的概率，因为变化感觉风险高。

步骤2：计算维持现状的能量

熵原则： 在没有主动能量输入的情况下，系统倾向于无序衰减。

问题： “保持事物相同需要什么努力？”

示例：

市场份额： 保持需要匹配竞争对手的创新 → 所需能量：高 → 现状是难的
政策： 保持不需要提出变化的提案 → 所需能量：低 → 现状更容易

步骤3：反转默认

心理练习：

正常框架： “X会改变吗？”（默认=否）
反转框架： “X会保持不变吗？”（默认=否）

偏见检查： 如果P(改变) + P(相同) ≠ 100%，你有现状偏见。

步骤4：应用熵原则

热力学第二定律（应用于预测）：

问：

这个系统是开放还是封闭？
是否有能量输入来维持/改进？
这个能量足够吗？

步骤5：调整概率

如果你检测到现状偏见：

对于需要高能量的“无变化”预测：

减少P(现状) 10-20%
相应地增加P(改变)

对于惯性真正有帮助的预测： 无需调整

启发式： 如果维持现状需要主动努力，衰减比你想象的更可能。

下一步： 返回菜单

4. 审计置信区间

验证你的CI宽度反映真实不确定性。

置信区间审计进度：
- [ ] 步骤1：陈述当前CI
- [ ] 步骤2：运行惊喜测试
- [ ] 步骤3：检查历史校准
- [ ] 步骤4：比较参考类方差
- [ ] 步骤5：调整CI宽度

步骤1：陈述当前CI

当前置信区间：

点估计：___%
下界：___%
上界：___%
宽度：___ 个百分点
置信水平：___（通常80%或90%）

步骤2：运行惊喜测试

惊喜测试： “如果真实值落在我置信区间外，我会真正感到惊讶吗？”

校准：

80% CI → 应该20%的时间感到惊讶
90% CI → 应该10%的时间感到惊讶

测试： 想象结果刚好低于你的下界或刚好高于你的上界。

三种可能答案：

A) “是，我会非常惊讶” - ✓ CI 适当校准
B) “不，没那么惊讶” - ⚠ CI 太窄（过度自信） → 扩大区间
C) “如果它落在范围内，我会惊讶” - ⚠ CI 太宽 → 缩小区间

步骤3：检查历史校准

查看你过去的预测：

收集最后20-50个带有CI的预测
计算实际结果落在你CI外的数量
与理论期望比较

CI 水平	期望外部	你的实际
80%	20%	___%
90%	10%	___%

诊断： 实际 > 期望 → CI 太窄（过度自信） - 最常见

步骤4：比较参考类方差

如果你有参考类数据：

计算参考类结果的标准差
你的CI应大致匹配该方差

示例： 参考类 SD = 12%，你的80% CI ≈ 点估计 ± 15%

如果你的CI比参考类方差窄，你声称知道比平均更多。证明为什么，或扩大CI。

步骤5：调整CI宽度

调整规则：

如果过度自信： 将当前宽度乘以1.5×到2×
如果缺乏自信： 减少宽度0.5×到0.75×

下一步： 返回菜单

5. 运行完整偏见审计

主要认知偏见的全面扫描。

完整偏见审计进度：
- [ ] 步骤1：确认偏见检查
- [ ] 步骤2：可得性偏见检查
- [ ] 步骤3：锚定偏见检查
- [ ] 步骤4：情感启发式检查
- [ ] 步骤5：过度自信检查
- [ ] 步骤6：归因错误检查
- [ ] 步骤7：优先和修复

参见认知偏见目录获取详细描述。

快速审计问题：

1. 确认偏见

[ ] 我是否寻求了相反的证据？
[ ] 我是否对反对我立场的证据给予同等权重？
[ ] 我是否主动尝试证明自己错误？

如果任何答案为否 → 检测到确认偏见

2. 可得性偏见

[ ] 我是否依赖近期/难忘的例子？
[ ] 我是否使用系统性数据而不是“想到什么”？
[ ] 我是否检查了我的例子是否具有代表性？

如果任何答案为否 → 检测到可得性偏见

3. 锚定偏见

[ ] 我是否首先生成我的独立估计？
[ ] 我是否避免了受他人数字的影响？
[ ] 我是否从初始锚点充分调整？

如果任何答案为否 → 检测到锚定偏见

4. 情感启发式

[ ] 我是否有对结果的情感偏好？
[ ] 我是否分离了“我想要”和“会发生什么”？
[ ] 如果激励反转，我会做出相同的预测吗？

如果任何答案为否 → 检测到情感启发式

5. 过度自信

[ ] 我是否运行了事前分析？
[ ] 我的CI是否足够宽（惊喜测试）？
[ ] 我是否识别了我可能错误的方式？

如果任何答案为否 → 检测到过度自信

6. 基本归因错误

[ ] 我是否适当归因成功于技能与运气？
[ ] 我是否考虑了情境因素，而不仅仅是个人特质？
[ ] 我是否避免了“伟人”叙事？

如果任何答案为否 → 检测到归因错误

步骤7：优先和修复

对于每个检测到的偏见：

严重性： 高 / 中 / 低
方向： 推高概率还是降低？
幅度： 估计的百分点影响

修复示例：

偏见	严重性	方向	调整
确认	高	上	-15%
可得性	中	上	-10%
情感启发式	高	上	-20%

净调整： -45% → 将概率下调45点（例如，80% → 35%）

下一步： 返回菜单

6. 学习框架

深入探讨方法论。

资源文件

📄 侦察vs士兵心态

Julia Galef的框架
动机推理
智力诚实
身份和信念

📄 认知偏见目录

20+ 主要偏见
它们如何影响预测
检测方法
修复策略

📄 去偏见技术

系统性去偏见过程
预先承诺策略
外部问责
算法辅助

下一步： 返回菜单

快速参考

侦察戒律

真理胜过舒适 - 准确性击败愿望思维
寻求相反证据 - 尝试证明自己错误
轻持信念 - 概率性，而非二元
逐步更新 - 根据证据改变主意
分离想要与期待 - 愿望 ≠ 预测
检查你的工作 - 定期运行偏见审计
保持校准 - 跟踪准确性随时间变化

侦察心态是一种看到事物本来的样子，而不是你希望它们成为的样子的驱动力。

资源文件

📁 resources/

scout-vs-soldier.md - 心态框架
cognitive-bias-catalog.md - 全面偏见参考
debiasing-techniques.md - 修复策略