侦察心态偏见检查Skill scout-mindset-bias-check

这个技能用于检测和去除推理过程中的认知偏见,帮助用户在预测和决策时保持客观和准确。它基于侦察心态框架,包括反转测试、范围敏感性检查等方法,适用于提升智力诚实和减少预测偏差的场景。关键词:侦察心态,认知偏见,偏见检测,去偏见,预测,决策支持,推理,概率校准。

其他 0 次安装 0 次浏览 更新于 3/22/2026

name: scout-mindset-bias-check description: 用于检测和去除推理中的认知偏见。当预测感觉情绪化、困在50/50,或想要验证预测过程时调用。当用户提到侦察心态、士兵心态、偏见检查、反转测试、范围敏感性或认知扭曲时使用。

侦察心态与偏见检查

目录


什么是侦察心态?

侦察心态(Julia Galef)是一种动机,旨在看到事物本来的样子,而不是你希望它们成为的样子。与士兵心态形成对比,后者不顾证据地捍卫立场。

核心原则: 你的目标是准确地图领土,而不是赢得争论。

为什么重要:

  • 预测需要智力诚实
  • 偏见系统性地扭曲概率
  • 情感依恋蒙蔽判断
  • 动机推理导致过度自信

何时使用此技能

在以下情况下使用此技能:

  • 预测感觉情绪化 - 你希望某个结果发生
  • 困在50/50 - 犹豫不决,无法确定概率
  • 捍卫立场 - 为你的预测辩护,而不是质疑它
  • 内部视图分析后 - 使用了具体细节,需要进行偏见检查
  • 与他人分歧时 - 不同人,不同概率
  • 最终确定前 - 最后的理智检查

当风险高、你有强烈先验,或预测影响你个人时,不要跳过此步骤。


交互式菜单

你想做什么?

核心工作流

1. 运行反转测试 - 检查你是否会接受相反的证据

  • 检测动机推理
  • 验证证据标准
  • 暴露特殊辩护

2. 检查范围敏感性 - 确保概率随输入合理缩放

  • 线性缩放测试
  • 参考点校准
  • 幅度评估

3. 测试现状偏见 - 挑战“无变化”假设

  • 熵原则
  • 变化与稳定能量
  • 默认状态反转

4. 审计置信区间 - 验证CI宽度

  • 惊喜测试
  • 历史校准
  • 过度自信检查

5. 运行完整偏见审计 - 全面的偏见扫描

  • 所有主要认知偏见
  • 系统性检查清单
  • 优先级修复

6. 学习框架 - 深入探讨方法论

7. 退出 - 返回主预测工作流


1. 运行反转测试

检查你是否会接受指向相反方向的证据。

反转测试进度:
- [ ] 步骤1:陈述你当前的结论
- [ ] 步骤2:识别支持证据
- [ ] 步骤3:反转证据
- [ ] 步骤4:问“我还会接受它吗?”
- [ ] 步骤5:调整双重标准

步骤1:陈述你当前的结论

你在预测什么?

  • 预测:[事件]
  • 概率:[X]%
  • 方向:[高/低信心]

步骤2:识别支持证据

列出支持你结论的证据。

示例: 候选人A将获胜(75%)

  1. 民意调查显示A领先5%
  2. A有更多竞选资金
  3. 专家评论员支持A
  4. A有更好的辩论评分

步骤3:反转证据

想象同样的证据指向相反的方向。

反转: 如果民意调查显示B领先,B有更多资金,专家支持B,B有更好评分呢?

步骤4:问“我还会接受它吗?”

关键问题:

如果存在这种反转证据,我会接受它作为有效并改变我的预测吗?

三种可能答案:

A) 是 - 我会接受反转证据 ✓ 未检测到偏见,继续当前推理

B) 否 - 我会驳回反转证据警告: 动机推理 - 当证据支持你时接受,当不支持时驳回等效证据(特殊辩护)

C) 不确定 - 我需要思考警告: 不对称证据标准表明合理化,而非推理

步骤5:调整双重标准

如果你回答B或C:

问: 为什么我会在一个方向上驳回这个证据,但在另一个方向上接受它?是客观原因,还是出于偏好动机?

常见合理化:

  • “这个来源有偏见”(仅在它不同意时)
  • “样本太小”(仅用于不利的民意调查)
  • “异常数据”(仅用于你不喜欢的数据)
  • “上下文重要”(选择性引用)

修复:

  • 选项1: 完全拒绝证据(如果你不信任反转的,现在也别信任)
  • 选项2: 在两个方向上都接受(无论方向如何都信任证据)
  • 选项3: 适当加权(可能它在这两个方向上都是弱证据)

概率调整: 如果检测到双重标准,将概率向50%移动10-15%

下一步: 返回菜单


2. 检查范围敏感性

确保你的概率随幅度合理缩放。

范围敏感性进度:
- [ ] 步骤1:识别变量尺度
- [ ] 步骤2:测试线性缩放
- [ ] 步骤3:检查参考点校准
- [ ] 步骤4:验证幅度评估
- [ ] 步骤5:调整范围不敏感性

步骤1:识别变量尺度

哪个维度有幅度?

  • 人数(100 vs 10,000 vs 1,000,000)
  • 金额($1K vs $100K vs $10M)
  • 时间长度(1月 vs 1年 vs 10年)

步骤2:测试线性缩放

线性测试: 加倍输入,检查影响是否加倍。

示例:创业资金

  • 如果筹集$1M:___%
  • 如果筹集$10M:___%
  • 如果筹集$100M:___%

范围敏感性检查: 概率是否合理缩放?如果几乎没有变化 → 范围不敏感

步骤3:检查参考点校准

锚定测试: 你是否从一个数字开始(基准率、他人的预测、整数)并且调整不足?

修复:

  • 不看他人,从头生成概率
  • 然后比较并调和差异
  • 不要只是“折中” - 推理估计不同的原因

步骤4:验证幅度评估

“1 vs 10 vs 100”测试: 对于你的预测,将尺度变化10倍。

示例:项目时间线

  • 1月:P(成功) = ___%
  • 10月:P(成功) = ___%
  • 100月:P(成功) = ___%

预期: 概率应显著变化。如果所有三个估计在10个百分点内 → 范围不敏感性

步骤5:调整范围不敏感性

问题: 你的情感系统对类别响应,而不是对幅度。

修复:

方法1:对数缩放 - 使用对数尺度进行直觉

方法2:按尺度参考类 - 不要使用“创业公司”作为参考类。使用“筹集了$1M的创业公司”(10%成功) vs “筹集了$100M的创业公司”(60%成功)

方法3:显式校准 - 使用公式:P(成功) = 基准率 + k × log(金额)

下一步: 返回菜单


3. 测试现状偏见

挑战“无变化”是默认的假设。

现状偏见进度:
- [ ] 步骤1:识别现状预测
- [ ] 步骤2:计算维持现状的能量
- [ ] 步骤3:反转默认
- [ ] 步骤4:应用熵原则
- [ ] 步骤5:调整概率

步骤1:识别现状预测

你在预测“无变化”吗? 示例:“这个趋势将持续,” “市场份额将保持不变,” “政策不会改变”

现状预测通常获得膨胀的概率,因为变化感觉风险高。

步骤2:计算维持现状的能量

熵原则: 在没有主动能量输入的情况下,系统倾向于无序衰减。

问题: “保持事物相同需要什么努力?”

示例:

  • 市场份额: 保持需要匹配竞争对手的创新 → 所需能量:高 → 现状是难的
  • 政策: 保持不需要提出变化的提案 → 所需能量:低 → 现状更容易

步骤3:反转默认

心理练习:

  • 正常框架: “X会改变吗?”(默认=否)
  • 反转框架: “X会保持不变吗?”(默认=否)

偏见检查: 如果P(改变) + P(相同) ≠ 100%,你有现状偏见。

步骤4:应用熵原则

热力学第二定律(应用于预测):

问:

  1. 这个系统是开放还是封闭?
  2. 是否有能量输入来维持/改进?
  3. 这个能量足够吗?

步骤5:调整概率

如果你检测到现状偏见:

对于需要高能量的“无变化”预测:

  • 减少P(现状) 10-20%
  • 相应地增加P(改变)

对于惯性真正有帮助的预测: 无需调整

启发式: 如果维持现状需要主动努力,衰减比你想象的更可能。

下一步: 返回菜单


4. 审计置信区间

验证你的CI宽度反映真实不确定性。

置信区间审计进度:
- [ ] 步骤1:陈述当前CI
- [ ] 步骤2:运行惊喜测试
- [ ] 步骤3:检查历史校准
- [ ] 步骤4:比较参考类方差
- [ ] 步骤5:调整CI宽度

步骤1:陈述当前CI

当前置信区间:

  • 点估计:___%
  • 下界:___%
  • 上界:___%
  • 宽度:___ 个百分点
  • 置信水平:___(通常80%或90%)

步骤2:运行惊喜测试

惊喜测试: “如果真实值落在我置信区间外,我会真正感到惊讶吗?”

校准:

  • 80% CI → 应该20%的时间感到惊讶
  • 90% CI → 应该10%的时间感到惊讶

测试: 想象结果刚好低于你的下界或刚好高于你的上界。

三种可能答案:

  • A) “是,我会非常惊讶” - ✓ CI 适当校准
  • B) “不,没那么惊讶” - ⚠ CI 太窄(过度自信) → 扩大区间
  • C) “如果它落在范围内,我会惊讶” - ⚠ CI 太宽 → 缩小区间

步骤3:检查历史校准

查看你过去的预测:

  1. 收集最后20-50个带有CI的预测
  2. 计算实际结果落在你CI外的数量
  3. 与理论期望比较
CI 水平 期望外部 你的实际
80% 20% ___%
90% 10% ___%

诊断: 实际 > 期望 → CI 太窄(过度自信) - 最常见

步骤4:比较参考类方差

如果你有参考类数据:

  1. 计算参考类结果的标准差
  2. 你的CI应大致匹配该方差

示例: 参考类 SD = 12%,你的80% CI ≈ 点估计 ± 15%

如果你的CI比参考类方差窄,你声称知道比平均更多。证明为什么,或扩大CI。

步骤5:调整CI宽度

调整规则:

  • 如果过度自信: 将当前宽度乘以1.5×到2×
  • 如果缺乏自信: 减少宽度0.5×到0.75×

下一步: 返回菜单


5. 运行完整偏见审计

主要认知偏见的全面扫描。

完整偏见审计进度:
- [ ] 步骤1:确认偏见检查
- [ ] 步骤2:可得性偏见检查
- [ ] 步骤3:锚定偏见检查
- [ ] 步骤4:情感启发式检查
- [ ] 步骤5:过度自信检查
- [ ] 步骤6:归因错误检查
- [ ] 步骤7:优先和修复

参见认知偏见目录获取详细描述。

快速审计问题:

1. 确认偏见

  • [ ] 我是否寻求了相反的证据?
  • [ ] 我是否对反对我立场的证据给予同等权重?
  • [ ] 我是否主动尝试证明自己错误?

如果任何答案为否 → 检测到确认偏见

2. 可得性偏见

  • [ ] 我是否依赖近期/难忘的例子?
  • [ ] 我是否使用系统性数据而不是“想到什么”?
  • [ ] 我是否检查了我的例子是否具有代表性?

如果任何答案为否 → 检测到可得性偏见

3. 锚定偏见

  • [ ] 我是否首先生成我的独立估计?
  • [ ] 我是否避免了受他人数字的影响?
  • [ ] 我是否从初始锚点充分调整?

如果任何答案为否 → 检测到锚定偏见

4. 情感启发式

  • [ ] 我是否有对结果的情感偏好?
  • [ ] 我是否分离了“我想要”和“会发生什么”?
  • [ ] 如果激励反转,我会做出相同的预测吗?

如果任何答案为否 → 检测到情感启发式

5. 过度自信

  • [ ] 我是否运行了事前分析?
  • [ ] 我的CI是否足够宽(惊喜测试)?
  • [ ] 我是否识别了我可能错误的方式?

如果任何答案为否 → 检测到过度自信

6. 基本归因错误

  • [ ] 我是否适当归因成功于技能与运气?
  • [ ] 我是否考虑了情境因素,而不仅仅是个人特质?
  • [ ] 我是否避免了“伟人”叙事?

如果任何答案为否 → 检测到归因错误

步骤7:优先和修复

对于每个检测到的偏见:

  1. 严重性: 高 / 中 / 低
  2. 方向: 推高概率还是降低?
  3. 幅度: 估计的百分点影响

修复示例:

偏见 严重性 方向 调整
确认 -15%
可得性 -10%
情感启发式 -20%

净调整: -45% → 将概率下调45点(例如,80% → 35%)

下一步: 返回菜单


6. 学习框架

深入探讨方法论。

资源文件

📄 侦察vs士兵心态

  • Julia Galef的框架
  • 动机推理
  • 智力诚实
  • 身份和信念

📄 认知偏见目录

  • 20+ 主要偏见
  • 它们如何影响预测
  • 检测方法
  • 修复策略

📄 去偏见技术

  • 系统性去偏见过程
  • 预先承诺策略
  • 外部问责
  • 算法辅助

下一步: 返回菜单


快速参考

侦察戒律

  1. 真理胜过舒适 - 准确性击败愿望思维
  2. 寻求相反证据 - 尝试证明自己错误
  3. 轻持信念 - 概率性,而非二元
  4. 逐步更新 - 根据证据改变主意
  5. 分离想要与期待 - 愿望 ≠ 预测
  6. 检查你的工作 - 定期运行偏见审计
  7. 保持校准 - 跟踪准确性随时间变化

侦察心态是一种看到事物本来的样子,而不是你希望它们成为的样子的驱动力。


资源文件

📁 resources/


准备开始?从上面的菜单选择一个数字。