name: 溯因推理 描述: 从不完整的观察中生成并评估解释性假设。适用于诊断异常、解释意外结果或从结果推断原因。生成带有证据和置信度得分的排名假设。
溯因推理
从观察中生成最佳解释。诊断和从结果推断原因的逻辑。
类型签名
溯因推理 : 观察 → 假设[] → 证据 → 最佳解释
其中:
观察 : 原始数据 × 意外程度 → 异常描述
假设 : 异常描述 → [可能原因]
证据 : [可能原因] × 可用数据 → [评分假设]
最佳解释 : [评分假设] → (原因 × 置信度 × 后续步骤)
何时使用
在以下情况使用溯因推理:
- 存在异常或意外情况(指标偏差、意外行为)
- 需要解释观察结果(为什么X会发生?)
- 数据不完整,必须推断原因
- 诊断上下文(错误、问题、故障)
- 存在多种可能的解释
不要在以下情况使用:
- 原因已知(改用因果执行)
- 需要比较决策方案
- 解决利益相关者分歧
四阶段流程
阶段1:观察
目的: 将原始数据转化为结构化的异常描述。
输入:
观察:
原始数据: "转化率从12%降至Q4的7%"
上下文:
时间范围: "2025年Q4"
基准线: "12%历史平均值"
当前值: "7%观察值"
意外程度: 0.8 # 意外程度如何?
流程:
- 量化偏差(百分比变化、与均值的标准差)
- 确定时间边界(何时开始?)
- 界定现象范围(哪些部分受影响?)
- 评估意外程度(预期 vs 意外)
输出:
异常:
描述: "转化率下降42%(12% → 7%)"
偏差: "-5个百分点,相对下降-42%"
时间性: "从Q4第3周开始,持续整个Q4"
范围: "所有细分市场均等受影响"
意外程度: 0.8
基准来源: "12个月滚动平均值"
阶段2:假设生成
目的: 生成多样化的可能解释,不做判断。
规则:
- 生成≥5个假设(初始越多越好)
- 包含明显和非明显原因
- 考虑内部和外部因素
- 先不要筛选 - 广泛撒网
假设类别:
| 类别 | 示例 |
|---|---|
| 技术 | 网站问题、漏洞、性能 |
| 产品 | 功能、定价、定位 |
| 市场 | 竞争、趋势、季节性 |
| 运营 | 团队变动、流程问题 |
| 外部 | 经济、法规、事件 |
输出:
假设:
- id: H1
原因: "网站性能下降"
类别: 技术
机制: "加载时间慢 → 用户放弃"
- id: H2
原因: "竞争对手推出激进定价"
类别: 市场
机制: "价格被压低 → 客户分流"
- id: H3
原因: "Q4季节性购物行为变化"
类别: 市场
机制: "假日消费模式不同"
- id: H4
原因: "产品市场契合度减弱"
类别: 产品
机制: "客户需求逐渐偏离"
- id: H5
原因: "销售资格标准变更"
类别: 运营
机制: "不同质量的线索进入漏斗"
# ... 持续直到穷尽
阶段3:证据评估
目的: 根据可用证据对每个假设进行评分。
对每个假设,评估:
| 标准 | 问题 | 分数 |
|---|---|---|
| 解释力 | 是否完全解释异常? | 0-1 |
| 简洁性 | 需要最少假设? | 0-1 |
| 一致性 | 与其他已知事实一致? | 0-1 |
| 可检验性 | 能否验证/证伪? | 0-1 |
| 先验概率 | 独立于此数据的可能性? | 0-1 |
证据收集:
证据:
H1_技术:
支持:
- "Q4页面加载时间增加2秒" (置信度: 0.9)
- "移动端跳出率上升15%" (置信度: 0.85)
矛盾:
- "桌面端转化稳定" (置信度: 0.8)
净得分: 0.65
H2_竞争对手:
支持:
- "竞争对手10月15日发布" (置信度: 1.0)
- "Google趋势显示竞争对手兴趣上升" (置信度: 0.7)
矛盾:
- "我们的流量未变" (置信度: 0.9)
净得分: 0.55
# ... 评估所有假设
评分公式:
分数(H) = (解释力 × 0.3) + (简洁性 × 0.2) +
(一致性 × 0.25) + (可检验性 × 0.1) +
(先验概率 × 0.15)
阶段4:最佳解释
目的: 选择最可能的原因,附带置信度和后续步骤。
排名:
排名假设:
- 排名: 1
假设: H1
原因: "网站性能下降"
分数: 0.78
置信度: 0.75
- 排名: 2
假设: H3
原因: "季节性行为变化"
分数: 0.62
置信度: 0.60
- 排名: 3
假设: H2
原因: "竞争对手定价"
分数: 0.55
置信度: 0.50
最佳解释输出:
结论:
主要原因: "网站性能下降"
置信度: 0.75
机制: "加载时间增加2秒导致放弃率增加42%,
与行业基准一致(1秒 ≈ 7%转化损失)"
促成因素:
- "季节性模式可能占下降的10-15%"
排除因素:
- "竞争对手定价(流量未变,非价格敏感细分)"
剩余不确定性:
- "是移动端特定还是全站问题"
- "修复后是否能完全恢复转化"
后续步骤:
- "验证:运行性能修复的A/B测试(高优先级)"
- "测量:修复后移动端与桌面端对比"
- "监控:竞争对手活动(低优先级)"
建议下一步模式: 因果 # 准备好根据诊断行动
质量门控
| 门控 | 要求 | 失败操作 |
|---|---|---|
| 假设数量 | ≥5个假设 | 继续生成更多假设 |
| 类别多样性 | ≥3个类别 | 扩展假设搜索范围 |
| 证据存在 | 前3名假设≥1个数据点 | 收集更多证据 |
| 置信度阈值 | 最佳假设≥0.6 | 标记为不确定 |
| 可检验性 | 最佳假设可检验 | 提出测试设计 |
常见失败模式
| 失败 | 症状 | 修复 |
|---|---|---|
| 锚定效应 | 第一个假设获得所有关注 | 在阶段2强制多样性 |
| 确认偏误 | 只寻找支持性证据 | 要求矛盾证据 |
| 复杂性蔓延 | 偏好复杂解释 | 适当加权简洁性 |
| 过早结束 | 停在第一个合理原因 | 完成所有4个阶段 |
输出契约
溯因推理输出:
结论:
主要原因: 字符串
置信度: 浮点数 # 0.0-1.0
机制: 字符串 # 原因如何产生效果
假设:
排名: [评分假设] # 所有评估过的
排除: [字符串] # 明确排除的
证据:
支持: [证据项]
矛盾: [证据项]
缺口: [字符串] # 缺少什么证据?
不确定性:
剩余问题: [字符串]
置信区间: [浮点数, 浮点数] # 低, 高
下一步:
立即行动: [字符串]
待运行测试: [字符串]
建议模式: 可选<推理模式>
追踪:
完成阶段: [1, 2, 3, 4]
耗时毫秒: 整数
生成假设数: 整数
证据点数: 整数
示例执行
上下文: “企业转化率上季度下降40%”
阶段1 - 观察:
异常: 企业转化率下降40%(15% → 9%)
时间性: 从Q3第5周开始,Q4加速
范围: 仅企业端,SMB稳定
意外程度: 0.85
阶段2 - 假设:
H1: 企业买家行为变化(经济不确定性)
H2: 销售团队重组破坏关系
H3: 竞争对手推出企业特定产品
H4: 我们的企业定价失去竞争力
H5: 企业用例产品缺口
H6: 销售周期延长(非真正下降,只是延迟)
H7: 关键客户经理离职
阶段3 - 证据:
H1: 支持(CFO参与度上升40%),矛盾(整体企业IT支出持平)
H2: 支持(3名高级销售Q3离职),矛盾(覆盖范围保持)
H6: 支持(平均周期+45天),强烈支持
H7: 支持(2名关键客户经理离职),中等支持
阶段4 - 结论:
主要原因: 销售周期延长(非真正下降)+ 客户经理离职(关系缺口)
置信度: 0.72
机制: 经济不确定性使CFO审批周期延长45天;
客户经理离职在6个关键账户中造成关系缺口
下一步: 等待45天看“延迟”交易是否完成(因果监控)
立即补足客户经理职位(因果行动)