以下是对“推理归纳”技能的中文翻译和概括:
name: 推理归纳 description: 从多个观察中提取模式和概括。当检测到反复出现的主题、构建预测规则或从累积数据中识别系统行为时使用。产生带有置信区间和异常处理的验证模式。
推理归纳
从实例中归纳出规则。模式提取和经验学习的逻辑。
类型签名
推理归纳 : [观察] → 模式 → 概括 → 置信区间
其中:
观察 : [实例] → 数据集
模式 : 数据集 → (规律 × 频率)
概括 : (规律 × 频率) → 规则
置信区间 : 规则 × 样本大小 → (置信度 × 异常)
何时使用
使用推理归纳时:
- 多个相似观察累积
- 在寻找跨线程的重复模式
- 从经验中构建预测规则
- 识别系统行为
- 验证或发现画布假设
- “这一直发生”的情况
不要使用推理归纳时:
- 解释单个观察 → 使用推理
- 已知因果链存在 → 使用因果
- 将一个案例转移到另一个 → 使用类比
- 解决分歧 → 使用辩证
与其他模式的区别
| 模式 | 输入 | 输出 | 问题 |
|---|---|---|---|
| 推理 | 单个异常 | 解释 | “为什么会这样发生?” |
| 推理归纳 | 多个实例 | 模式/规则 | “什么一直在发生?” |
| 类比 | 一个源案例 | 转移解决方案 | “这和那个怎么相似?” |
与推理的关键区别:
- 推理:1个观察 → 1个解释
- 推理归纳:N个观察 → 1个概括
四阶段过程
第一阶段:观察收集
**目的:**收集和结构化多个实例进行分析。
最小样本要求:
| 置信目标 | 最小N | 备注 |
|---|---|---|
| 探索性 | 3-5 | 仅假设生成 |
| 试探性 | 6-10 | 方向性置信 |
| 中等 | 11-20 | 可操作模式 |
| 高 | 21+ | 强有力的概括 |
组件:
observations:
dataset:
- instance_id: "deal-001"
timestamp: ISO8601
context: "企业销售"
attributes:
deal_size: 400000
sales_cycle: 120
stalled_at: "法律审查"
outcome: "赢得"
- instance_id: "deal-002"
timestamp: ISO8601
context: "企业销售"
attributes:
deal_size: 350000
sales_cycle: 150
stalled_at: "法律审查"
outcome: "失去"
# ... 更多实例
metadata:
total_instances: 12
time_range: "2024年第三季度-第四季度"
source: "threads/sales/*/6-learning.md"
collection_method: "自动扫描"
quality:
completeness: 0.92 # 字段填充的百分比
consistency: 0.88 # 遵循相同模式的百分比
recency: 0.75 # 最近的权重
第二阶段:模式检测
**目的:**在数据集中识别规律。
模式类型:
| 类型 | 描述 | 示例 |
|---|---|---|
| 频率 | X发生的次数 | “7/12的交易在法律审查中停滞” |
| 相关性 | X和Y共同出现 | “大宗交易和长周期” |
| 序列 | X跟随Y | “停滞 → 30天内失去” |
| 聚类 | 群体出现 | “存在两种交易原型” |
| 趋势 | 随时间的方向 | “周期越来越长” |
| 阈值 | 存在断点 | “>$300K的交易表现不同” |
检测过程:
patterns:
detected:
- pattern_id: P1
type: frequency
description: "法律审查停滞"
evidence: "12宗交易中的7宗(58%)在法律审查中停滞"
strength: 0.78
- pattern_id: P2
type: correlation
description: "交易规模与周期长度相关"
evidence: "交易规模与销售周期之间的r=0.72"
strength: 0.72
- pattern_id: P3
type: threshold
description: "CFO参与阈值"
evidence: ">$250K的交易需要CFO,增加30+天"
strength: 0.85
- pattern_id: P4
type: sequence
description: "停滞持续时间预测结果"
evidence: "停滞>21天 → 80%的损失率"
strength: 0.80
rejected:
- pattern: "行业影响结果"
reason: "行业间没有显著差异(p>0.3)"
insufficient_data:
- pattern: "季节性影响"
reason: "只有2个季度的数据,需要4+来判断季节性"
第三阶段:概括
**目的:**从验证的模式中形成规则。
规则形成:
generalizations:
rules:
- rule_id: R1
statement: "企业交易>$250K需要CFO批准,增加30+天到周期"
derived_from: [P2, P3]
structure:
condition: "deal_size > 250000"
prediction: "sales_cycle += 30 days"
mechanism: "CFO批准要求"
applicability:
domain: "企业销售"
segments: ["所有企业"]
exceptions: ["已有MSA的客户"]
- rule_id: R2
statement: "法律审查停滞>21天预测交易损失概率为80%"
derived_from: [P1, P4]
structure:
condition: "stall_duration > 21 AND stall_stage = 'legal'"
prediction: "outcome = 'lost' (p=0.80)"
mechanism: "预算周期到期,冠军疲劳"
applicability:
domain: "企业销售"
segments: ["新客户"]
exceptions: ["已知长周期的政府交易"]
- rule_id: R3
statement: "58%的企业交易将在法律审查中停滞"
derived_from: [P1]
structure:
condition: "企业交易"
prediction: "P(legal_stall) = 0.58"
mechanism: "定制合同要求"
applicability:
domain: "企业销售"
segments: ["全部"]
exceptions: ["接受标准合同"]
第四阶段:置信区间
**目的:**量化可靠性并识别异常。
置信度计算:
置信度 = f(样本大小,模式强度,一致性,时效性)
基于样本大小的基础置信度:
N < 5: max 0.40
N 5-10: max 0.60
N 11-20: max 0.80
N > 20: max 0.95
调整:
× 模式强度 (0-1)
× 一致性 (0-1)
× 时效性权重 (0.5-1.0)
组件:
confidence_analysis:
rules:
- rule_id: R1
confidence: 0.72
calculation:
base: 0.80 # N=12, 中等样本
strength: 0.85 # 强模式
consistency: 0.88 # 数据质量良好
recency: 0.95 # 最近的数据
final: 0.72 # base × min(strength, consistency, recency)
bounds:
lower: 0.58 # 悲观估计
upper: 0.82 # 乐观估计
exceptions:
identified:
- "现有客户交易在45天内完成,尽管金额为400K"
explanation: "预先存在的MSA消除了法律审查"
- "政府交易耗时180天但成功"
explanation: "已知的政府采购周期"
exception_rate: 0.17 # 12个实例中的2个
validity:
expires: "2025-06-01" # 6个月后重新验证
invalidated_by:
- "消除法律审查的流程变更"
- "新合同模板的采用"
strengthened_by:
- "3+更多实例遵循模式"
- "因果机制得到确认"
- rule_id: R2
confidence: 0.68
# ... 类似结构
输出摘要:
inductive_output:
summary:
rules_generated: 3
highest_confidence: R1 (0.72)
total_observations: 12
time_range: "2024年第三季度-第四季度"
actionable_rules:
- rule: R1
action: "为>$250K的交易增加30天的预测"
confidence: 0.72
- rule: R2
action: "当法律停滞超过14天时升级干预"
confidence: 0.68
tentative_rules:
- rule: R3
action: "计划60%的交易将出现法律停滞(相应地分配资源)"
confidence: 0.55
needs: "需要5+更多观察以达到可操作的置信度"
canvas_implications:
validate:
- assumption: "A4: 企业销售周期为90天"
finding: "实际上>$250K的交易为120天"
action: "更新假设"
new_hypothesis:
- "H17: 标准合同模板将法律停滞减少50%"
basis: "法律停滞是周期的主要驱动因素"
test: "用5个交易试行标准合同"
质量门
| 门 | 要求 | 失败行动 |
|---|---|---|
| 样本大小 | ≥5个实例 | 收集更多数据 |
| 数据质量 | ≥80%完整性 | 清洗数据集 |
| 模式强度 | 至少一个≥0.6 | 降低阈值或收集更多 |
| 异常率 | 可操作规则<30% | 缩小规则范围 |
| 机制确定 | 合理的解释 | 添加推理分析 |
常见失败模式
| 失败 | 症状 | 修复 |
|---|---|---|
| 小N | 高方差,不稳定模式 | 等待更多数据 |
| 生存者偏差 | 仅分析成功案例 | 包括失败案例 |
| 混杂 | 相关≠因果 | 用干预测试机制 |
| 过拟合 | 规则太具体于样本 | 简化规则,测试保留 |
| 时效性偏差 | 旧模式同等权重 | 应用时效性加权 |
| 挑选樱桃 | 仅确认实例 | 系统收集 |
模式验证
在将规则提升为可操作之前:
统计验证
validation:
method: "holdout"
training_set: 8个实例
test_set: 4个实例
rule_accuracy_on_test: 0.75
passed: true
因果验证
validation:
method: "mechanism_test"
proposed_mechanism: "CFO批准增加30天"
test: "采访3位CFO关于批准流程"
result: "确认 - CFO审查平均25-35天"
passed: true
时效性验证
validation:
method: "stability_check"
pattern_in_Q3: 0.62
pattern_in_Q4: 0.54
drift: -0.08 (可接受)
passed: true
自动模式检测
为了持续学习,运行推理扫描:
automated_scan:
frequency: 每周
sources:
- "threads/sales/*/6-learning.md"
- "threads/marketing/*/6-learning.md"
- "threads/operations/*/6-learning.md"
thresholds:
min_instances: 5
min_pattern_strength: 0.6
output:
location: "ops/patterns.md"
alert_threshold: 0.75 # 标记高置信度的新模式
actions:
new_pattern_detected: "在ops/today.md中标记以供审查"
existing_pattern_strengthened: "更新置信度,记录"
pattern_invalidated: "警报,审查规则"
输出合同
inductive_output:
observations:
count: int
time_range: string
sources: [string]
quality_score: float
patterns:
detected: [{
pattern_id: string
type: frequency | correlation | sequence | cluster | trend | threshold
description: string
strength: float
evidence: string
}]
rejected: [{pattern: string, reason: string}]
rules:
- rule_id: string
statement: string
confidence: float
bounds: {lower: float, upper: float}
exceptions: [{instance: string, explanation: string}]
applicability: {domain: string, segments: [string], exceptions: [string]}
validity: {expires: date, invalidated_by: [string]}
canvas_implications:
validate: [{assumption: string, finding: string, action: string}]
invalidate: [{assumption: string, finding: string, action: string}]
new_hypotheses: [{hypothesis: string, basis: string, test: string}]
actions:
immediate: [string] # 高置信度规则立即行动
monitor: [string] # 观察暂定模式
collect: [string] # 填补数据空白
next:
suggested_mode: ReasoningMode
threads_to_create: [string]
trace:
patterns_evaluated: int
rules_generated: int
duration_ms: int
示例执行
上下文: “回顾过去6个月的营销内容表现”
第一阶段 - 观察:
收集:24个内容片段
来源:threads/marketing/*/6-learning.md
属性:主题,格式,渠道,会话,转化,演示时间
质量:0.88完整性
第二阶段 - 模式:
P1 (频率): 案例研究转化2.3倍平均值(8/24,全部高于平均值)
P2 (相关性): 技术深度与企业演示相关(r=0.68)
P3 (阈值): >2000字的帖子在SEO上表现更好(识别出断点)
P4 (趋势): 领英下降,有机搜索6个月内上升
第三阶段 - 概括:
R1: "应优先考虑案例研究以实现底部漏斗转化"
置信度:0.75,基于8个实例
R2: "技术内容吸引企业潜在客户"
置信度:0.68,基于相关性分析
R3: "SEO内容应针对>2000字"
置信度:0.70,基于阈值分析
第四阶段 - 置信区间:
R1: 0.75 [0.62, 0.85] - 可操作
R2: 0.68 [0.54, 0.78] - 谨慎可操作
R3: 0.70 [0.58, 0.80] - 可操作
画布更新:
- 验证H8(案例研究转化)
- 新H18:"长形式SEO内容推动有机增长"
行动:向案例研究和长篇技术指南调整内容组合