推理归纳Skill reasoning-inductive

推理归纳是一种从多个实例中提取模式和规则的技能,用于发现数据中的系统行为和预测规律,适用于数据分析和模式识别。

数据分析 0 次安装 4 次浏览 更新于 3/2/2026

以下是对“推理归纳”技能的中文翻译和概括:


name: 推理归纳 description: 从多个观察中提取模式和概括。当检测到反复出现的主题、构建预测规则或从累积数据中识别系统行为时使用。产生带有置信区间和异常处理的验证模式。

推理归纳

从实例中归纳出规则。模式提取和经验学习的逻辑。

类型签名

推理归纳 : [观察] → 模式 → 概括 → 置信区间

其中:
  观察       : [实例] → 数据集
  模式       : 数据集 → (规律 × 频率)
  概括       : (规律 × 频率) → 规则
  置信区间   : 规则 × 样本大小 → (置信度 × 异常)

何时使用

使用推理归纳时:

  • 多个相似观察累积
  • 在寻找跨线程的重复模式
  • 从经验中构建预测规则
  • 识别系统行为
  • 验证或发现画布假设
  • “这一直发生”的情况

不要使用推理归纳时:

  • 解释单个观察 → 使用推理
  • 已知因果链存在 → 使用因果
  • 将一个案例转移到另一个 → 使用类比
  • 解决分歧 → 使用辩证

与其他模式的区别

模式 输入 输出 问题
推理 单个异常 解释 “为什么会这样发生?”
推理归纳 多个实例 模式/规则 “什么一直在发生?”
类比 一个源案例 转移解决方案 “这和那个怎么相似?”

与推理的关键区别:

  • 推理:1个观察 → 1个解释
  • 推理归纳:N个观察 → 1个概括

四阶段过程

第一阶段:观察收集

**目的:**收集和结构化多个实例进行分析。

最小样本要求:

置信目标 最小N 备注
探索性 3-5 仅假设生成
试探性 6-10 方向性置信
中等 11-20 可操作模式
21+ 强有力的概括

组件:

observations:
  dataset:
    - instance_id: "deal-001"
      timestamp: ISO8601
      context: "企业销售"
      attributes:
        deal_size: 400000
        sales_cycle: 120
        stalled_at: "法律审查"
        outcome: "赢得"
        
    - instance_id: "deal-002"
      timestamp: ISO8601
      context: "企业销售"
      attributes:
        deal_size: 350000
        sales_cycle: 150
        stalled_at: "法律审查"
        outcome: "失去"
        
    # ... 更多实例
    
  metadata:
    total_instances: 12
    time_range: "2024年第三季度-第四季度"
    source: "threads/sales/*/6-learning.md"
    collection_method: "自动扫描"
    
  quality:
    completeness: 0.92  # 字段填充的百分比
    consistency: 0.88   # 遵循相同模式的百分比
    recency: 0.75       # 最近的权重

第二阶段:模式检测

**目的:**在数据集中识别规律。

模式类型:

类型 描述 示例
频率 X发生的次数 “7/12的交易在法律审查中停滞”
相关性 X和Y共同出现 “大宗交易和长周期”
序列 X跟随Y “停滞 → 30天内失去”
聚类 群体出现 “存在两种交易原型”
趋势 随时间的方向 “周期越来越长”
阈值 存在断点 “>$300K的交易表现不同”

检测过程:

patterns:
  detected:
    - pattern_id: P1
      type: frequency
      description: "法律审查停滞"
      evidence: "12宗交易中的7宗(58%)在法律审查中停滞"
      strength: 0.78
      
    - pattern_id: P2
      type: correlation
      description: "交易规模与周期长度相关"
      evidence: "交易规模与销售周期之间的r=0.72"
      strength: 0.72
      
    - pattern_id: P3
      type: threshold
      description: "CFO参与阈值"
      evidence: ">$250K的交易需要CFO,增加30+天"
      strength: 0.85
      
    - pattern_id: P4
      type: sequence
      description: "停滞持续时间预测结果"
      evidence: "停滞>21天 → 80%的损失率"
      strength: 0.80
      
  rejected:
    - pattern: "行业影响结果"
      reason: "行业间没有显著差异(p>0.3)"
      
  insufficient_data:
    - pattern: "季节性影响"
      reason: "只有2个季度的数据,需要4+来判断季节性"

第三阶段:概括

**目的:**从验证的模式中形成规则。

规则形成:

generalizations:
  rules:
    - rule_id: R1
      statement: "企业交易>$250K需要CFO批准,增加30+天到周期"
      derived_from: [P2, P3]
      
      structure:
        condition: "deal_size > 250000"
        prediction: "sales_cycle += 30 days"
        mechanism: "CFO批准要求"
        
      applicability:
        domain: "企业销售"
        segments: ["所有企业"]
        exceptions: ["已有MSA的客户"]
        
    - rule_id: R2
      statement: "法律审查停滞>21天预测交易损失概率为80%"
      derived_from: [P1, P4]
      
      structure:
        condition: "stall_duration > 21 AND stall_stage = 'legal'"
        prediction: "outcome = 'lost' (p=0.80)"
        mechanism: "预算周期到期,冠军疲劳"
        
      applicability:
        domain: "企业销售"
        segments: ["新客户"]
        exceptions: ["已知长周期的政府交易"]
        
    - rule_id: R3
      statement: "58%的企业交易将在法律审查中停滞"
      derived_from: [P1]
      
      structure:
        condition: "企业交易"
        prediction: "P(legal_stall) = 0.58"
        mechanism: "定制合同要求"
        
      applicability:
        domain: "企业销售"
        segments: ["全部"]
        exceptions: ["接受标准合同"]

第四阶段:置信区间

**目的:**量化可靠性并识别异常。

置信度计算:

置信度 = f(样本大小,模式强度,一致性,时效性)

基于样本大小的基础置信度:
  N < 5:   max 0.40
  N 5-10:  max 0.60
  N 11-20: max 0.80
  N > 20:  max 0.95

调整:
  × 模式强度 (0-1)
  × 一致性 (0-1)
  × 时效性权重 (0.5-1.0)

组件:

confidence_analysis:
  rules:
    - rule_id: R1
      confidence: 0.72
      calculation:
        base: 0.80        # N=12, 中等样本
        strength: 0.85    # 强模式
        consistency: 0.88 # 数据质量良好
        recency: 0.95     # 最近的数据
        final: 0.72       # base × min(strength, consistency, recency)
        
      bounds:
        lower: 0.58       # 悲观估计
        upper: 0.82       # 乐观估计
        
      exceptions:
        identified:
          - "现有客户交易在45天内完成,尽管金额为400K"
            explanation: "预先存在的MSA消除了法律审查"
          - "政府交易耗时180天但成功"
            explanation: "已知的政府采购周期"
        exception_rate: 0.17  # 12个实例中的2个
        
      validity:
        expires: "2025-06-01"  # 6个月后重新验证
        invalidated_by: 
          - "消除法律审查的流程变更"
          - "新合同模板的采用"
        strengthened_by:
          - "3+更多实例遵循模式"
          - "因果机制得到确认"
        
    - rule_id: R2
      confidence: 0.68
      # ... 类似结构

输出摘要:

inductive_output:
  summary:
    rules_generated: 3
    highest_confidence: R1 (0.72)
    total_observations: 12
    time_range: "2024年第三季度-第四季度"
    
  actionable_rules:
    - rule: R1
      action: "为>$250K的交易增加30天的预测"
      confidence: 0.72
      
    - rule: R2
      action: "当法律停滞超过14天时升级干预"
      confidence: 0.68
      
  tentative_rules:
    - rule: R3
      action: "计划60%的交易将出现法律停滞(相应地分配资源)"
      confidence: 0.55
      needs: "需要5+更多观察以达到可操作的置信度"
      
  canvas_implications:
    validate:
      - assumption: "A4: 企业销售周期为90天"
        finding: "实际上>$250K的交易为120天"
        action: "更新假设"
        
    new_hypothesis:
      - "H17: 标准合同模板将法律停滞减少50%"
        basis: "法律停滞是周期的主要驱动因素"
        test: "用5个交易试行标准合同"

质量门

要求 失败行动
样本大小 ≥5个实例 收集更多数据
数据质量 ≥80%完整性 清洗数据集
模式强度 至少一个≥0.6 降低阈值或收集更多
异常率 可操作规则<30% 缩小规则范围
机制确定 合理的解释 添加推理分析

常见失败模式

失败 症状 修复
小N 高方差,不稳定模式 等待更多数据
生存者偏差 仅分析成功案例 包括失败案例
混杂 相关≠因果 用干预测试机制
过拟合 规则太具体于样本 简化规则,测试保留
时效性偏差 旧模式同等权重 应用时效性加权
挑选樱桃 仅确认实例 系统收集

模式验证

在将规则提升为可操作之前:

统计验证

validation:
  method: "holdout"
  training_set: 8个实例
  test_set: 4个实例
  rule_accuracy_on_test: 0.75
  passed: true

因果验证

validation:
  method: "mechanism_test"
  proposed_mechanism: "CFO批准增加30天"
  test: "采访3位CFO关于批准流程"
  result: "确认 - CFO审查平均25-35天"
  passed: true

时效性验证

validation:
  method: "stability_check"
  pattern_in_Q3: 0.62
  pattern_in_Q4: 0.54
  drift: -0.08 (可接受)
  passed: true

自动模式检测

为了持续学习,运行推理扫描:

automated_scan:
  frequency: 每周
  sources:
    - "threads/sales/*/6-learning.md"
    - "threads/marketing/*/6-learning.md"
    - "threads/operations/*/6-learning.md"
    
  thresholds:
    min_instances: 5
    min_pattern_strength: 0.6
    
  output:
    location: "ops/patterns.md"
    alert_threshold: 0.75  # 标记高置信度的新模式
    
  actions:
    new_pattern_detected: "在ops/today.md中标记以供审查"
    existing_pattern_strengthened: "更新置信度,记录"
    pattern_invalidated: "警报,审查规则"

输出合同

inductive_output:
  observations:
    count: int
    time_range: string
    sources: [string]
    quality_score: float
    
  patterns:
    detected: [{
      pattern_id: string
      type: frequency | correlation | sequence | cluster | trend | threshold
      description: string
      strength: float
      evidence: string
    }]
    rejected: [{pattern: string, reason: string}]
    
  rules:
    - rule_id: string
      statement: string
      confidence: float
      bounds: {lower: float, upper: float}
      exceptions: [{instance: string, explanation: string}]
      applicability: {domain: string, segments: [string], exceptions: [string]}
      validity: {expires: date, invalidated_by: [string]}
      
  canvas_implications:
    validate: [{assumption: string, finding: string, action: string}]
    invalidate: [{assumption: string, finding: string, action: string}]
    new_hypotheses: [{hypothesis: string, basis: string, test: string}]
    
  actions:
    immediate: [string]        # 高置信度规则立即行动
    monitor: [string]          # 观察暂定模式
    collect: [string]          # 填补数据空白
    
  next:
    suggested_mode: ReasoningMode
    threads_to_create: [string]
    
  trace:
    patterns_evaluated: int
    rules_generated: int
    duration_ms: int

示例执行

上下文: “回顾过去6个月的营销内容表现”

第一阶段 - 观察:

收集:24个内容片段
来源:threads/marketing/*/6-learning.md
属性:主题,格式,渠道,会话,转化,演示时间
质量:0.88完整性

第二阶段 - 模式:

P1 (频率): 案例研究转化2.3倍平均值(8/24,全部高于平均值)
P2 (相关性): 技术深度与企业演示相关(r=0.68)
P3 (阈值): >2000字的帖子在SEO上表现更好(识别出断点)
P4 (趋势): 领英下降,有机搜索6个月内上升

第三阶段 - 概括:

R1: "应优先考虑案例研究以实现底部漏斗转化"
    置信度:0.75,基于8个实例

R2: "技术内容吸引企业潜在客户"
    置信度:0.68,基于相关性分析

R3: "SEO内容应针对>2000字"
    置信度:0.70,基于阈值分析

第四阶段 - 置信区间:

R1: 0.75 [0.62, 0.85] - 可操作
R2: 0.68 [0.54, 0.78] - 谨慎可操作
R3: 0.70 [0.58, 0.80] - 可操作

画布更新: 
  - 验证H8(案例研究转化)
  - 新H18:"长形式SEO内容推动有机增长"
  
行动:向案例研究和长篇技术指南调整内容组合