根因分析Skill root-cause-analysis

根因分析是一种系统性的问题解决技能,使用Fishbone(Ishikawa)图和5 Whys技术来识别问题的根本原因,并推荐纠正措施,帮助提升质量和效率。关键词:根因分析,问题解决,Fishbone图,5 Whys,RCA,根本原因分析,质量改进。

流程优化 0 次安装 0 次浏览 更新于 3/11/2026

名称: 根因分析 描述: 使用Fishbone(Ishikawa)图和5 Whys技术解决问题。系统地识别根本原因并推荐纠正措施。 参数提示: <问题陈述> [–模式 fishbone|5whys|full] [–输出 yaml|mermaid|both] [–目录 <路径>] 允许工具: Read, Write, Glob, Grep, Task, Skill, AskUserQuestion

根因分析

使用Fishbone(Ishikawa)图和5 Whys技术进行系统性问题解决。识别真正根本原因并推荐有效纠正措施。

什么是根因分析?

根因分析 (RCA) 是一种结构化方法,用于识别问题的根本原因,而不是处理症状。有效的RCA防止问题复发。

方法 重点 最佳适用
Fishbone (Ishikawa) 按类别脑力激荡所有潜在原因 具有多个潜在原因的复杂问题
5 Whys 通过原因链深入挖掘 具有线性因果关系的简单问题
组合 Fishbone用于识别,5 Whys用于深入挖掘 全面的根本原因识别

框架1: Fishbone (Ishikawa) 图

什么是Fishbone图?

Fishbone图(也称为Ishikawa或因果图)将潜在原因组织成类别,类似于鱼骨架,问题作为“头部”。

        ┌─────────────────────────────────────────────────────────┐
        │                                                         │
  人 ──┼──┐                                         ┌──┼── 方法
        │  │                                         │  │
        │  └─────────────────────┐   ┌───────────────┘  │
        │                        │   │                  │
        │                        ▼   ▼                  │
        │                    ┌─────────┐                │
        │                    │ 问题 │                │
        │                    └─────────┘                │
        │                        ▲   ▲                  │
        │  ┌─────────────────────┘   └───────────────┐  │
        │  │                                         │  │
  机器 ┼──┘                                         └──┼── 材料
        │                                               │
        │                                               │
  测量 ────────────────────────────────────────────── 环境
        │                                               │
        └───────────────────────────────────────────────┘

6M 类别

类别 也称为 示例原因
人员 培训、技能、疲劳、沟通
机器 设备、技术 硬件、软件、工具、维护
方法 流程、程序 工作流、文档、标准
材料 输入、数据 原材料、组件、信息质量
测量 指标、检查 校准、准确性、数据收集
环境 环境 温度、湿度、法规、市场

替代类别集

领域 类别
制造业 (6M) 人、机器、方法、材料、测量、环境
服务业 (8P) 产品、价格、地点、促销、人员、流程、物理证据、生产力
软件 (5S) 系统、技能、供应商、环境、安全
自定义 定义与您领域相关的类别

Fishbone 工作流

步骤1: 定义问题

## 问题陈述

**问题:** [清晰、具体、可测量的描述]
**影响:** [量化影响 - 成本、时间、质量、安全]
**发现时间:** [日期/时间]
**地点:** [位置、系统、流程]
**频率:** [一次性 / 重复 / 间歇性]

良好问题陈述示例:

  • ✅ “客户订单延迟3天以上在第四季度增加了40%”
  • ✅ “生产线3的缺陷率在11月从2%上升到8%”
  • ❌ “事情很慢” (太模糊)
  • ❌ “系统坏了” (不可测量)

步骤2: 组建团队

包括具有直接知识的人员:

角色 贡献
流程所有者 总体责任
一线工人 直接观察和经验
主题专家 技术知识
客户代表 影响视角
促进者 指导过程

步骤3: 按类别脑力激荡原因

对于每个类别,问:“在这个类别中,什么可能导致问题?”

## 原因脑力激荡

### 人 (人员)
| 潜在原因 | 证据 | 可能性 |
|-----------------|----------|------------|
| 培训不足 | 新员工占错误的60% | 高 |
| 疲劳 (加班小时) | 错误在8小时后达到高峰 | 中 |
| 沟通差距 | 交接错误有记录 | 高 |

### 机器 (设备)
| 潜在原因 | 证据 | 可能性 |
|-----------------|----------|------------|
| 设备老化 | 机器7占故障的40% | 高 |
| 软件缺陷 | 版本2.1引入缺陷 | 中 |

### 方法 (流程)
| 潜在原因 | 证据 | 可能性 |
|-----------------|----------|------------|
| 程序不清晰 | 观察到3种不同方法 | 高 |
| 缺少质量检查 | 没有验证步骤记录 | 高 |

### 材料 (输入)
| 潜在原因 | 证据 | 可能性 |
|-----------------|----------|------------|
| 供应商质量问题 | 进料缺陷率上升15% | 中 |
| 规格模糊 | 多种解释可能 | 低 |

### 测量 (指标)
| 潜在原因 | 证据 | 可能性 |
|-----------------|----------|------------|
| 传感器不准确 | 校准超期 | 中 |
| 跟踪错误指标 | 缺少领先指标 | 低 |

### 环境 (环境)
| 潜在原因 | 证据 | 可能性 |
|-----------------|----------|------------|
| 季节性需求高峰 | 第四季度总是最高量 | 高 |
| 法规变化 | 10月新要求 | 低 |

步骤4: 识别最可能的根本原因

基于以下标准优先排序:

标准 问题
证据 有数据支持此原因吗?
频率 此原因与问题频率相关吗?
相关性 原因时间与问题时间匹配吗?
控制 我们能测试或消除此原因吗?

步骤5: 验证根本原因

对于每个高可能性原因:

## 根本原因验证

| 原因 | 验证方法 | 结果 | 确认? |
|-------|-------------------|--------|------------|
| 培训不足 | 比较不同工作年限的错误率 | 新员工错误率3倍 | ✅ 是 |
| 设备老化 | 分析按机器的故障 | 机器7: 所有故障的40% | ✅ 是 |
| 程序不清晰 | 审查文档 | 找到3个冲突的SOP | ✅ 是 |

Fishbone 输出格式

## Fishbone分析: [问题]

**日期:** [ISO日期]
**促进者:** rca-analyst
**团队:** [参与者]

### 问题陈述
[清晰、具体、可测量的问题]

### 影响
[量化业务影响]

### 原因分析

#### 人 (人员)
- [原因1] - 证据: [X] - 状态: 确认/怀疑
- [原因2] - 证据: [X] - 状态: 确认/怀疑

#### 机器 (设备)
- [原因1] - 证据: [X] - 状态: 确认/怀疑

#### 方法 (流程)
- [原因1] - 证据: [X] - 状态: 确认/怀疑

#### 材料 (输入)
- [原因1] - 证据: [X] - 状态: 确认/怀疑

#### 测量 (指标)
- [原因1] - 证据: [X] - 状态: 确认/怀疑

#### 环境 (环境)
- [原因1] - 证据: [X] - 状态: 确认/怀疑

### 确认的根本原因
| # | 根本原因 | 类别 | 证据 | 贡献度 |
|---|------------|----------|----------|--------------|
| 1 | [描述] | [6M] | [数据] | [问题百分比] |

### 推荐行动
| # | 行动 | 处理 | 所有者 | 截止日期 |
|---|--------|-----------|-------|----------|
| 1 | [纠正行动] | 根本原因#1 | [名称] | [日期] |

Fishbone Mermaid 图

flowchart LR
    subgraph Man["👤 人"]
        M1[培训差距]
        M2[沟通问题]
    end

    subgraph Machine["⚙️ 机器"]
        MA1[设备老化]
        MA2[软件缺陷]
    end

    subgraph Method["📋 方法"]
        ME1[程序不清晰]
        ME2[缺少QC步骤]
    end

    subgraph Material["📦 材料"]
        MT1[供应商质量]
        MT2[规格问题]
    end

    subgraph Measurement["📊 测量"]
        MS1[传感器准确性]
        MS2[错误指标]
    end

    subgraph Environment["🌍 环境"]
        E1[季节性需求]
        E2[法规变化]
    end

    M1 & M2 --> Problem
    MA1 & MA2 --> Problem
    ME1 & ME2 --> Problem
    MT1 & MT2 --> Problem
    MS1 & MS2 --> Problem
    E1 & E2 --> Problem

    Problem[❌ 问题:<br/>客户延迟<br/>增加40%]

    style Problem fill:#f99,stroke:#900

框架2: 5 Whys

什么是5 Whys?

5 Whys 是一种迭代式询问技术,通过重复问“为什么?”(通常5次,但可能更少或更多)从症状深入挖掘到根本原因。

关键原则: 每个答案成为下一个“为什么?”的主题。

5 Whys 工作流

步骤1: 陈述问题

## 5 Whys 分析

**问题:** [具体问题陈述]
**日期:** [ISO日期]
**分析者:** 5whys-analyst

步骤2: 迭代问为什么

### 为什么链

**问题:** 网站在产品发布期间崩溃。

**为什么1:** 为什么网站崩溃?
→ 服务器内存耗尽。

**为什么2:** 为什么服务器内存耗尽?
→ 应用程序有内存泄漏。

**为什么3:** 为什么应用程序有内存泄漏?
→ 新功能未在负载下适当测试。

**为什么4:** 为什么新功能未在负载下测试?
→ 我们的CI/CD管道中没有负载测试。

**为什么5:** 为什么CI/CD中没有负载测试?
→ 在管道设置时从未优先考虑。

**根本原因:** CI/CD管道初始设置时未包含负载测试。

步骤3: 验证根本原因

验证检查 问题 通过?
具体 根本原因是否具体且可操作?
系统性 解决此原因是否能防止复发?
可控 我们能否实际修复此原因?
链有效 每个为什么答案是否逻辑上导致下一个?

5 Whys 最佳实践

不做
✅ 关注流程/系统原因 ❌ 责备个人
✅ 基于事实和证据回答 ❌ 没有数据推测
✅ 持续问直到找到可操作根本原因 ❌ 在症状处停止
✅ 记录链以供将来参考 ❌ 接受“人为错误”作为根本原因
✅ 考虑多个平行链 ❌ 假设单一根本原因

多5 Whys 链

复杂问题通常有多个促成原因。运行平行5 Whys链:

## 多为什么链

**问题:** 客户投诉增加50%

### 链A: 响应时间
为什么1: 响应时间增加 → 支持队列增长
为什么2: 队列增长 → 可用代理减少
为什么3: 可用代理减少 → 高流动率
为什么4: 高流动率 → 工作条件差
为什么5: 工作条件差 → 没有人体工程学设备
**根本原因A:** 工作场所人体工程学设备缺乏投资

### 链B: 首次接触解决
为什么1: FCR下降 → 代理缺乏知识
为什么2: 缺乏知识 → 培训不足
为什么3: 培训不足 → 产品变化未传达
为什么4: 未传达 → 没有培训更新流程
**根本原因B:** 缺少产品变化培训的流程

### 链C: (根据需要添加更多链)

5 Whys 输出格式

## 5 Whys分析: [问题]

**日期:** [ISO日期]
**分析者:** 5whys-analyst
**问题:** [陈述]

### 为什么链

| 级别 | 问题 | 答案 | 证据 |
|-------|----------|--------|----------|
| 为什么1 | 为什么[问题]? | [答案] | [数据] |
| 为什么2 | 为什么[答案1]? | [答案] | [数据] |
| 为什么3 | 为什么[答案2]? | [答案] | [数据] |
| 为什么4 | 为什么[答案3]? | [答案] | [数据] |
| 为什么5 | 为什么[答案4]? | [答案] | [数据] |

### 根本原因
[最终根本原因陈述]

### 验证
- [ ] 具体且可操作
- [ ] 系统性 (防止复发)
- [ ] 在我们控制范围内
- [ ] 每个步骤逻辑连接

### 纠正行动
| 行动 | 所有者 | 截止 | 状态 |
|--------|-------|-----|--------|
| [针对根本原因的行动] | [名称] | [日期] | 开放 |

5 Whys Mermaid 图

flowchart TD
    P[❌ 问题:<br/>网站在发布期间崩溃]
    W1[为什么1: 服务器内存耗尽]
    W2[为什么2: 应用程序有内存泄漏]
    W3[为什么3: 新功能未负载测试]
    W4[为什么4: CI/CD管道中无负载测试]
    W5[为什么5: 负载测试初始未优先考虑]
    RC[🎯 根本原因:<br/>CI/CD设置中缺少负载测试]

    P --> W1
    W1 --> W2
    W2 --> W3
    W3 --> W4
    W4 --> W5
    W5 --> RC

    style P fill:#f99,stroke:#900
    style RC fill:#9f9,stroke:#090

组合方法

对于全面分析,组合两种技术:

  1. Fishbone 按类别脑力激荡所有潜在原因
  2. 5 Whys 对每个高可能性原因深入挖掘
  3. 验证 找到的多个根本原因
  4. 优先排序 纠正行动
## 组合RCA: [问题]

### 阶段1: Fishbone脑力激荡
[按类别识别所有潜在原因]

### 阶段2: 5 Whys深入挖掘
对于每个来自Fishbone的高可能性原因:

#### 原因A: [来自Fishbone]
[5 Whys链]
根本原因A: [结果]

#### 原因B: [来自Fishbone]
[5 Whys链]
根本原因B: [结果]

### 阶段3: 根本原因总结
| # | 根本原因 | 来源 | 验证? | 优先级 |
|---|------------|--------|------------|----------|
| 1 | [RC-A] | Fishbone + 5 Whys | 是 | 高 |
| 2 | [RC-B] | Fishbone + 5 Whys | 是 | 中 |

### 阶段4: 纠正行动计划
[基于验证根本原因的CAPA计划]

纠正行动计划 (CAPA)

行动类型

类型 目的 示例
立即/遏制 停止损失 禁用故障功能
纠正 修复具体发生 补丁缺陷
预防 防止复发 添加自动化测试
系统性 解决组织因素 更新培训计划

CAPA 模板

## 纠正行动计划

**问题:** [参考RCA]
**根本原因:** [列出确认的根本原因]

### 行动

| # | 行动 | 类型 | 根本原因 | 所有者 | 截止日期 | 状态 |
|---|--------|------|------------|-------|-----|--------|
| 1 | [描述] | 纠正 | RC-1 | [名称] | [日期] | 开放 |
| 2 | [描述] | 预防 | RC-1 | [名称] | [日期] | 开放 |
| 3 | [描述] | 系统性 | RC-2 | [名称] | [日期] | 开放 |

### 验证
| 行动 | 验证方法 | 标准 | 结果 |
|--------|---------------------|----------|--------|
| 1 | [如何验证] | [成功标准] | 待定 |

### 跟进
- **审查日期:** [日期]
- **负责人:** [名称]
- **监控指标:** [KPI]

结构化数据 (YAML)

根因分析:
  版本: "1.0"
  日期: "2025-01-15"
  分析者: "rca-analyst"

  问题:
    陈述: "客户订单延迟在第四季度增加了40%"
    影响: "退款$500K, 流失率增加15%"
    发现时间: "2025-01-10"
    频率: 重复

  fishbone:
    类别:
      人:
        - 原因: "培训不足"
          证据: "新员工错误率3倍"
          可能性: 高
          确认: 是
      机器:
        - 原因: "生产线3设备老化"
          证据: "机器7占故障的40%"
          可能性: 高
          确认: 是
      方法:
        - 原因: "程序不清晰"
          证据: "3个冲突的SOP"
          可能性: 高
          确认: 是
      材料: []
      测量: []
      环境:
        - 原因: "第四季度需求高峰"
          证据: "量增加60%"
          可能性: 高
          确认: 是

  五为什么:
    - 链名称: "培训差距"
      问题: "新员工高错误率"
      为什么:
        - 问题: "为什么高错误率?"
          答案: "培训不足"
        - 问题: "为什么培训不足?"
          答案: "培训计划未更新"
        - 问题: "为什么未更新?"
          答案: "没有分配所有者"
        - 问题: "为什么没有所有者?"
          答案: "流程未建立"
      根本原因: "没有维护培训计划的流程"

  根本原因:
    - id: "RC-1"
      描述: "没有培训计划维护流程"
      来源: "Fishbone + 5 Whys"
      验证: 是
      贡献度: 40

  capa:
    - 行动: "分配培训计划所有者"
      类型: 纠正
      根本原因: "RC-1"
      所有者: "HR总监"
      截止日期: "2025-02-01"
      状态: 开放

何时使用RCA

场景 使用RCA? 方法
重大事件 完整Fishbone + 5 Whys
重复缺陷 聚焦5 Whys
客户投诉模式 组合方法
轻微一次性问题 可能 快速5 Whys
主动改进 部分 Fishbone用于创意

集成

上游

  • 事件报告 - RCA触发
  • 质量指标 - 识别问题
  • 利益相关者分析 - 识别团队成员

下游

  • 流程改进 - 实施纠正行动
  • 培训计划 - 处理人员相关原因
  • 价值流映射 - 消除系统性浪费

相关技能

  • 决策分析 - 评估纠正行动选项
  • 风险分析 - 评估根本原因风险
  • 价值流映射 - 流程改进
  • 利益相关者分析 - 识别RCA参与者

用户界面

当用户直接调用时,此技能操作如下。

参数

  • <问题陈述>: 要分析的问题描述
  • --模式: 分析技术 (默认: full)
    • fishbone: Fishbone图与6M类别 (~4K tokens)
    • 5whys: 5 Whys深入挖掘技术 (~3K tokens)
    • full: 两种技术组合 (~8K tokens)
  • --输出: 输出格式 (默认: both)
    • yaml: 结构化YAML供下游处理
    • mermaid: Mermaid图可视化
    • both: 两种格式
  • --目录: 输出目录 (默认: docs/analysis/)

执行工作流

  1. 解析参数 - 提取问题陈述、模式和输出格式。如果没有提供问题,询问用户要分析的问题。
  2. 定义问题 - 澄清问题陈述、影响、频率、首次观察到日期、当前与期望状态以及可用证据。
  3. 基于模式执行:
    • Fishbone: 探索所有6M类别的潜在原因(人、机器、方法、材料、测量、环境),评分可能性,并识别关系。
    • 5 Whys: 渐进式问题深入挖掘根本原因。可能需要少于或多于5个为什么。
    • Full: 生成问题解决者代理用于组合Fishbone + 5 Whys分析和CAPA计划。
  4. 合并根本原因 - 总结发现与证据和置信度评分。
  5. 开发CAPA计划 - 创建立即纠正、纠正行动(处理根本原因)、预防行动(防止复发)和验证计划。
  6. 生成输出 - 产生YAML结构、Mermaid鱼骨/流程图和摘要报告。
  7. 保存结果 - 保存到docs/analysis/root-cause-analysis.yaml 和/或 docs/analysis/root-cause-analysis.md (或自定义--目录)。

版本历史

  • v1.0.0 (2025-12-26): 初始发布