name: 数据验证 description: 在分享前对分析进行质量保证——方法论、准确性和偏见检查
验证分析
如果您看到不熟悉的占位符或需要检查连接了哪些工具,请询问可用的集成。
在分享给利益相关者之前,审查分析的准确性、方法论和潜在偏见。生成置信度评估和改进建议。
用法
您可以要求验证一个分析(例如,“验证这个报告”或“检查我的查询逻辑”)。
参数
要审查的分析— 文档、报告、SQL查询、图表或方法论描述
工作流程
1. 审查方法论和假设
检查:
- 问题框架:分析是否回答了正确的问题?问题是否有不同的解释方式?
- 数据选择:是否使用了正确的表/数据集?时间范围是否合适?
- 人口定义:分析人口是否正确定义?是否存在无意的排除?
- 指标定义:指标是否清晰一致地定义?是否与利益相关者的理解相匹配?
- 基线和比较:比较是否公平?时间周期、群体大小和背景是否可比?
2. 检查常见分析错误
系统性地审查:
数据完整性:
- 可能歪曲结果的缺失数据(例如,关键字段中的空值,缺失的时间周期)
- 数据新鲜度问题(最近的数据是否实际上完整或仍在加载中?)
- 生存偏差(您是否只查看了“存活”到分析日期的实体?)
统计问题:
- 辛普森悖论(当数据聚合与分段时,趋势反转)
- 相关性被呈现为因果关系而无支持证据
- 样本量小导致不可靠结论
- 离群值不成比例地影响平均值(是否应该使用中位数?)
- 多重测试/挑选显著结果
聚合错误:
- 由于不当连接导致的双重计数(多对多爆炸)
- 速率计算中的不正确分母
- 混合粒度级别(例如,用户级指标与账户级平均)
- 收入确认、开票和收款混淆
时间相关问题:
- 比较中未考虑季节性
- 包含在平均值中的不完整周期(例如,部分月份与完整月份比较)
- 数据源之间的时区不一致
- 前瞻性偏差(使用未来信息解释过去事件)
选择和范围:
- 挑选支持特定叙述的时间范围
- 无理由排除的段
- 分析中途更改定义
3. 验证计算和聚合
在可能的情况下,抽查:
- 独立重新计算一些关键数字
- 验证小计是否合计到总计
- 检查百分比在预期下是否合计到100%(或接近)
- 确认同比/环比比较使用正确的基期
- 验证过滤器在所有指标中一致应用
4. 评估可视化
如果分析包含图表:
- 轴是否从适当的值开始(条形图的零)?
- 比较图表中的尺度是否一致?
- 图表标题是否准确描述所示内容?
- 可视化是否可能误导快速读者?
- 是否有截断的轴、不一致的间隔或扭曲感知的3D效果?
5. 评估叙述和结论
审查是否:
- 结论由所示数据支持
- 承认了替代解释
- 不确定性得到适当传达
- 建议从发现逻辑上得出
- 置信水平与证据强度相匹配
6. 提出改进建议
提供具体、可操作的建议:
- 加强结论的额外分析
- 应该注意的注意事项或限制
- 关键点的更好可视化或框架
- 利益相关者希望缺失的上下文
7. 生成置信度评估
按3级量表评分分析:
可以分享 – 分析方法论健全,计算已验证,注意事项已注明。有改进建议但无阻碍。
分享时需注明注意事项 – 分析基本正确,但有特定限制或假设必须传达给利益相关者。列出所需的注意事项。
需要修订 – 发现特定错误、方法论问题或缺失分析,应在分享前解决。列出所需的更改,按优先级排序。
输出格式
## 验证报告
### 总体评估:[可以分享 | 分享时需注明注意事项 | 需要修订]
### 方法论审查
[关于方法、数据选择、定义的发现]
### 发现的问题
1. [严重性:高/中/低] [问题描述和影响]
2. ...
### 计算抽查
- [指标]:[已验证 / 发现差异]
- ...
### 可视化审查
[任何与图表或视觉呈现相关的问题]
### 建议的改进
1. [改进及其重要性]
2. ...
### 对利益相关者的必要注意事项
- [必须传达的注意事项]
- ...
提示
- 在任何高风险演示或决策前运行验证
- 即使是快速分析也受益于健全性检查——只需一分钟,可以挽救您的信誉
- 如果验证发现问题,修复它们并重新验证
- 分享验证输出与分析一起,以建立利益相关者信心