name: 数据分析 description: 回答数据问题——从快速查询到全面分析
分析数据问题
如果您看到不熟悉的占位符或需要检查连接的工具,请询问可用的集成。
回答一个数据问题,从快速查询到全面分析再到正式报告。
使用方式
您可以用自然语言问题请求分析数据(例如,“分析转化率的下降”或“上周有多少用户注册?”)。
工作流程
1. 理解问题
解析用户的问题并确定:
- 复杂性级别:
- 快速答案:单一指标、简单筛选、事实查询(例如,“上周有多少用户注册?”)
- 全面分析:多维探索、趋势分析、比较(例如,“是什么导致转化率的下降?”)
- 正式报告:包含方法论、注意事项和建议的全面调查(例如,“准备我们订阅指标的季度业务回顾”)
- 数据需求:需要哪些表、指标、维度和时间范围
- 输出格式:数字、表格、图表、叙述或组合
2. 收集数据
如果连接了数据仓库:
- 探索架构以找到相关的表和列
- 编写SQL查询以提取所需数据
- 执行查询并检索结果
- 如果查询失败,调试并重试(检查列名、表引用、特定方言的语法)
- 如果结果看起来出乎意料,在继续之前运行合理性检查
如果没有连接数据仓库:
- 要求用户以下列方式之一提供数据:
- 直接粘贴查询结果
- 上传CSV或Excel文件
- 描述架构,以便您可以编写查询供他们运行
- 如果为手动执行编写查询,使用
data-write-query技能以遵循方言特定的最佳实践 - 一旦数据提供,继续进行分析
3. 分析
- 计算相关指标、聚合和比较
- 识别模式、趋势、离群值和异常
- 跨维度(时间周期、细分、类别)比较
- 对于复杂分析,将问题分解为子问题并逐一解决
4. 展示前验证
在分享结果之前,运行验证检查:
- 行数合理性:记录的数量是否合理?
- 空值检查:是否有意外的空值可能扭曲结果?
- 幅度检查:数字是否在合理范围内?
- 趋势连续性:时间序列是否有意外缺口?
- 聚合逻辑:小计是否正确求和为总计?
如果任何检查引起担忧,调查并注明注意事项。
5. 呈现发现
对于快速答案:
- 直接陈述答案,附带相关上下文
- 包括使用的查询(折叠或在代码块中),以便复现
对于全面分析:
- 以关键发现或见解开头
- 用数据表和/或可视化支持
- 注明方法论和任何注意事项
- 建议后续问题
对于正式报告:
- 执行摘要,包含关键要点
- 方法论部分,解释方法和数据源
- 详细发现,附带支持证据
- 注意事项、限制和数据质量说明
- 推荐和建议的后续步骤
6. 在有益处时可视化
当图表比表格更能有效传达结果时:
- 使用
data-create-viz技能选择正确的图表类型 - 生成Python可视化或构建到HTML仪表板中
- 遵循可视化最佳实践以确保清晰和准确
提示
- 尽可能具体指定时间范围、细分或指标
- 如果您知道表名,提及它们以加速过程
- 对于复杂问题,分析可能需要拆分为多个查询
- 结果在呈现前总是经过验证——如果有问题,将会被标记