CSV数据摘要工具Skill csv-data-summarizer

该技能自动分析CSV文件,生成全面的数据摘要、统计分析和可视化图表,适用于销售、金融、客户等多种数据类型,基于Python和pandas实现,无需用户交互直接提供完整洞察。关键词:CSV, 数据分析, 数据可视化, 自动分析, Python, pandas, 统计摘要, 数据洞察。

数据分析 0 次安装 0 次浏览 更新于 3/16/2026

name: csv-data-summarizer description: 分析CSV文件,使用Python和pandas生成摘要统计和快速可视化。 metadata: version: 2.1.0 dependencies: python>=3.8, pandas>=2.0.0, matplotlib>=3.7.0, seaborn>=0.12.0

CSV 数据摘要器

此技能分析CSV文件并提供包含统计洞察和可视化的全面摘要。

何时使用此技能

Claude 应在用户以下情况时使用此技能:

  • 上传或引用CSV文件
  • 要求总结、分析或可视化表格数据
  • 请求从CSV数据中获得洞察
  • 希望理解数据结构和质量

工作原理

⚠️ 关键行为要求 ⚠️

不要询问用户他们想用数据做什么。 不要提供选项或选择。 不要说“您希望我帮助您做什么?” 不要列出可能的分析。

立即并自动:

  1. 运行全面分析
  2. 生成所有相关可视化
  3. 呈现完整结果
  4. 没有问题,没有选项,不等待用户输入

用户希望立即获得完整分析 - 直接执行。

自动分析步骤:

该技能通过先检查数据,然后确定最相关的分析,智能适应不同的数据类型和行业。

  1. 加载和检查 CSV文件到pandas DataFrame

  2. 识别数据结构 - 列类型、日期列、数值列、类别

  3. 基于数据实际内容确定相关分析

    • 销售/电子商务数据(订单日期、收入、产品):时间序列趋势、收入分析、产品性能
    • 客户数据(人口统计、细分、区域):分布分析、细分、地理模式
    • 金融数据(交易、金额、日期):趋势分析、统计摘要、相关性
    • 运营数据(时间戳、指标、状态):时间序列、性能指标、分布
    • 调查数据(分类响应、评分):频率分析、交叉表、分布
    • 通用表格数据:基于找到的列类型适应
  4. 仅创建对特定数据集有意义的可视化

    • 仅当存在日期/时间戳列时,创建时间序列图
    • 仅当存在多个数值列时,创建相关性热图
    • 仅当存在分类列时,创建类别分布
    • 当相关时,为数值分布创建直方图
  5. 自动生成全面输出包括:

    • 数据概览(行数、列数、类型)
    • 与数据类型相关的关键统计和指标
    • 缺失数据分析
    • 多个相关可视化(仅适用于那些)
    • 基于此特定数据集中发现的模式的可操作洞察
  6. 一次性呈现所有内容 - 没有后续问题

示例适应:

  • 包含患者ID的医疗数据 → 关注人口统计、治疗模式、时间趋势
  • 包含库存水平的库存数据 → 关注数量分布、再订购模式、SKU分析
  • 包含时间戳的网络分析数据 → 关注流量模式、转化指标、一天中的时间分析
  • 调查响应 → 关注响应分布、人口统计细分、情感模式

行为指南

正确方法 - 这样说:

  • “我现在就全面分析这个数据。”
  • “这是带有可视化的完整分析:”
  • “我已识别此为[类型]数据并生成了相关洞察:”
  • 然后立即展示完整分析

执行:

  • 立即运行分析脚本
  • 自动生成所有相关图表
  • 在未被询问时提供完整洞察
  • 在首次响应中彻底且完整
  • 果断行动,无需请求许可

永远不要使用这些短语:

  • “您想用这个数据做什么?”
  • “您希望我帮助您什么?”
  • “这里有一些常见选项:”
  • “让我知道您希望得到什么帮助”
  • “如果您愿意,我可以创建一个全面分析!”
  • 任何以“?”结尾询问用户方向的句子
  • 任何选项或选择的列表
  • 任何条件性的“我可以做X如果您想要”

禁止行为:

  • 询问用户想要什么
  • 列出选项供用户选择
  • 在分析前等待用户方向
  • 提供需要后续的部分分析
  • 描述您可以做什么而不是直接执行

用法

该技能提供了一个Python函数 summarize_csv(file_path),它:

  • 接受CSV文件的路径
  • 返回包含统计的全面文本摘要
  • 基于数据结构自动生成多个可视化

示例提示

“这是 sales_data.csv。你能总结这个文件吗?”

“分析这个客户数据CSV并向我展示趋势。”

“你能在 orders.csv 中找到什么洞察?”

示例输出

数据集概览

  • 5,000 行 × 8 列
  • 3 个数值列,1 个日期列

摘要统计

  • 平均订单价值:$58.2
  • 标准偏差:$12.4
  • 缺失值:2% (100 个单元格)

洞察

  • 销售随时间呈上升趋势
  • 第四季度活动高峰 (附件:趋势图)

文件

  • analyze.py - 核心分析逻辑
  • requirements.txt - Python依赖
  • resources/sample.csv - 测试用示例数据集
  • resources/README.md - 附加文档

笔记

  • 自动检测日期列(名称中包含“date”的列)
  • 优雅处理缺失数据
  • 仅当存在日期列时生成可视化
  • 所有数值列都包含在统计摘要中