name: csv-data-summarizer description: 分析CSV文件，使用Python和pandas生成摘要统计和快速可视化。 metadata: version: 2.1.0 dependencies: python>=3.8, pandas>=2.0.0, matplotlib>=3.7.0, seaborn>=0.12.0

CSV 数据摘要器

此技能分析CSV文件并提供包含统计洞察和可视化的全面摘要。

Claude 应在用户以下情况时使用此技能：

不要询问用户他们想用数据做什么。 不要提供选项或选择。 不要说“您希望我帮助您做什么？” 不要列出可能的分析。

立即并自动：

用户希望立即获得完整分析 - 直接执行。

该技能通过先检查数据，然后确定最相关的分析，智能适应不同的数据类型和行业。

加载和检查 CSV文件到pandas DataFrame
识别数据结构 - 列类型、日期列、数值列、类别
基于数据实际内容确定相关分析：
- 销售/电子商务数据（订单日期、收入、产品）：时间序列趋势、收入分析、产品性能
- 客户数据（人口统计、细分、区域）：分布分析、细分、地理模式
- 金融数据（交易、金额、日期）：趋势分析、统计摘要、相关性
- 运营数据（时间戳、指标、状态）：时间序列、性能指标、分布
- 调查数据（分类响应、评分）：频率分析、交叉表、分布
- 通用表格数据：基于找到的列类型适应
仅创建对特定数据集有意义的可视化：
- 仅当存在日期/时间戳列时，创建时间序列图
- 仅当存在多个数值列时，创建相关性热图
- 仅当存在分类列时，创建类别分布
- 当相关时，为数值分布创建直方图
自动生成全面输出包括：
- 数据概览（行数、列数、类型）
- 与数据类型相关的关键统计和指标
- 缺失数据分析
- 多个相关可视化（仅适用于那些）
- 基于此特定数据集中发现的模式的可操作洞察
一次性呈现所有内容 - 没有后续问题

示例适应：

✅ 正确方法 - 这样说：

✅ 执行：

❌ 永远不要使用这些短语：

❌ 禁止行为：

该技能提供了一个Python函数 summarize_csv(file_path)，它：

“这是 sales_data.csv。你能总结这个文件吗？”

“分析这个客户数据CSV并向我展示趋势。”

“你能在 orders.csv 中找到什么洞察？”

数据集概览

摘要统计

洞察