name: kaggle-learner description: 此技能应在用户要求"学习Kaggle"、“研究Kaggle解决方案”、"分析Kaggle竞赛"或提及Kaggle竞赛URL时使用。提供从Kaggle竞赛获胜方案中提取的知识,覆盖NLP、CV、时间序列、表格数据和多模态领域。 version: 0.1.0
Kaggle学习者
从Kaggle竞赛获胜方案中提取和应用知识。此技能提供来自顶级Kaggle竞争对手的技术、代码模式和最佳实践的持续更新的知识库。
概述
Kaggle竞赛处于实用机器学习的前沿。获胜方案通常通过新技术、巧妙的特征工程和优化的管道进行创新。此技能捕捉这些知识,并使您的项目易于访问。
何时使用
在以下情况下使用此技能:
- 准备参加Kaggle竞赛
- 寻找特定领域(如NLP、CV等)的已验证技术
- 需要常见机器学习任务的代码模板
- 想从竞赛获胜者学习
知识类别
| 类别 | 焦点 | 目录 |
|---|---|---|
| NLP | 文本分类、命名实体识别、翻译、大型语言模型应用 | references/knowledge/nlp/ |
| CV | 图像分类、检测、分割、生成 | references/knowledge/cv/ |
| 时间序列 | 预测、异常检测、序列建模 | references/knowledge/time-series/ |
| 表格数据 | 特征工程、传统机器学习、结构化数据 | references/knowledge/tabular/ |
| 多模态 | 跨模态任务、视觉语言模型 | references/knowledge/multimodal/ |
文件组织结构:每个竞赛一个独立的 markdown 文件,按 domain 分类到对应目录。
示例:
time-series/birdclef-plus-2025.mdnlp/aimo-2-2025.md
快速参考
从竞赛学习:
- 提供Kaggle竞赛URL
- kaggle-miner代理将提取获胜方案
- 知识自动添加到相关类别
- 前排方案详细技术分析 自动包含
浏览现有知识:
- 浏览相关 domain 目录:
references/knowledge/[domain]/ - 每个竞赛一个独立文件,包含:
- 竞赛简介
- 前排方案详细技术分析 ⭐
- 代码模板
- 最佳实践
自我演化
此技能在kaggle-miner代理处理新竞赛时自动更新其知识库。使用越多,变得越智能。
知识提取标准
每次从 Kaggle 竞赛提取知识时,必须包含以下标准部分:
必需内容清单
| 部分 | 说明 | 必需性 |
|---|---|---|
| 竞赛简介 | 竞赛背景、任务描述、数据规模、评估指标 | ✅ 必需 |
| 原始摘要 | 前排方案的简要概述 | ✅ 必需 |
| 前排方案详细技术分析 | Top 20 方案的核心技巧和实现细节 | ✅ 必需 ⭐ |
| 代码模板 | 可复用的代码模板 | ✅ 必需 |
| 最佳实践 | 最佳实践和常见陷阱 | ✅ 必需 |
| 元数据 | 数据源标签和日期 | ✅ 必需 |
前排方案详细技术分析格式
每个前排方案应包含:
- 排名和团队/作者
- 核心技巧列表 (3-6 个关键技术点)
- 实现细节 (具体的参数、配置、数据)
示例格式:
**排名 Place - 核心技术名称 (作者)**
核心技巧:
- **技巧1**: 简短说明
- **技巧2**: 简短说明
实现细节:
- 具体参数、模型、配置
- 数据和实验结果
建议覆盖 Top 20 方案,获取更多前排选手的创新技巧
额外资源
知识目录
references/knowledge/nlp/- NLP竞赛技术references/knowledge/cv/- 计算机视觉技术references/knowledge/time-series/- 时间序列方法references/knowledge/tabular/- 表格数据方法references/knowledge/multimodal/- 多模态解决方案
竞赛示例
- BirdCLEF+ 2025 (
time-series/birdclef-plus-2025.md) - 包含完整的 Top 14 前排方案详细技术分析 - BirdCLEF 2024 (
time-series/birdclef-2024.md) - 包含 Top 3 方案详细技术分析 - AIMO-2 (
nlp/aimo-2-2025.md) - 包含 Top 12+ 前排方案技术总结