name: ml-paper-writing description: 为NeurIPS、ICML、ICLR、ACL、AAAI、COLM撰写可发表的ML/AI论文。用于从研究仓库起草论文、进行文献综述、查找相关工作、验证引用或准备最终提交。包括LaTeX模板、引用验证工作流和论文发现/评估标准。 version: 1.0.0 author: Orchestra Research license: MIT tags: [学术写作, NeurIPS, ICML, ICLR, ACL, AAAI, COLM, LaTeX, 论文写作, 引用, 研究] dependencies: [semanticscholar, arxiv, habanero, requests]
顶级AI会议ML论文写作
针对NeurIPS、ICML、ICLR、ACL、AAAI和COLM撰写可发表论文的专家级指导。此技能结合了顶级研究人员(Nanda、Farquhar、Karpathy、Lipton、Steinhardt)的写作哲学与实用工具:LaTeX模板、引用验证API和会议清单。
核心理念:协作式写作
论文写作是协作的,但Claude应主动交付草稿。
典型工作流从包含代码、结果和实验产物的研究仓库开始。Claude的角色是:
- 理解项目:通过探索仓库、结果和现有文档
- 交付完整初稿:当对贡献有信心时
- 文献检索:使用网络搜索和API查找相关引用
- 基于反馈循环优化:当科学家提供输入时
- 请求澄清:仅当对关键决策真正不确定时
关键原则:主动。如果仓库和结果清晰,交付完整草稿。不要等待每个部分的反馈——科学家很忙。提供具体内容供他们反应,然后基于响应迭代。
⚠️ 关键:绝不捏造引用
这是学术写作中使用AI辅助的最重要规则。
问题
AI生成的引用有约40%的错误率。捏造的引用——不存在的论文、错误作者、不正确年份、伪造DOI——是严重的学术不端行为,可能导致桌面拒绝或撤回。
规则
绝不从记忆生成BibTeX条目。始终通过编程获取。
| 操作 | ✅ 正确 | ❌ 错误 |
|---|---|---|
| 添加引用 | 搜索API → 验证 → 获取BibTeX | 从记忆写BibTeX |
| 不确定论文 | 标记为[CITATION NEEDED] |
猜测引用 |
| 找不到确切论文 | 注释:“占位符 - 验证” | 发明听起来相似的论文 |
当无法验证引用时
如果无法通过编程验证引用,必须:
% 显式占位符 - 需要人工验证
\cite{PLACEHOLDER_author2024_verify_this} % TODO: 验证此引用存在
始终告知科学家:“我已标记[X]个引用为需要验证的占位符。我无法确认这些论文存在。”
推荐:安装Exa MCP用于论文搜索
为最佳论文搜索体验,安装Exa MCP,提供实时学术搜索:
Claude Code:
claude mcp add exa -- npx -y mcp-remote "https://mcp.exa.ai/mcp"
Cursor / VS Code (添加到MCP设置):
{
"mcpServers": {
"exa": {
"type": "http",
"url": "https://mcp.exa.ai/mcp"
}
}
}
Exa MCP支持搜索如:
- “查找2023年后发表的关于语言模型RLHF的论文”
- “搜索Vaswani的Transformer架构论文”
- “获取可解释性稀疏自编码器的最新工作”
然后通过Semantic Scholar API验证结果并通过DOI获取BibTeX。
工作流0:从研究仓库开始
开始论文写作时,首先理解项目:
项目理解:
- [ ] 步骤1:探索仓库结构
- [ ] 步骤2:阅读README、现有文档和关键结果
- [ ] 步骤3:与科学家确定主要贡献
- [ ] 步骤4:查找代码库中已引用的论文
- [ ] 步骤5:搜索额外相关文献
- [ ] 步骤6:一起概述论文结构
- [ ] 步骤7:基于反馈迭代起草章节
步骤1:探索仓库
# 理解项目结构
ls -la
find . -name "*.py" | head -20
find . -name "*.md" -o -name "*.txt" | xargs grep -l -i "结果\|结论\|发现"
查找:
README.md- 项目概述和声明results/、outputs/、experiments/- 关键发现configs/- 实验设置- 现有
.bib文件或引用参考 - 任何草稿文档或笔记
步骤2:识别现有引用
检查代码库中已引用的论文:
# 查找现有引用
grep -r "arxiv\|doi\|cite" --include="*.md" --include="*.bib" --include="*.py"
find . -name "*.bib"
这些是相关工作的信号起点——科学家已认为它们相关。
步骤3:澄清贡献
写作前,与科学家明确确认:
“基于我对仓库的理解,主要贡献似乎是[X]。 关键结果显示[Y]。这是您希望论文的框架吗, 或者我们应该强调不同方面?”
绝不假设叙事——始终与人类验证。
步骤4:搜索额外文献
使用网络搜索查找相关论文:
尝试搜索查询:
- "[主要技术] + [应用领域]"
- "[基线方法] 比较"
- "[问题名称] 最先进"
- 现有引用中的作者名
然后使用以下引用工作流验证和检索BibTeX。
步骤5:交付初稿
主动——交付完整草稿而非请求每个部分的许可。
如果仓库提供清晰结果且贡献明显:
- 端到端撰写完整初稿
- 呈现完整草稿供反馈
- 基于科学家响应迭代
如果对框架或主要声明真正不确定:
- 起草您有信心的部分
- 标记特定不确定性:“我将X框架为主要贡献——如果您更愿强调Y,请告知”
- 继续草稿而非阻塞
与草稿一起包含的问题(非之前):
- “我将X强调为主要贡献——如需调整”
- “我突出结果A、B、C——告知是否其他更重要”
- “相关工作部分包括[论文]——添加我遗漏的任何”
何时使用此技能
使用此技能当:
- 从研究仓库开始撰写论文
- 起草或修订特定章节
- 进行文献综述和查找相关工作
- 在您的研究领域发现近期论文
- 查找和验证引用用于相关工作
- 格式化会议提交
- 重新提交到不同场所(格式转换)
- 迭代草稿基于科学家反馈
始终记住:初稿是讨论的起点,非最终输出。
工作流:文献研究与论文发现
进行文献综述、查找相关工作或发现近期论文时,使用此工作流系统性搜索、评估和选择ML论文。
工作流5:查找与评估论文
文献研究流程:
- [ ] 步骤1:定义搜索范围和关键词
- [ ] 步骤2:搜索arXiv和学术数据库
- [ ] 步骤3:通过标题/摘要筛选论文
- [ ] 步骤4:评估论文质量(5个维度)
- [ ] 步骤5:选择顶级论文并提取引用
- [ ] 步骤6:通过编程验证引用
步骤1:定义搜索范围
识别特定研究领域、方法或应用:
- 技术聚焦:
transformer架构、图神经网络、自监督学习 - 应用聚焦:
医学图像分析、机器人强化学习、语言模型对齐 - 问题聚焦:
分布外泛化、持续学习、ML公平性
步骤2:搜索arXiv
使用带目标关键词的arXiv搜索:
URL模式:
https://arxiv.org/search/?searchtype=all&query=关键词&abstracts=show&order=-announced_date_first
示例搜索:
- https://arxiv.org/search/?searchtype=all&query=graph+neural+networks&abstracts=show&order=-announced_date_first
- https://arxiv.org/search/?cat:cs.LG+AND+all:transformer&abstracts=show&order=-announced_date_first
提示:
- 组合关键词用
+表示AND - 按类别过滤:
cs.LG、cs.AI、cs.CV、cs.CL - 按
announced_date_first排序获取近期论文 - 可用时使用Chrome MCP工具自动化
步骤3:筛选论文
通过标题和摘要快速筛选:
- 与研究主题相关性
- 贡献新颖性
- 场所/作者声誉
- 代码可用性(检查GitHub链接)
步骤4:评估质量
使用5维度质量标准:
| 维度 | 权重 | 评估焦点 |
|---|---|---|
| 创新 | 30% | 新颖性和原创性 |
| 方法完整性 | 25% | 清晰性和可复现性 |
| 实验全面性 | 25% | 验证深度 |
| 写作质量 | 10% | 呈现清晰度 |
| 相关性&影响 | 10% | 领域重要性 |
评分:每个维度评分1-5,计算加权总分
步骤5:选择与提取
- 按总分排名论文
- 选择顶级论文进行详细审查
- 提取元数据:标题、作者、arXiv ID、摘要
- 记下代码仓库链接
步骤6:验证引用
对于选定论文,使用Semantic Scholar API验证引用:
- 通过DOI编程获取BibTeX
- 标记未验证引用为
[CITATION NEEDED] - 以验证状态存储在参考文献中
何时使用文献研究
使用此工作流当:
- 开始新项目:查找相关工作和基线
- 撰写相关工作部分:发现您领域的近期论文
- 保持更新:跟踪您领域的最新出版物
- 查找基线:识别最先进方法进行比较
- 文献综述:研究领域的全面调查
质量阈值
- 优秀:4.0+(肯定包括)
- 良好:3.5-3.9(如果相关包括)
- 一般:3.0-3.4(如果高度相关包括)
- 差:<3.0(排除除非必要)
参考文件
详细文献研究指南:
references/literature-research/arxiv-search-guide.md- arXiv搜索策略和URL模式references/literature-research/paper-quality-criteria.md- 详细5维度评估标准
知识库:ML论文写作模式
此技能维护从成功ML会议论文提取的写作模式、技术和要求的策划知识库。知识库随您分析更多论文而增长。
知识组织
知识库在references/knowledge/下组织为4类:
| 类别 | 文件 | 内容 |
|---|---|---|
| 结构 | structure.md |
论文组织、IMRaD模式、过渡、章节流 |
| 写作技巧 | writing-techniques.md |
句子模式、过渡短语、清晰技术 |
| 提交指南 | submission-guides.md |
场所要求(NeurIPS、ICML、ICLR、ACL、AAAI、COLM) |
| 评审响应 | review-response.md |
反驳策略、处理评审评论 |
知识库如何维护
paper-miner代理自动从您提供的论文提取和分类写作知识:
您:"从这篇NeurIPS论文学习写作技巧:路径/to/paper.pdf"
↓
paper-miner分析论文
↓
提取模式 → 分类为4类 → 更新知识文件
↓
知识随每篇分析论文增长
提取内容:
- 结构模式:成功论文如何组织章节、主题间过渡
- 写作技巧:句子模板、过渡短语、清晰方法
- 场所要求:页限、必要章节、格式化规则
- 反驳策略:如何响应特定评审关切
何时使用知识库
用于写作模式:
- 困于如何措辞过渡?检查
writing-techniques.md - 需要结构灵感?浏览
structure.md - 撰写反驳?咨询
review-response.md
用于场所要求:
- 提交到NeurIPS?见
submission-guides.md清单 - 场所间转换?比较页限和要求
- 不确定必要章节?每个场所有特定要求
贡献到知识库
您分析的每篇论文使知识库更丰富未来使用:
# 从任何上下文触发paper-miner
"从这篇论文提取写作模式:路径/to/paper.pdf"
"分析https://arxiv.org/abs/2301.xxxxx的结构"
"这篇ICLR论文使用什么写作技巧?"
paper-miner代理:
- 提取论文内容(PDF、DOCX或arXiv链接)
- 分析IMRaD结构和写作模式
- 识别场所特定要求
- 用新模式更新适当知识文件
- 报告添加内容带来源归属
知识库原则
仅可操作模式:每个条目提供带示例的可重用技术。
来源归属:每个模式引用其来源论文以可追溯性。
无重复:添加新模式前检查现有内容。
质量胜于数量:专注于有效技术,非全面列表。
见references/knowledge/README.md获取完整知识库文档。
平衡主动性与协作
默认:主动。交付草稿,然后迭代。
| 置信水平 | 操作 |
|---|---|
| 高(清晰仓库,明显贡献) | 撰写完整草稿,交付,基于反馈迭代 |
| 中(一些模糊性) | 起草带标记不确定性的草稿,继续 |
| 低(主要未知) | 问1-2个目标问题,然后起草 |
先起草,随草稿提问(非之前):
| 章节 | 自主起草 | 随草稿标记 |
|---|---|---|
| 摘要 | 是 | “框架贡献为X——如需调整” |
| 引言 | 是 | “强调问题Y——如果错误纠正” |
| 方法 | 是 | “包含细节A、B、C——添加缺失部分” |
| 实验 | 是 | “突出结果1、2、3——如需重新排序” |
| 相关工作 | 是 | “引用论文X、Y、Z——添加我遗漏的任何” |
仅在以下情况阻塞输入:
- 目标场所不清晰(影响页限、框架)
- 多个矛盾框架似乎同样有效
- 结果似乎不完整或不一致
- 明确请求在继续前审查
不阻塞:
- 词汇选择决策
- 章节排序
- 显示哪些具体结果(做选择,标记它)
- 引用完整性(用您找到的起草,记下空白)
叙事原则
最关键的见解:您的论文不是实验集合——它是一个有清晰贡献由证据支持的故事。
每篇成功ML论文围绕Neel Nanda称为"叙事"的东西:一个简短、严谨、基于证据的技术故事,有读者关心的要点。
三大支柱(必须在引言结尾前清晰):
| 支柱 | 描述 | 示例 |
|---|---|---|
| 什么 | 1-3个具体新颖声明在连贯主题内 | “我们证明在条件Z下X实现Y” |
| 为什么 | 支持声明的严谨经验证据 | 强基线,区分假设的实验 |
| 所以什么 | 为什么读者应该关心 | 连接已识别社区问题 |
如果您无法用一句话陈述您的贡献,您还没有论文。
论文结构工作流
工作流1:撰写完整论文(迭代)
复制此清单并跟踪进度。每步涉及起草 → 反馈 → 修订:
论文写作进度:
- [ ] 步骤1:定义一句贡献(与科学家)
- [ ] 步骤2:起草图1 → 获取反馈 → 修订
- [ ] 步骤3:起草摘要 → 获取反馈 → 修订
- [ ] 步骤4:起草引言 → 获取反馈 → 修订
- [ ] 步骤5:起草方法 → 获取反馈 → 修订
- [ ] 步骤6:起草实验 → 获取反馈 → 修订
- [ ] 步骤7:起草相关工作 → 获取反馈 → 修订
- [ ] 步骤8:起草限制 → 获取反馈 → 修订
- [ ] 步骤9:完成论文清单(必需)
- [ ] 步骤10:最终审查周期和提交
步骤1:定义一句贡献
此步需要科学家明确确认。
撰写任何内容前,阐明并验证:
- 您的论文贡献的单件事是什么?
- 在您工作前不明显或不存在的是什么?
“我建议框架贡献为:‘[一句]’。这捕捉 您看到的主要要点吗?我们应该调整重点吗?”
步骤2:起草图1
图1值得特别关注——许多读者直接跳到它。
- 传达核心理念、方法或最引人注目的结果
- 使用矢量图形(绘图用PDF/EPS)
- 撰写无需主文可独立的标题
- 确保黑白可读性(8%男性有色觉缺陷)
步骤3:写摘要(5句公式)
来自Sebastian Farquhar(DeepMind):
1. 您实现了什么:"我们介绍..."、"我们证明..."、"我们展示..."
2. 为什么这难且重要
3. 您如何做(用专业关键词可发现性)
4. 您有什么证据
5. 您最显著数字/结果
删除通用开头如"大型语言模型已取得显著成功…"
步骤4:写引言(最大1-1.5页)
必须包括:
- 2-4个子弹贡献列表(双栏格式每行最大1-2行)
- 清晰问题陈述
- 简要方法概述
- 方法应最大在页2-3开始
步骤5:方法章节
启用重新实现:
- 概念概述或伪代码
- 列出所有超参数
- 架构细节足够复现
- 呈现最终设计决策;消融实验在实验部分
步骤6:实验章节
对每个实验,明确陈述:
- 它支持什么声明
- 如何连接到主要贡献
- 实验设置(细节在附录)
- 观察什么:“蓝线显示X,展示Y”
要求:
- 带方法论的误差条(标准差 vs 标准误差)
- 超参数搜索范围
- 计算基础设施(GPU类型、总小时)
- 种子设置方法
步骤7:相关工作
方法论组织,非逐篇论文:
好: “一行工作使用Floogledoodle的假设[引用]而我们使用Doobersnoddle的假设因为…”
差: “Snap等人介绍了X而Crackle等人介绍了Y。”
慷慨引用——评审可能相关论文作者。
步骤8:限制章节(必需)
所有主要会议要求此。反直觉地,诚实帮助:
- 评审被指示不惩罚诚实限制承认
- 通过首先识别弱点预批评
- 解释为什么限制不削弱核心声明
步骤9:论文清单
NeurIPS、ICML和ICLR都要求论文清单。见references/checklists.md。
顶级ML会议写作哲学
此节提炼来自领先ML研究人员的最重要写作原则。这些不是可选风格建议——它们区分接受与被拒绝论文。
“论文是一个简短、严谨、基于证据的技术故事,有读者关心的要点。” — Neel Nanda
此指导背后的来源
此技能综合了在顶级场所广泛发表的研究人员的写作哲学:
| 来源 | 关键贡献 | 链接 |
|---|---|---|
| Neel Nanda (Google DeepMind) | 叙事原则,什么/为什么/所以什么框架 | 如何写ML论文 |
| Sebastian Farquhar (DeepMind) | 5句摘要公式 | 如何写ML论文 |
| Gopen & Swan | 7个读者期望原则 | 科学写作科学 |
| Zachary Lipton | 词汇选择,消除犹豫 | 科学写作启发式 |
| Jacob Steinhardt (UC Berkeley) | 精确性,一致术语 | 写作提示 |
| Ethan Perez (Anthropic) | 微观清晰提示 | 简易论文写作提示 |
| Andrej Karpathy | 单贡献焦点 | 各种讲座 |
深入任何这些,见:
- references/writing-guide.md - 带示例的完整解释
- references/sources.md - 完整参考文献
时间分配(来自Neel Nanda)
大约花相等时间在每项:
- 摘要
- 引言
- 图
- 其他一切组合
为什么? 大多数评审在到达您的方法前形成判断。读者遇到您的论文为:标题 → 摘要 → 引言 → 图 → 可能其余。
写作风格指南
句子级清晰(Gopen & Swan的7原则)
这些原则基于读者实际如何处理散文。违反它们迫使读者花认知努力在结构而非内容上。
| 原则 | 规则 | 示例 |
|---|---|---|
| 主语-动词邻近 | 保持主语和动词接近 | ❌ “模型,训练在…上,实现” → ✅ “模型实现…在训练在…上后” |
| 强调位置 | 将强调放在句子末尾 | ❌ “当使用注意力时准确度提高15%” → ✅ “当使用注意力时,准确度提高15%” |
| 主题位置 | 放语境第一,新信息后 | ✅ “给定这些约束,我们提出…” |
| 旧前新 | 熟悉信息 → 不熟悉信息 | 链接向后,然后引入新 |
| 一单元一功能 | 每段落做一个点 | 分割多点段落 |
| 动词中行动 | 用动词,非名词化 | ❌ “我们进行了分析” → ✅ “我们分析了” |
| 新前语境 | 在呈现前设置舞台 | 展示方程前解释 |
完整7原则带详细示例: 见references/writing-guide.md
微观提示(Ethan Perez)
这些小变化积累成显著更清晰的散文:
- 最小化代词: ❌ “这显示…” → ✅ “此结果显示…”
- 动词早: 位置动词在句子开始附近
- 展开撇号: ❌ “X的Y” → ✅ “X的Y”(当尴尬时)
- 删除填充词: “实际上”、“有点”、“非常”、“真的”、“基本上”、“相当”、“本质上”
完整微观提示带示例: 见references/writing-guide.md
词汇选择(Zachary Lipton)
- 具体: ❌ “性能” → ✅ “准确度"或"延迟”(说您的意思)
- 消除犹豫: 删除"可能"和"可以"除非真正不确定
- 避免增量词汇: ❌ “结合”、“修改”、“扩展” → ✅ “开发”、“提出”、“介绍”
- 删除强化词: ❌ “提供非常紧密近似” → ✅ “提供紧密近似”
精确性胜于简洁(Jacob Steinhardt)
- 一致术语: 同一概念不同术语造成混乱。选一个并坚持。
- 形式陈述假设: 定理前,明确列出所有假设
- 直觉 + 严谨: 提供直观解释伴随形式证明
评审实际阅读什么
理解评审行为帮助优先努力:
| 论文章节 | % 阅读的评审 | 影响 |
|---|---|---|
| 摘要 | 100% | 必须完美 |
| 引言 | 90%+(略读) | 前载贡献 |
| 图 | 在方法前检查 | 图1关键 |
| 方法 | 仅如果感兴趣 | 不埋导语 |
| 附录 | 很少 | 仅放补充细节 |
底线:如果您的摘要和引言不吸引评审,他们可能永远不会读您的出色方法章节。
会议要求快速参考
| 会议 | 页限 | 最终提交额外 | 关键要求 |
|---|---|---|---|
| NeurIPS 2025 | 9页 | +0 | 强制清单,接受后摘要 |
| ICML 2026 | 8页 | +1 | 要求更广泛影响声明 |
| ICLR 2026 | 9页 | +1 | 要求LLM披露,互惠评审 |
| ACL 2025 | 8页(长) | 变化 | 强制限制章节 |
| AAAI 2026 | 7页 | +1 | 严格样式文件遵守 |
| COLM 2025 | 9页 | +1 | 专注于语言模型 |
通用要求:
- 双盲评审(匿名化提交)
- 引用不计入页限
- 附录无限但评审不需读
- LaTeX所有场所必需
LaTeX模板: 见templates/目录所有会议模板。
正确使用LaTeX模板
工作流4:从模板开始新论文
始终首先复制整个模板目录,然后在其中编写。
模板设置清单:
- [ ] 步骤1:复制整个模板目录到新项目
- [ ] 步骤2:验证模板原样编译(在任何更改前)
- [ ] 步骤3:阅读模板的示例内容理解结构
- [ ] 步骤4:按章节替换示例内容
- [ ] 步骤5:保持模板注释/示例作为参考直到完成
- [ ] 步骤6:仅在结束时清理模板工件
步骤1:复制完整模板
# 用完整模板创建您的论文目录
cp -r templates/neurips2025/ ~/papers/my-new-paper/
cd ~/papers/my-new-paper/
# 验证结构完整
ls -la
# 应该看到:main.tex、neurips.sty、Makefile等
⚠️ 重要: 复制整个目录,非仅main.tex。模板包括:
- 样式文件(
.sty) - 编译必需 - 参考文献样式(
.bst) - 引用必需 - 示例内容 - 有用作为参考
- Makefiles - 用于简易编译
步骤2:首先验证模板编译
在做出任何更改前,原样编译模板:
# 使用latexmk(推荐)
latexmk -pdf main.tex
# 或手动编译
pdflatex main.tex
bibtex main
pdflatex main.tex
pdflatex main.tex
如果未修改模板不编译,先修复。常见问题:
- 缺失TeX包 → 通过
tlmgr install <package>安装 - 错误TeX分布 → 使用TeX Live(推荐)
步骤3:保持模板内容作为参考
不要立即删除所有示例内容。反而:
% 保持模板示例注释掉当您编写
% 这显示您期望格式
% 模板示例(保持作为参考):
% \begin{figure}[t]
% \centering
% \includegraphics[width=0.8\linewidth]{example-image}
% \caption{模板显示标题样式}
% \end{figure}
% 您的实际图:
\begin{figure}[t]
\centering
\includegraphics[width=0.8\linewidth]{your-figure.pdf}
\caption{您的标题遵循相同样式。}
\end{figure}
步骤4:按章节替换内容
系统性地工作通过论文:
替换顺序:
1. 标题和作者(为提交匿名化)
2. 摘要
3. 引言
4. 方法
5. 实验
6. 相关工作
7. 结论
8. 参考文献(您的.bib文件)
9. 附录
对每章节:
- 阅读模板的示例内容
- 注意任何特殊格式化或使用的宏
- 替换为您的遵循相同模式的内容
- 频繁编译及早捕获错误
步骤5:使用模板宏
模板常定义有用宏。检查前导:
% 常用模板宏使用:
ewcommand{\method}{您的MethodName} % 一致方法命名
ewcommand{\eg}{e.g.,\xspace} % 适当缩写
ewcommand{\ie}{i.e.,\xspace}
ewcommand{\etal}{\textit{et al.}\xspace}
步骤6:仅在结束时清理
仅当论文接近完成时移除模板工件:
% 提交前 - 移除这些:
% - 注释掉的模板示例
% - 未使用的包
% - 模板的示例图/表
% - Lorem ipsum或占位符文本
% 保持这些:
% - 所有样式文件(.sty)
% - 参考文献样式(.bst)
% - 模板所需包
% - 您使用的任何自定义宏
模板陷阱避免
| 陷阱 | 问题 | 解决方案 |
|---|---|---|
仅复制main.tex |
缺失.sty,不编译 |
复制整个目录 |
修改.sty文件 |
破坏会议格式化 | 绝不编辑样式文件 |
| 添加随机包 | 冲突,破坏模板 | 仅添加如果必要 |
| 太早删除模板内容 | 失去格式化参考 | 保持为注释直到完成 |
| 不频繁编译 | 错误累积 | 每章节后编译 |
快速模板参考
| 会议 | 主文件 | 关键样式文件 | 备注 |
|---|---|---|---|
| NeurIPS 2025 | main.tex |
neurips.sty |
有Makefile |
| ICML 2026 | example_paper.tex |
icml2026.sty |
包括算法包 |
| ICLR 2026 | iclr2026_conference.tex |
iclr2026_conference.sty |
有math_commands.tex |
| ACL | acl_latex.tex |
acl.sty |
严格格式化 |
| AAAI 2026 | aaai2026-unified-template.tex |
aaai2026.sty |
非常严格遵守 |
| COLM 2025 | colm2025_conference.tex |
colm2025_conference.sty |
类似ICLR |
会议重新提交 & 格式转换
当论文从一个场所被拒绝或撤回并重新提交到另一个时,需要格式转换。这在ML研究中是常见工作流。
工作流3:在会议格式间转换
格式转换清单:
- [ ] 步骤1:识别源和目标模板差异
- [ ] 步骤2:创建带目标模板的新项目
- [ ] 步骤3:复制内容章节(非前导)
- [ ] 步骤4:调整页限和内容
- [ ] 步骤5:更新会议特定要求
- [ ] 步骤6:验证编译和格式化
步骤1:关键模板差异
| 从 → 到 | 页变化 | 关键调整 |
|---|---|---|
| NeurIPS → ICML | 9 → 8页 | 切1页,添加更广泛影响如果缺失 |
| ICML → ICLR | 8 → 9页 | 可扩展实验,添加LLM披露 |
| NeurIPS → ACL | 9 → 8页 | 为NLP惯例重构,添加限制 |
| ICLR → AAAI | 9 → 7页 | 需要显著削减,严格样式遵守 |
| 任何 → COLM | 变化 → 9 | 为语言模型重点重构 |
步骤2:内容迁移(非模板合并)
绝不复制LaTeX前导在模板间。反而:
# 1. 以目标模板新鲜开始
cp -r templates/icml2026/ new_submission/
# 2. 复制仅内容章节从旧论文
# - 摘要文本
# - 章节内容(在\section{}命令间)
# - 图和表
# - 参考文献条目
# 3. 粘贴到目标模板结构
步骤3:调整页限
当削减页(例如,NeurIPS 9 → AAAI 7):
- 移动详细证明到附录
- 压缩相关工作(引用综述而非个别论文)
- 合并类似实验到统一表
- 使用较小图尺寸带子图
- 收紧写作:消除冗余,使用主动语态
当扩展(例如,ICML 8 → ICLR 9):
- 添加评审请求的消融研究
- 扩展限制讨论
- 包括额外基线
- 添加定性示例
步骤4:会议特定调整
| 目标场所 | 必需添加 |
|---|---|
| ICML | 更广泛影响声明(结论后) |
| ICLR | LLM使用披露,互惠评审协议 |
| ACL/EMNLP | 限制章节(强制),道德声明 |
| AAAI | 严格遵守样式文件(无修改) |
| NeurIPS | 论文清单(附录),接受后摘要 |
步骤5:更新参考文献
% 移除揭示身份的自引用(为盲评审)
% 更新任何"评审中"引用到发表版本
% 添加上次提交后发表的新的相关工作
步骤6:处理先前评审
当拒绝后重新提交:
- 做 在新版本中解决评审关切
- 做 添加评审请求的实验/澄清
- 不做 包括"先前提交变更"章节(盲评审)
- 不做 引用先前提交或评审
常见转换陷阱:
- ❌ 复制
\usepackage命令(导致冲突) - ❌ 保留旧会议页眉/页脚命令
- ❌ 忘记更新
\bibliography{}路径 - ❌ 缺失会议特定必需章节
- ❌ 格式更改后超出页限
引用工作流(捏造预防)
⚠️ 关键: AI生成的引用有约40%错误率。绝不从记忆写BibTeX。
黄金规则
如果 您无法通过网络搜索验证引用:
→ 标记它为[CITATION NEEDED]或[PLACEHOLDER - VERIFY]
→ 明确告知科学家
→ 绝不发明听起来合理的引用
强制: 使用WebSearch工具在添加到参考文献前验证每个引用。
工作流2:添加引用
引用验证(每个引用强制):
- [ ] 步骤1:使用WebSearch查找论文
- [ ] 步骤2:在Google Scholar验证论文存在
- [ ] 步骤3:确认论文细节(标题、作者、年、场所)
- [ ] 步骤4:从Google Scholar或DOI检索BibTeX
- [ ] 步骤5:验证您引用的声明实际出现在论文中
- [ ] 步骤6:添加已验证BibTeX到参考文献
- [ ] 步骤7:如果任何步骤失败 → 标记为占位符,通知科学家
步骤1:使用WebSearch查找论文
当您需要引用论文时,始终以网络搜索开始:
WebSearch查询示例:
- "Attention is All You Need Vaswani 2017"
- "RLHF language model alignment 2023"
- "sparse autoencoders interpretability Anthropic"
- "transformer architecture NeurIPS"
在搜索结果中查找什么:
- 论文标题匹配您的意图引用
- 作者正确
- 出版年正确
- 场所(会议/期刊)识别
步骤2:在Google Scholar验证
找到论文后,在Google Scholar验证其存在:
WebSearch查询:"site:scholar.google.com [论文标题] [第一作者]"
示例:"site:scholar.google.com Attention is All You Need Vaswani"
验证清单:
- ✅ 论文出现在Google Scholar结果
- ✅ 标题精确匹配(或非常接近)
- ✅ 作者匹配
- ✅ 年匹配
- ✅ 场所列出(会议/期刊)
- ✅ 引用计数合理(旧论文非0)
如果论文未在Google Scholar找到:
- ❌ 停止 - 不引用
- 标记为
[CITATION NEEDED - not found on Google Scholar] - 明确通知科学家
步骤3:确认论文细节
在检索BibTeX前,双重检查所有细节:
验证清单:
- 标题:[来自Google Scholar的精确标题]
- 作者:[所有作者,按顺序]
- 年:[出版年]
- 场所:[会议/期刊名]
- DOI:[如果可用]
步骤4:检索BibTeX
选项1:来自Google Scholar(推荐)
- 在Google Scholar上找到论文
- 点击论文下方的"引用"按钮
- 选择"BibTeX"格式
- 复制BibTeX条目
选项2:来自DOI(如果可用)
- 使用WebSearch查找:
"doi.org/[DOI]" - 在出版商页面查找BibTeX导出选项
- 复制BibTeX条目
选项3:来自arXiv(预印本)
- 在arXiv上找到论文
- 点击右侧边栏的"Export BibTeX Citation"
- 复制BibTeX条目
关键: 绝不从记忆写BibTeX。始终从已验证源复制。
步骤5:验证声明
在为特定声明引用前,验证声明实际出现在论文中:
验证过程:
1. 使用WebSearch访问论文(PDF或HTML)
2. 搜索与您的声明相关的关键词
3. 确认声明明确陈述或清晰隐含
4. 记下声明出现的章节/页
如果您无法访问论文:
- ❌ 不为特定声明引用
- 仅为一般贡献引用(如果在Google Scholar验证)
- 标记为
[CLAIM NOT VERIFIED - no access to paper]
步骤6:添加已验证BibTeX到参考文献
仅在完成所有验证步骤后:
% 添加到您的.bib文件
@inproceedings{vaswani2017attention,
title={Attention is All You Need},
author={Vaswani, Ashish and Shazeer, Noam and ...},
booktitle={Advances in Neural Information Processing Systems},
year={2017}
}
% 在您论文中使用
\cite{vaswani2017attention}
步骤7:明确处理失败
如果您无法在任一步验证引用:
% 选项1:显式占位符
\cite{PLACEHOLDER_smith2023_verify} % TODO: 无法验证 - 科学家必须确认
% 选项2:文本中注释
... 如先前工作所示[CITATION NEEDED - could not verify Smith et al. 2023]。
始终告知科学家:
"我无法验证以下引用并已标记它们为占位符:
- Smith等人2023关于奖励黑客 - 未在Google Scholar找到
- Jones 2022关于缩放定律 - 找到类似论文但不同作者 提交前请验证这些。"
总结:引用规则
| 情况 | 操作 |
|---|---|
| 在Google Scholar找到,验证细节,获得BibTeX | ✅ 使用引用 |
| 找到论文,在Google Scholar验证,无BibTeX | ✅ 从Google Scholar信息创建BibTeX |
| 论文存在但细节不匹配 | ⚠️ 标记占位符,通知科学家 |
| 未在Google Scholar找到 | ❌ 标记[CITATION NEEDED],通知科学家 |
| “我认为有关于X的论文” | ❌ 绝不引用 - 先搜索或标记占位符 |
🚨 绝不从记忆生成BibTeX—始终通过WebSearch和Google Scholar验证。 🚨
完整引用工作流示例
场景: 您需要引用Transformer论文。
步骤1:WebSearch
查询:"Attention is All You Need Vaswani 2017"
结果:在多个源找到论文
步骤2:Google Scholar验证
查询:"site:scholar.google.com Attention is All You Need Vaswani"
结果:✅ 论文找到,50,000+引用,NeurIPS 2017
步骤3:确认细节
- 标题:"Attention is All You Need"
- 作者:Vaswani, Ashish; Shazeer, Noam; Parmar, Niki; ...
- 年:2017
- 场所:NeurIPS (NIPS)
- DOI:可用
步骤4:检索BibTeX
- 点击Google Scholar上的"引用"
- 选择BibTeX格式
- 复制条目
步骤5:验证声明
- 通过WebSearch访问论文
- 确认声明出现在论文中
- 记下章节/页
步骤6:添加到参考文献
- 粘贴BibTeX到.bib文件
- 在论文中使用\cite{vaswani2017attention}
步骤7:成功
- 引用已验证并添加
- 无需占位符
常见问题与解决方案
问题:摘要太通用
删除第一句如果它可前置到任何ML论文。以您的具体贡献开始。
问题:引言超过1.5页
拆分背景到相关工作。前载贡献子弹。方法应最大在页2-3开始。
问题:实验缺乏明确声明
在每个实验前添加句子:“此实验测试是否[具体声明]…”
问题:评审发现论文难跟随
- 添加明确路标:“在此章节,我们展示X”
- 贯穿使用一致术语
- 包括可独立的图标题
问题:缺失统计显著性
始终包括:
- 误差条(指定:标准差或标准误差)
- 运行数量
- 统计测试如果比较方法
评审评估标准
评审在四个维度评估论文:
| 标准 | 评审查找什么 |
|---|---|
| 质量 | 技术正确性,良好支持的声明 |
| 清晰性 | 清晰写作,专家可复现 |
| 显著性 | 社区影响,推进理解 |
| 原创性 | 新见解(不需要新方法) |
评分(NeurIPS 6点尺度):
- 6: 强接受 - 开创性,无瑕
- 5: 接受 - 技术坚实,高影响
- 4: 边缘接受 - 坚实,有限评估
- 3: 边缘拒绝 - 坚实但弱点超过
- 2: 拒绝 - 技术缺陷
- 1: 强拒绝 - 已知结果或伦理问题
见references/reviewer-guidelines.md获取详细评审指令。
表与图
表
使用booktabs LaTeX包专业表:
\usepackage{booktabs}
\begin{tabular}{lcc}
\toprule
方法 & 准确度 ↑ & 延迟 ↓ \\
\midrule
基线 & 85.2 & 45ms \\
\textbf{我们的} & \textbf{92.1} & 38ms \\
\bottomrule
\end{tabular}
规则:
- 加粗每度量最佳值
- 包括方向符号(↑更高更好,↓更低更好)
- 右对齐数值列
- 一致小数精度
图
- 矢量图形(PDF、EPS)所有绘图和图表
- 光栅(PNG 600 DPI)仅用于照片
- 使用色盲安全调色板(Okabe-Ito或Paul Tol)
- 验证灰度可读性(8%男性有色觉缺陷)
- 无图中标题—标题服务此功能
- 独立标题—读者应无需主文理解
参考与资源
参考文档(深入)
| 文档 | 内容 |
|---|---|
| writing-guide.md | Gopen & Swan 7原则,Ethan Perez微观提示,词汇选择 |
| citation-workflow.md | 引用API,Python代码,BibTeX管理 |
| checklists.md | NeurIPS 16项,ICML、ICLR、ACL要求 |
| reviewer-guidelines.md | 评估标准,评分,反驳 |
| sources.md | 所有来源的完整参考文献 |
| 文献研究: | |
| arxiv-search-guide.md | arXiv搜索策略,URL模式,Chrome MCP自动化 |
| paper-quality-criteria.md | 5维度论文评估标准(创新、方法、实验、写作、影响) |
LaTeX模板
templates/目录中的模板:ICML 2026、ICLR 2026、NeurIPS 2025、ACL/EMNLP、AAAI 2026、COLM 2025。
编译到PDF:
- VS Code/Cursor:安装LaTeX Workshop扩展 + TeX Live → 保存以自动编译
- 命令行:
latexmk -pdf main.tex或pdflatex+bibtex工作流 - 在线:上传到Overleaf
见templates/README.md获取详细设置指令。
关键外部来源
写作哲学:
- Neel Nanda: How to Write ML Papers - 叙事,“什么/为什么/所以什么”
- Farquhar: How to Write ML Papers - 5句摘要
- Gopen & Swan: Science of Scientific Writing - 7个读者期望原则
- Lipton: Heuristics for Scientific Writing - 词汇选择
- Perez: Easy Paper Writing Tips - 微观清晰提示
APIs: Semantic Scholar | CrossRef | arXiv