name: ml-paper-writing description: 为NeurIPS、ICML、ICLR、ACL、AAAI、COLM撰写可发表的ML/AI论文。用于从研究仓库起草论文、进行文献综述、查找相关工作、验证引用或准备最终提交。包括LaTeX模板、引用验证工作流和论文发现/评估标准。 version: 1.0.0 author: Orchestra Research license: MIT tags: [学术写作, NeurIPS, ICML, ICLR, ACL, AAAI, COLM, LaTeX, 论文写作, 引用, 研究] dependencies: [semanticscholar, arxiv, habanero, requests]

顶级AI会议ML论文写作

针对NeurIPS、ICML、ICLR、ACL、AAAI和COLM撰写可发表论文的专家级指导。此技能结合了顶级研究人员（Nanda、Farquhar、Karpathy、Lipton、Steinhardt）的写作哲学与实用工具：LaTeX模板、引用验证API和会议清单。

核心理念：协作式写作

论文写作是协作的，但Claude应主动交付草稿。

典型工作流从包含代码、结果和实验产物的研究仓库开始。Claude的角色是：

理解项目：通过探索仓库、结果和现有文档
交付完整初稿：当对贡献有信心时
文献检索：使用网络搜索和API查找相关引用
基于反馈循环优化：当科学家提供输入时
请求澄清：仅当对关键决策真正不确定时

关键原则：主动。如果仓库和结果清晰，交付完整草稿。不要等待每个部分的反馈——科学家很忙。提供具体内容供他们反应，然后基于响应迭代。

⚠️ 关键：绝不捏造引用

这是学术写作中使用AI辅助的最重要规则。

问题

AI生成的引用有约40%的错误率。捏造的引用——不存在的论文、错误作者、不正确年份、伪造DOI——是严重的学术不端行为，可能导致桌面拒绝或撤回。

规则

绝不从记忆生成BibTeX条目。始终通过编程获取。

操作	✅ 正确	❌ 错误
添加引用	搜索API → 验证 → 获取BibTeX	从记忆写BibTeX
不确定论文	标记为`[CITATION NEEDED]`	猜测引用
找不到确切论文	注释：“占位符 - 验证”	发明听起来相似的论文

当无法验证引用时

如果无法通过编程验证引用，必须：

% 显式占位符 - 需要人工验证
\cite{PLACEHOLDER_author2024_verify_this}  % TODO: 验证此引用存在

始终告知科学家：“我已标记[X]个引用为需要验证的占位符。我无法确认这些论文存在。”

推荐：安装Exa MCP用于论文搜索

为最佳论文搜索体验，安装Exa MCP，提供实时学术搜索：

Claude Code:

claude mcp add exa -- npx -y mcp-remote "https://mcp.exa.ai/mcp"

Cursor / VS Code (添加到MCP设置):

{
  "mcpServers": {
    "exa": {
      "type": "http",
      "url": "https://mcp.exa.ai/mcp"
    }
  }
}

Exa MCP支持搜索如：

“查找2023年后发表的关于语言模型RLHF的论文”
“搜索Vaswani的Transformer架构论文”
“获取可解释性稀疏自编码器的最新工作”

然后通过Semantic Scholar API验证结果并通过DOI获取BibTeX。

工作流0：从研究仓库开始

开始论文写作时，首先理解项目：

项目理解：
- [ ] 步骤1：探索仓库结构
- [ ] 步骤2：阅读README、现有文档和关键结果
- [ ] 步骤3：与科学家确定主要贡献
- [ ] 步骤4：查找代码库中已引用的论文
- [ ] 步骤5：搜索额外相关文献
- [ ] 步骤6：一起概述论文结构
- [ ] 步骤7：基于反馈迭代起草章节

步骤1：探索仓库

# 理解项目结构
ls -la
find . -name "*.py" | head -20
find . -name "*.md" -o -name "*.txt" | xargs grep -l -i "结果\|结论\|发现"

查找：

README.md - 项目概述和声明
results/、outputs/、experiments/ - 关键发现
configs/ - 实验设置
现有.bib文件或引用参考
任何草稿文档或笔记

步骤2：识别现有引用

检查代码库中已引用的论文：

# 查找现有引用
grep -r "arxiv\|doi\|cite" --include="*.md" --include="*.bib" --include="*.py"
find . -name "*.bib"

这些是相关工作的信号起点——科学家已认为它们相关。

步骤3：澄清贡献

写作前，与科学家明确确认：

“基于我对仓库的理解，主要贡献似乎是[X]。关键结果显示[Y]。这是您希望论文的框架吗，或者我们应该强调不同方面？”

绝不假设叙事——始终与人类验证。

步骤4：搜索额外文献

使用网络搜索查找相关论文：

尝试搜索查询：
- "[主要技术] + [应用领域]"
- "[基线方法] 比较"
- "[问题名称] 最先进"
- 现有引用中的作者名

然后使用以下引用工作流验证和检索BibTeX。

步骤5：交付初稿

主动——交付完整草稿而非请求每个部分的许可。

如果仓库提供清晰结果且贡献明显：

端到端撰写完整初稿
呈现完整草稿供反馈
基于科学家响应迭代

如果对框架或主要声明真正不确定：

起草您有信心的部分
标记特定不确定性：“我将X框架为主要贡献——如果您更愿强调Y，请告知”
继续草稿而非阻塞

与草稿一起包含的问题（非之前）：

“我将X强调为主要贡献——如需调整”
“我突出结果A、B、C——告知是否其他更重要”
“相关工作部分包括[论文]——添加我遗漏的任何”

何时使用此技能

使用此技能当：

从研究仓库开始撰写论文
起草或修订特定章节
进行文献综述和查找相关工作
在您的研究领域发现近期论文
查找和验证引用用于相关工作
格式化会议提交
重新提交到不同场所（格式转换）
迭代草稿基于科学家反馈

始终记住：初稿是讨论的起点，非最终输出。

工作流：文献研究与论文发现

进行文献综述、查找相关工作或发现近期论文时，使用此工作流系统性搜索、评估和选择ML论文。

工作流5：查找与评估论文

文献研究流程：
- [ ] 步骤1：定义搜索范围和关键词
- [ ] 步骤2：搜索arXiv和学术数据库
- [ ] 步骤3：通过标题/摘要筛选论文
- [ ] 步骤4：评估论文质量（5个维度）
- [ ] 步骤5：选择顶级论文并提取引用
- [ ] 步骤6：通过编程验证引用

步骤1：定义搜索范围

识别特定研究领域、方法或应用：

技术聚焦：transformer架构、图神经网络、自监督学习
应用聚焦：医学图像分析、机器人强化学习、语言模型对齐
问题聚焦：分布外泛化、持续学习、ML公平性

步骤2：搜索arXiv

使用带目标关键词的arXiv搜索：

URL模式：
https://arxiv.org/search/?searchtype=all&query=关键词&abstracts=show&order=-announced_date_first

示例搜索：
- https://arxiv.org/search/?searchtype=all&query=graph+neural+networks&abstracts=show&order=-announced_date_first
- https://arxiv.org/search/?cat:cs.LG+AND+all:transformer&abstracts=show&order=-announced_date_first

提示：

组合关键词用+表示AND
按类别过滤：cs.LG、cs.AI、cs.CV、cs.CL
按announced_date_first排序获取近期论文
可用时使用Chrome MCP工具自动化

步骤3：筛选论文

通过标题和摘要快速筛选：

与研究主题相关性
贡献新颖性
场所/作者声誉
代码可用性（检查GitHub链接）

步骤4：评估质量

使用5维度质量标准：

维度	权重	评估焦点
创新	30%	新颖性和原创性
方法完整性	25%	清晰性和可复现性
实验全面性	25%	验证深度
写作质量	10%	呈现清晰度
相关性&影响	10%	领域重要性

评分：每个维度评分1-5，计算加权总分

步骤5：选择与提取

按总分排名论文
选择顶级论文进行详细审查
提取元数据：标题、作者、arXiv ID、摘要
记下代码仓库链接

步骤6：验证引用

对于选定论文，使用Semantic Scholar API验证引用：

通过DOI编程获取BibTeX
标记未验证引用为[CITATION NEEDED]
以验证状态存储在参考文献中

何时使用文献研究

使用此工作流当：

开始新项目：查找相关工作和基线
撰写相关工作部分：发现您领域的近期论文
保持更新：跟踪您领域的最新出版物
查找基线：识别最先进方法进行比较
文献综述：研究领域的全面调查

质量阈值

优秀：4.0+（肯定包括）
良好：3.5-3.9（如果相关包括）
一般：3.0-3.4（如果高度相关包括）
差：<3.0（排除除非必要）

参考文件

详细文献研究指南：

references/literature-research/arxiv-search-guide.md - arXiv搜索策略和URL模式
references/literature-research/paper-quality-criteria.md - 详细5维度评估标准

知识库：ML论文写作模式

此技能维护从成功ML会议论文提取的写作模式、技术和要求的策划知识库。知识库随您分析更多论文而增长。

知识组织

知识库在references/knowledge/下组织为4类：

类别	文件	内容
结构	`structure.md`	论文组织、IMRaD模式、过渡、章节流
写作技巧	`writing-techniques.md`	句子模式、过渡短语、清晰技术
提交指南	`submission-guides.md`	场所要求（NeurIPS、ICML、ICLR、ACL、AAAI、COLM）
评审响应	`review-response.md`	反驳策略、处理评审评论

知识库如何维护

paper-miner代理自动从您提供的论文提取和分类写作知识：

您："从这篇NeurIPS论文学习写作技巧：路径/to/paper.pdf"
↓
paper-miner分析论文
↓
提取模式 → 分类为4类 → 更新知识文件
↓
知识随每篇分析论文增长

提取内容：

结构模式：成功论文如何组织章节、主题间过渡
写作技巧：句子模板、过渡短语、清晰方法
场所要求：页限、必要章节、格式化规则
反驳策略：如何响应特定评审关切

何时使用知识库

用于写作模式：

困于如何措辞过渡？检查writing-techniques.md
需要结构灵感？浏览structure.md
撰写反驳？咨询review-response.md

用于场所要求：

提交到NeurIPS？见submission-guides.md清单
场所间转换？比较页限和要求
不确定必要章节？每个场所有特定要求

贡献到知识库

您分析的每篇论文使知识库更丰富未来使用：

# 从任何上下文触发paper-miner
"从这篇论文提取写作模式：路径/to/paper.pdf"
"分析https://arxiv.org/abs/2301.xxxxx的结构"
"这篇ICLR论文使用什么写作技巧？"

paper-miner代理：

提取论文内容（PDF、DOCX或arXiv链接）
分析IMRaD结构和写作模式
识别场所特定要求
用新模式更新适当知识文件
报告添加内容带来源归属

知识库原则

仅可操作模式：每个条目提供带示例的可重用技术。

来源归属：每个模式引用其来源论文以可追溯性。

无重复：添加新模式前检查现有内容。

质量胜于数量：专注于有效技术，非全面列表。

见references/knowledge/README.md获取完整知识库文档。

平衡主动性与协作

默认：主动。交付草稿，然后迭代。

置信水平	操作
高（清晰仓库，明显贡献）	撰写完整草稿，交付，基于反馈迭代
中（一些模糊性）	起草带标记不确定性的草稿，继续
低（主要未知）	问1-2个目标问题，然后起草

先起草，随草稿提问（非之前）：

章节	自主起草	随草稿标记
摘要	是	“框架贡献为X——如需调整”
引言	是	“强调问题Y——如果错误纠正”
方法	是	“包含细节A、B、C——添加缺失部分”
实验	是	“突出结果1、2、3——如需重新排序”
相关工作	是	“引用论文X、Y、Z——添加我遗漏的任何”

仅在以下情况阻塞输入：

目标场所不清晰（影响页限、框架）
多个矛盾框架似乎同样有效
结果似乎不完整或不一致
明确请求在继续前审查

不阻塞：

词汇选择决策
章节排序
显示哪些具体结果（做选择，标记它）
引用完整性（用您找到的起草，记下空白）

叙事原则

最关键的见解：您的论文不是实验集合——它是一个有清晰贡献由证据支持的故事。

每篇成功ML论文围绕Neel Nanda称为"叙事"的东西：一个简短、严谨、基于证据的技术故事，有读者关心的要点。

三大支柱（必须在引言结尾前清晰）：

支柱	描述	示例
什么	1-3个具体新颖声明在连贯主题内	“我们证明在条件Z下X实现Y”
为什么	支持声明的严谨经验证据	强基线，区分假设的实验
所以什么	为什么读者应该关心	连接已识别社区问题

如果您无法用一句话陈述您的贡献，您还没有论文。

论文结构工作流

工作流1：撰写完整论文（迭代）

复制此清单并跟踪进度。每步涉及起草 → 反馈 → 修订：

论文写作进度：
- [ ] 步骤1：定义一句贡献（与科学家）
- [ ] 步骤2：起草图1 → 获取反馈 → 修订
- [ ] 步骤3：起草摘要 → 获取反馈 → 修订
- [ ] 步骤4：起草引言 → 获取反馈 → 修订
- [ ] 步骤5：起草方法 → 获取反馈 → 修订
- [ ] 步骤6：起草实验 → 获取反馈 → 修订
- [ ] 步骤7：起草相关工作 → 获取反馈 → 修订
- [ ] 步骤8：起草限制 → 获取反馈 → 修订
- [ ] 步骤9：完成论文清单（必需）
- [ ] 步骤10：最终审查周期和提交

步骤1：定义一句贡献

此步需要科学家明确确认。

撰写任何内容前，阐明并验证：

您的论文贡献的单件事是什么？
在您工作前不明显或不存在的是什么？

“我建议框架贡献为：‘[一句]’。这捕捉您看到的主要要点吗？我们应该调整重点吗？”

步骤2：起草图1

图1值得特别关注——许多读者直接跳到它。

传达核心理念、方法或最引人注目的结果
使用矢量图形（绘图用PDF/EPS）
撰写无需主文可独立的标题
确保黑白可读性（8%男性有色觉缺陷）

步骤3：写摘要（5句公式）

来自Sebastian Farquhar（DeepMind）：

1. 您实现了什么："我们介绍..."、"我们证明..."、"我们展示..."
2. 为什么这难且重要
3. 您如何做（用专业关键词可发现性）
4. 您有什么证据
5. 您最显著数字/结果

删除通用开头如"大型语言模型已取得显著成功…"

步骤4：写引言（最大1-1.5页）

必须包括：

2-4个子弹贡献列表（双栏格式每行最大1-2行）
清晰问题陈述
简要方法概述
方法应最大在页2-3开始

步骤5：方法章节

启用重新实现：

概念概述或伪代码
列出所有超参数
架构细节足够复现
呈现最终设计决策；消融实验在实验部分

步骤6：实验章节

对每个实验，明确陈述：

它支持什么声明
如何连接到主要贡献
实验设置（细节在附录）
观察什么：“蓝线显示X，展示Y”

要求：

带方法论的误差条（标准差 vs 标准误差）
超参数搜索范围
计算基础设施（GPU类型、总小时）
种子设置方法

步骤7：相关工作

方法论组织，非逐篇论文：

好： “一行工作使用Floogledoodle的假设[引用]而我们使用Doobersnoddle的假设因为…”

差： “Snap等人介绍了X而Crackle等人介绍了Y。”

慷慨引用——评审可能相关论文作者。

步骤8：限制章节（必需）

所有主要会议要求此。反直觉地，诚实帮助：

评审被指示不惩罚诚实限制承认
通过首先识别弱点预批评
解释为什么限制不削弱核心声明

步骤9：论文清单

NeurIPS、ICML和ICLR都要求论文清单。见references/checklists.md。

顶级ML会议写作哲学

此节提炼来自领先ML研究人员的最重要写作原则。这些不是可选风格建议——它们区分接受与被拒绝论文。

“论文是一个简短、严谨、基于证据的技术故事，有读者关心的要点。” — Neel Nanda

此指导背后的来源

此技能综合了在顶级场所广泛发表的研究人员的写作哲学：

来源	关键贡献	链接
Neel Nanda (Google DeepMind)	叙事原则，什么/为什么/所以什么框架	如何写ML论文
Sebastian Farquhar (DeepMind)	5句摘要公式	如何写ML论文
Gopen & Swan	7个读者期望原则	科学写作科学
Zachary Lipton	词汇选择，消除犹豫	科学写作启发式
Jacob Steinhardt (UC Berkeley)	精确性，一致术语	写作提示
Ethan Perez (Anthropic)	微观清晰提示	简易论文写作提示
Andrej Karpathy	单贡献焦点	各种讲座

深入任何这些，见：

references/writing-guide.md - 带示例的完整解释
references/sources.md - 完整参考文献

时间分配（来自Neel Nanda）

大约花相等时间在每项：

摘要
引言
图
其他一切组合

为什么？ 大多数评审在到达您的方法前形成判断。读者遇到您的论文为：标题 → 摘要 → 引言 → 图 → 可能其余。

写作风格指南

句子级清晰（Gopen & Swan的7原则）

这些原则基于读者实际如何处理散文。违反它们迫使读者花认知努力在结构而非内容上。

原则	规则	示例
主语-动词邻近	保持主语和动词接近	❌ “模型，训练在…上，实现” → ✅ “模型实现…在训练在…上后”
强调位置	将强调放在句子末尾	❌ “当使用注意力时准确度提高15%” → ✅ “当使用注意力时，准确度提高15%”
主题位置	放语境第一，新信息后	✅ “给定这些约束，我们提出…”
旧前新	熟悉信息 → 不熟悉信息	链接向后，然后引入新
一单元一功能	每段落做一个点	分割多点段落
动词中行动	用动词，非名词化	❌ “我们进行了分析” → ✅ “我们分析了”
新前语境	在呈现前设置舞台	展示方程前解释

完整7原则带详细示例： 见references/writing-guide.md

微观提示（Ethan Perez）

这些小变化积累成显著更清晰的散文：

最小化代词： ❌ “这显示…” → ✅ “此结果显示…”
动词早：位置动词在句子开始附近
展开撇号： ❌ “X的Y” → ✅ “X的Y”（当尴尬时）
删除填充词： “实际上”、“有点”、“非常”、“真的”、“基本上”、“相当”、“本质上”

完整微观提示带示例： 见references/writing-guide.md

词汇选择（Zachary Lipton）

具体： ❌ “性能” → ✅ “准确度"或"延迟”（说您的意思）
消除犹豫：删除"可能"和"可以"除非真正不确定
避免增量词汇： ❌ “结合”、“修改”、“扩展” → ✅ “开发”、“提出”、“介绍”
删除强化词： ❌ “提供非常紧密近似” → ✅ “提供紧密近似”

精确性胜于简洁（Jacob Steinhardt）

一致术语：同一概念不同术语造成混乱。选一个并坚持。
形式陈述假设：定理前，明确列出所有假设
直觉 + 严谨：提供直观解释伴随形式证明

评审实际阅读什么

理解评审行为帮助优先努力：

论文章节	% 阅读的评审	影响
摘要	100%	必须完美
引言	90%+（略读）	前载贡献
图	在方法前检查	图1关键
方法	仅如果感兴趣	不埋导语
附录	很少	仅放补充细节

底线：如果您的摘要和引言不吸引评审，他们可能永远不会读您的出色方法章节。

会议要求快速参考

会议	页限	最终提交额外	关键要求
NeurIPS 2025	9页	+0	强制清单，接受后摘要
ICML 2026	8页	+1	要求更广泛影响声明
ICLR 2026	9页	+1	要求LLM披露，互惠评审
ACL 2025	8页（长）	变化	强制限制章节
AAAI 2026	7页	+1	严格样式文件遵守
COLM 2025	9页	+1	专注于语言模型

通用要求：

双盲评审（匿名化提交）
引用不计入页限
附录无限但评审不需读
LaTeX所有场所必需

LaTeX模板： 见templates/目录所有会议模板。

正确使用LaTeX模板

工作流4：从模板开始新论文

始终首先复制整个模板目录，然后在其中编写。

模板设置清单：
- [ ] 步骤1：复制整个模板目录到新项目
- [ ] 步骤2：验证模板原样编译（在任何更改前）
- [ ] 步骤3：阅读模板的示例内容理解结构
- [ ] 步骤4：按章节替换示例内容
- [ ] 步骤5：保持模板注释/示例作为参考直到完成
- [ ] 步骤6：仅在结束时清理模板工件

步骤1：复制完整模板

# 用完整模板创建您的论文目录
cp -r templates/neurips2025/ ~/papers/my-new-paper/
cd ~/papers/my-new-paper/

# 验证结构完整
ls -la
# 应该看到：main.tex、neurips.sty、Makefile等

⚠️ 重要： 复制整个目录，非仅main.tex。模板包括：

样式文件（.sty） - 编译必需
参考文献样式（.bst） - 引用必需
示例内容 - 有用作为参考
Makefiles - 用于简易编译

步骤2：首先验证模板编译

在做出任何更改前，原样编译模板：

# 使用latexmk（推荐）
latexmk -pdf main.tex

# 或手动编译
pdflatex main.tex
bibtex main
pdflatex main.tex
pdflatex main.tex

如果未修改模板不编译，先修复。常见问题：

缺失TeX包 → 通过tlmgr install <package>安装
错误TeX分布 → 使用TeX Live（推荐）

步骤3：保持模板内容作为参考

不要立即删除所有示例内容。反而：

% 保持模板示例注释掉当您编写
% 这显示您期望格式

% 模板示例（保持作为参考）：
% \begin{figure}[t]
%   \centering
%   \includegraphics[width=0.8\linewidth]{example-image}
%   \caption{模板显示标题样式}
% \end{figure}

% 您的实际图：
\begin{figure}[t]
  \centering
  \includegraphics[width=0.8\linewidth]{your-figure.pdf}
  \caption{您的标题遵循相同样式。}
\end{figure}

步骤4：按章节替换内容

系统性地工作通过论文：

替换顺序：
1. 标题和作者（为提交匿名化）
2. 摘要
3. 引言
4. 方法
5. 实验
6. 相关工作
7. 结论
8. 参考文献（您的.bib文件）
9. 附录

对每章节：

阅读模板的示例内容
注意任何特殊格式化或使用的宏
替换为您的遵循相同模式的内容
频繁编译及早捕获错误

步骤5：使用模板宏

模板常定义有用宏。检查前导：

% 常用模板宏使用：

ewcommand{\method}{您的MethodName}  % 一致方法命名

ewcommand{\eg}{e.g.,\xspace}        % 适当缩写

ewcommand{\ie}{i.e.,\xspace}

ewcommand{\etal}{\textit{et al.}\xspace}

步骤6：仅在结束时清理

仅当论文接近完成时移除模板工件：

% 提交前 - 移除这些：
% - 注释掉的模板示例
% - 未使用的包
% - 模板的示例图/表
% - Lorem ipsum或占位符文本

% 保持这些：
% - 所有样式文件（.sty）
% - 参考文献样式（.bst）
% - 模板所需包
% - 您使用的任何自定义宏

模板陷阱避免

陷阱	问题	解决方案
仅复制`main.tex`	缺失`.sty`，不编译	复制整个目录
修改`.sty`文件	破坏会议格式化	绝不编辑样式文件
添加随机包	冲突，破坏模板	仅添加如果必要
太早删除模板内容	失去格式化参考	保持为注释直到完成
不频繁编译	错误累积	每章节后编译

快速模板参考

会议	主文件	关键样式文件	备注
NeurIPS 2025	`main.tex`	`neurips.sty`	有Makefile
ICML 2026	`example_paper.tex`	`icml2026.sty`	包括算法包
ICLR 2026	`iclr2026_conference.tex`	`iclr2026_conference.sty`	有math_commands.tex
ACL	`acl_latex.tex`	`acl.sty`	严格格式化
AAAI 2026	`aaai2026-unified-template.tex`	`aaai2026.sty`	非常严格遵守
COLM 2025	`colm2025_conference.tex`	`colm2025_conference.sty`	类似ICLR

会议重新提交 & 格式转换

当论文从一个场所被拒绝或撤回并重新提交到另一个时，需要格式转换。这在ML研究中是常见工作流。

工作流3：在会议格式间转换

格式转换清单：
- [ ] 步骤1：识别源和目标模板差异
- [ ] 步骤2：创建带目标模板的新项目
- [ ] 步骤3：复制内容章节（非前导）
- [ ] 步骤4：调整页限和内容
- [ ] 步骤5：更新会议特定要求
- [ ] 步骤6：验证编译和格式化

步骤1：关键模板差异

从 → 到	页变化	关键调整
NeurIPS → ICML	9 → 8页	切1页，添加更广泛影响如果缺失
ICML → ICLR	8 → 9页	可扩展实验，添加LLM披露
NeurIPS → ACL	9 → 8页	为NLP惯例重构，添加限制
ICLR → AAAI	9 → 7页	需要显著削减，严格样式遵守
任何 → COLM	变化 → 9	为语言模型重点重构

步骤2：内容迁移（非模板合并）

绝不复制LaTeX前导在模板间。反而：

# 1. 以目标模板新鲜开始
cp -r templates/icml2026/ new_submission/

# 2. 复制仅内容章节从旧论文
# - 摘要文本
# - 章节内容（在\section{}命令间）
# - 图和表
# - 参考文献条目

# 3. 粘贴到目标模板结构

步骤3：调整页限

当削减页（例如，NeurIPS 9 → AAAI 7）：

移动详细证明到附录
压缩相关工作（引用综述而非个别论文）
合并类似实验到统一表
使用较小图尺寸带子图
收紧写作：消除冗余，使用主动语态

当扩展（例如，ICML 8 → ICLR 9）：

添加评审请求的消融研究
扩展限制讨论
包括额外基线
添加定性示例

步骤4：会议特定调整

目标场所	必需添加
ICML	更广泛影响声明（结论后）
ICLR	LLM使用披露，互惠评审协议
ACL/EMNLP	限制章节（强制），道德声明
AAAI	严格遵守样式文件（无修改）
NeurIPS	论文清单（附录），接受后摘要

步骤5：更新参考文献

% 移除揭示身份的自引用（为盲评审）
% 更新任何"评审中"引用到发表版本
% 添加上次提交后发表的新的相关工作

步骤6：处理先前评审

当拒绝后重新提交：

做在新版本中解决评审关切
做添加评审请求的实验/澄清
不做包括"先前提交变更"章节（盲评审）
不做引用先前提交或评审

常见转换陷阱：

❌ 复制\usepackage命令（导致冲突）
❌ 保留旧会议页眉/页脚命令
❌ 忘记更新\bibliography{}路径
❌ 缺失会议特定必需章节
❌ 格式更改后超出页限

引用工作流（捏造预防）

⚠️ 关键： AI生成的引用有约40%错误率。绝不从记忆写BibTeX。

黄金规则

如果 您无法通过网络搜索验证引用：
    → 标记它为[CITATION NEEDED]或[PLACEHOLDER - VERIFY]
    → 明确告知科学家
    → 绝不发明听起来合理的引用

强制： 使用WebSearch工具在添加到参考文献前验证每个引用。

工作流2：添加引用

引用验证（每个引用强制）：
- [ ] 步骤1：使用WebSearch查找论文
- [ ] 步骤2：在Google Scholar验证论文存在
- [ ] 步骤3：确认论文细节（标题、作者、年、场所）
- [ ] 步骤4：从Google Scholar或DOI检索BibTeX
- [ ] 步骤5：验证您引用的声明实际出现在论文中
- [ ] 步骤6：添加已验证BibTeX到参考文献
- [ ] 步骤7：如果任何步骤失败 → 标记为占位符，通知科学家

步骤1：使用WebSearch查找论文

当您需要引用论文时，始终以网络搜索开始：

WebSearch查询示例：
- "Attention is All You Need Vaswani 2017"
- "RLHF language model alignment 2023"
- "sparse autoencoders interpretability Anthropic"
- "transformer architecture NeurIPS"

在搜索结果中查找什么：

论文标题匹配您的意图引用
作者正确
出版年正确
场所（会议/期刊）识别

步骤2：在Google Scholar验证

找到论文后，在Google Scholar验证其存在：

WebSearch查询："site:scholar.google.com [论文标题] [第一作者]"

示例："site:scholar.google.com Attention is All You Need Vaswani"

验证清单：

✅ 论文出现在Google Scholar结果
✅ 标题精确匹配（或非常接近）
✅ 作者匹配
✅ 年匹配
✅ 场所列出（会议/期刊）
✅ 引用计数合理（旧论文非0）

如果论文未在Google Scholar找到：

❌ 停止 - 不引用
标记为[CITATION NEEDED - not found on Google Scholar]
明确通知科学家

步骤3：确认论文细节

在检索BibTeX前，双重检查所有细节：

验证清单：
- 标题：[来自Google Scholar的精确标题]
- 作者：[所有作者，按顺序]
- 年：[出版年]
- 场所：[会议/期刊名]
- DOI：[如果可用]

步骤4：检索BibTeX

选项1：来自Google Scholar（推荐）

在Google Scholar上找到论文
点击论文下方的"引用"按钮
选择"BibTeX"格式
复制BibTeX条目

选项2：来自DOI（如果可用）

使用WebSearch查找："doi.org/[DOI]"
在出版商页面查找BibTeX导出选项
复制BibTeX条目

选项3：来自arXiv（预印本）

在arXiv上找到论文
点击右侧边栏的"Export BibTeX Citation"
复制BibTeX条目

关键： 绝不从记忆写BibTeX。始终从已验证源复制。

步骤5：验证声明

在为特定声明引用前，验证声明实际出现在论文中：

验证过程：
1. 使用WebSearch访问论文（PDF或HTML）
2. 搜索与您的声明相关的关键词
3. 确认声明明确陈述或清晰隐含
4. 记下声明出现的章节/页

如果您无法访问论文：

❌ 不为特定声明引用
仅为一般贡献引用（如果在Google Scholar验证）
标记为[CLAIM NOT VERIFIED - no access to paper]

步骤6：添加已验证BibTeX到参考文献

仅在完成所有验证步骤后：

% 添加到您的.bib文件
@inproceedings{vaswani2017attention,
  title={Attention is All You Need},
  author={Vaswani, Ashish and Shazeer, Noam and ...},
  booktitle={Advances in Neural Information Processing Systems},
  year={2017}
}

% 在您论文中使用
\cite{vaswani2017attention}

步骤7：明确处理失败

如果您无法在任一步验证引用：

% 选项1：显式占位符
\cite{PLACEHOLDER_smith2023_verify}  % TODO: 无法验证 - 科学家必须确认

% 选项2：文本中注释
... 如先前工作所示[CITATION NEEDED - could not verify Smith et al. 2023]。

始终告知科学家：

"我无法验证以下引用并已标记它们为占位符：

Smith等人2023关于奖励黑客 - 未在Google Scholar找到

Jones 2022关于缩放定律 - 找到类似论文但不同作者提交前请验证这些。"

总结：引用规则

情况	操作
在Google Scholar找到，验证细节，获得BibTeX	✅ 使用引用
找到论文，在Google Scholar验证，无BibTeX	✅ 从Google Scholar信息创建BibTeX
论文存在但细节不匹配	⚠️ 标记占位符，通知科学家
未在Google Scholar找到	❌ 标记`[CITATION NEEDED]`，通知科学家
“我认为有关于X的论文”	❌ 绝不引用 - 先搜索或标记占位符

🚨 绝不从记忆生成BibTeX—始终通过WebSearch和Google Scholar验证。 🚨

完整引用工作流示例

场景： 您需要引用Transformer论文。

步骤1：WebSearch
查询："Attention is All You Need Vaswani 2017"
结果：在多个源找到论文

步骤2：Google Scholar验证
查询："site:scholar.google.com Attention is All You Need Vaswani"
结果：✅ 论文找到，50,000+引用，NeurIPS 2017

步骤3：确认细节
- 标题："Attention is All You Need"
- 作者：Vaswani, Ashish; Shazeer, Noam; Parmar, Niki; ...
- 年：2017
- 场所：NeurIPS (NIPS)
- DOI：可用

步骤4：检索BibTeX
- 点击Google Scholar上的"引用"
- 选择BibTeX格式
- 复制条目

步骤5：验证声明
- 通过WebSearch访问论文
- 确认声明出现在论文中
- 记下章节/页

步骤6：添加到参考文献
- 粘贴BibTeX到.bib文件
- 在论文中使用\cite{vaswani2017attention}

步骤7：成功
- 引用已验证并添加
- 无需占位符

常见问题与解决方案

问题：摘要太通用

删除第一句如果它可前置到任何ML论文。以您的具体贡献开始。

问题：引言超过1.5页

拆分背景到相关工作。前载贡献子弹。方法应最大在页2-3开始。

问题：实验缺乏明确声明

在每个实验前添加句子：“此实验测试是否[具体声明]…”

问题：评审发现论文难跟随

添加明确路标：“在此章节，我们展示X”
贯穿使用一致术语
包括可独立的图标题

问题：缺失统计显著性

始终包括：

误差条（指定：标准差或标准误差）
运行数量
统计测试如果比较方法

评审评估标准

评审在四个维度评估论文：

标准	评审查找什么
质量	技术正确性，良好支持的声明
清晰性	清晰写作，专家可复现
显著性	社区影响，推进理解
原创性	新见解（不需要新方法）

评分（NeurIPS 6点尺度）：

6: 强接受 - 开创性，无瑕
5: 接受 - 技术坚实，高影响
4: 边缘接受 - 坚实，有限评估
3: 边缘拒绝 - 坚实但弱点超过
2: 拒绝 - 技术缺陷
1: 强拒绝 - 已知结果或伦理问题

见references/reviewer-guidelines.md获取详细评审指令。

表与图

表

使用booktabs LaTeX包专业表：

\usepackage{booktabs}
\begin{tabular}{lcc}
\toprule
方法 & 准确度 ↑ & 延迟 ↓ \\
\midrule
基线 & 85.2 & 45ms \\
\textbf{我们的} & \textbf{92.1} & 38ms \\
\bottomrule
\end{tabular}

规则：

加粗每度量最佳值
包括方向符号（↑更高更好，↓更低更好）
右对齐数值列
一致小数精度

图

矢量图形（PDF、EPS）所有绘图和图表
光栅（PNG 600 DPI）仅用于照片
使用色盲安全调色板（Okabe-Ito或Paul Tol）
验证灰度可读性（8%男性有色觉缺陷）
无图中标题—标题服务此功能
独立标题—读者应无需主文理解

参考与资源

参考文档（深入）

文档	内容
writing-guide.md	Gopen & Swan 7原则，Ethan Perez微观提示，词汇选择
citation-workflow.md	引用API，Python代码，BibTeX管理
checklists.md	NeurIPS 16项，ICML、ICLR、ACL要求
reviewer-guidelines.md	评估标准，评分，反驳
sources.md	所有来源的完整参考文献
文献研究：
arxiv-search-guide.md	arXiv搜索策略，URL模式，Chrome MCP自动化
paper-quality-criteria.md	5维度论文评估标准（创新、方法、实验、写作、影响）

LaTeX模板

templates/目录中的模板：ICML 2026、ICLR 2026、NeurIPS 2025、ACL/EMNLP、AAAI 2026、COLM 2025。

编译到PDF：

VS Code/Cursor：安装LaTeX Workshop扩展 + TeX Live → 保存以自动编译
命令行：latexmk -pdf main.tex或pdflatex + bibtex工作流
在线：上传到Overleaf

见templates/README.md获取详细设置指令。

关键外部来源

写作哲学：

Neel Nanda: How to Write ML Papers - 叙事，“什么/为什么/所以什么”
Farquhar: How to Write ML Papers - 5句摘要
Gopen & Swan: Science of Scientific Writing - 7个读者期望原则
Lipton: Heuristics for Scientific Writing - 词汇选择
Perez: Easy Paper Writing Tips - 微观清晰提示

APIs： Semantic Scholar | CrossRef | arXiv

场所： NeurIPS | ICML | ICLR | ACL