ML论文写作Skill ml-paper-writing

这个技能提供撰写机器学习与人工智能论文的全面指导,特别针对NeurIPS、ICML等顶级会议。它涵盖从文献检索、引用验证到LaTeX模板使用的全流程,帮助研究人员高效完成学术写作,避免引用幻觉,并遵循会议具体要求。关键词包括:ML论文写作、AI会议、学术写作、引用验证、LaTeX模板、文献综述、论文撰写。

论文写作 0 次安装 0 次浏览 更新于 3/13/2026

name: ml-paper-writing description: 为NeurIPS、ICML、ICLR、ACL、AAAI、COLM撰写可发表的ML/AI论文。用于从研究仓库起草论文、进行文献综述、查找相关工作、验证引用或准备最终提交。包括LaTeX模板、引用验证工作流和论文发现/评估标准。 version: 1.0.0 author: Orchestra Research license: MIT tags: [学术写作, NeurIPS, ICML, ICLR, ACL, AAAI, COLM, LaTeX, 论文写作, 引用, 研究] dependencies: [semanticscholar, arxiv, habanero, requests]

顶级AI会议ML论文写作

针对NeurIPS、ICML、ICLR、ACL、AAAI和COLM撰写可发表论文的专家级指导。此技能结合了顶级研究人员(Nanda、Farquhar、Karpathy、Lipton、Steinhardt)的写作哲学与实用工具:LaTeX模板、引用验证API和会议清单。

核心理念:协作式写作

论文写作是协作的,但Claude应主动交付草稿。

典型工作流从包含代码、结果和实验产物的研究仓库开始。Claude的角色是:

  1. 理解项目:通过探索仓库、结果和现有文档
  2. 交付完整初稿:当对贡献有信心时
  3. 文献检索:使用网络搜索和API查找相关引用
  4. 基于反馈循环优化:当科学家提供输入时
  5. 请求澄清:仅当对关键决策真正不确定时

关键原则:主动。如果仓库和结果清晰,交付完整草稿。不要等待每个部分的反馈——科学家很忙。提供具体内容供他们反应,然后基于响应迭代。


⚠️ 关键:绝不捏造引用

这是学术写作中使用AI辅助的最重要规则。

问题

AI生成的引用有约40%的错误率。捏造的引用——不存在的论文、错误作者、不正确年份、伪造DOI——是严重的学术不端行为,可能导致桌面拒绝或撤回。

规则

绝不从记忆生成BibTeX条目。始终通过编程获取。

操作 ✅ 正确 ❌ 错误
添加引用 搜索API → 验证 → 获取BibTeX 从记忆写BibTeX
不确定论文 标记为[CITATION NEEDED] 猜测引用
找不到确切论文 注释:“占位符 - 验证” 发明听起来相似的论文

当无法验证引用时

如果无法通过编程验证引用,必须:

% 显式占位符 - 需要人工验证
\cite{PLACEHOLDER_author2024_verify_this}  % TODO: 验证此引用存在

始终告知科学家:“我已标记[X]个引用为需要验证的占位符。我无法确认这些论文存在。”

推荐:安装Exa MCP用于论文搜索

为最佳论文搜索体验,安装Exa MCP,提供实时学术搜索:

Claude Code:

claude mcp add exa -- npx -y mcp-remote "https://mcp.exa.ai/mcp"

Cursor / VS Code (添加到MCP设置):

{
  "mcpServers": {
    "exa": {
      "type": "http",
      "url": "https://mcp.exa.ai/mcp"
    }
  }
}

Exa MCP支持搜索如:

  • “查找2023年后发表的关于语言模型RLHF的论文”
  • “搜索Vaswani的Transformer架构论文”
  • “获取可解释性稀疏自编码器的最新工作”

然后通过Semantic Scholar API验证结果并通过DOI获取BibTeX。


工作流0:从研究仓库开始

开始论文写作时,首先理解项目:

项目理解:
- [ ] 步骤1:探索仓库结构
- [ ] 步骤2:阅读README、现有文档和关键结果
- [ ] 步骤3:与科学家确定主要贡献
- [ ] 步骤4:查找代码库中已引用的论文
- [ ] 步骤5:搜索额外相关文献
- [ ] 步骤6:一起概述论文结构
- [ ] 步骤7:基于反馈迭代起草章节

步骤1:探索仓库

# 理解项目结构
ls -la
find . -name "*.py" | head -20
find . -name "*.md" -o -name "*.txt" | xargs grep -l -i "结果\|结论\|发现"

查找:

  • README.md - 项目概述和声明
  • results/outputs/experiments/ - 关键发现
  • configs/ - 实验设置
  • 现有.bib文件或引用参考
  • 任何草稿文档或笔记

步骤2:识别现有引用

检查代码库中已引用的论文:

# 查找现有引用
grep -r "arxiv\|doi\|cite" --include="*.md" --include="*.bib" --include="*.py"
find . -name "*.bib"

这些是相关工作的信号起点——科学家已认为它们相关。

步骤3:澄清贡献

写作前,与科学家明确确认:

“基于我对仓库的理解,主要贡献似乎是[X]。 关键结果显示[Y]。这是您希望论文的框架吗, 或者我们应该强调不同方面?”

绝不假设叙事——始终与人类验证。

步骤4:搜索额外文献

使用网络搜索查找相关论文:

尝试搜索查询:
- "[主要技术] + [应用领域]"
- "[基线方法] 比较"
- "[问题名称] 最先进"
- 现有引用中的作者名

然后使用以下引用工作流验证和检索BibTeX。

步骤5:交付初稿

主动——交付完整草稿而非请求每个部分的许可。

如果仓库提供清晰结果且贡献明显:

  1. 端到端撰写完整初稿
  2. 呈现完整草稿供反馈
  3. 基于科学家响应迭代

如果对框架或主要声明真正不确定:

  1. 起草您有信心的部分
  2. 标记特定不确定性:“我将X框架为主要贡献——如果您更愿强调Y,请告知”
  3. 继续草稿而非阻塞

与草稿一起包含的问题(非之前):

  • “我将X强调为主要贡献——如需调整”
  • “我突出结果A、B、C——告知是否其他更重要”
  • “相关工作部分包括[论文]——添加我遗漏的任何”

何时使用此技能

使用此技能当:

  • 从研究仓库开始撰写论文
  • 起草或修订特定章节
  • 进行文献综述和查找相关工作
  • 在您的研究领域发现近期论文
  • 查找和验证引用用于相关工作
  • 格式化会议提交
  • 重新提交到不同场所(格式转换)
  • 迭代草稿基于科学家反馈

始终记住:初稿是讨论的起点,非最终输出。


工作流:文献研究与论文发现

进行文献综述、查找相关工作或发现近期论文时,使用此工作流系统性搜索、评估和选择ML论文。

工作流5:查找与评估论文

文献研究流程:
- [ ] 步骤1:定义搜索范围和关键词
- [ ] 步骤2:搜索arXiv和学术数据库
- [ ] 步骤3:通过标题/摘要筛选论文
- [ ] 步骤4:评估论文质量(5个维度)
- [ ] 步骤5:选择顶级论文并提取引用
- [ ] 步骤6:通过编程验证引用

步骤1:定义搜索范围

识别特定研究领域、方法或应用:

  • 技术聚焦transformer架构图神经网络自监督学习
  • 应用聚焦医学图像分析机器人强化学习语言模型对齐
  • 问题聚焦分布外泛化持续学习ML公平性

步骤2:搜索arXiv

使用带目标关键词的arXiv搜索:

URL模式:
https://arxiv.org/search/?searchtype=all&query=关键词&abstracts=show&order=-announced_date_first

示例搜索:
- https://arxiv.org/search/?searchtype=all&query=graph+neural+networks&abstracts=show&order=-announced_date_first
- https://arxiv.org/search/?cat:cs.LG+AND+all:transformer&abstracts=show&order=-announced_date_first

提示:

  • 组合关键词用+表示AND
  • 按类别过滤:cs.LGcs.AIcs.CVcs.CL
  • announced_date_first排序获取近期论文
  • 可用时使用Chrome MCP工具自动化

步骤3:筛选论文

通过标题和摘要快速筛选:

  • 与研究主题相关性
  • 贡献新颖性
  • 场所/作者声誉
  • 代码可用性(检查GitHub链接)

步骤4:评估质量

使用5维度质量标准:

维度 权重 评估焦点
创新 30% 新颖性和原创性
方法完整性 25% 清晰性和可复现性
实验全面性 25% 验证深度
写作质量 10% 呈现清晰度
相关性&影响 10% 领域重要性

评分:每个维度评分1-5,计算加权总分

步骤5:选择与提取

  • 按总分排名论文
  • 选择顶级论文进行详细审查
  • 提取元数据:标题、作者、arXiv ID、摘要
  • 记下代码仓库链接

步骤6:验证引用

对于选定论文,使用Semantic Scholar API验证引用:

  • 通过DOI编程获取BibTeX
  • 标记未验证引用为[CITATION NEEDED]
  • 以验证状态存储在参考文献中

何时使用文献研究

使用此工作流当:

  • 开始新项目:查找相关工作和基线
  • 撰写相关工作部分:发现您领域的近期论文
  • 保持更新:跟踪您领域的最新出版物
  • 查找基线:识别最先进方法进行比较
  • 文献综述:研究领域的全面调查

质量阈值

  • 优秀:4.0+(肯定包括)
  • 良好:3.5-3.9(如果相关包括)
  • 一般:3.0-3.4(如果高度相关包括)
  • :<3.0(排除除非必要)

参考文件

详细文献研究指南:

  • references/literature-research/arxiv-search-guide.md - arXiv搜索策略和URL模式
  • references/literature-research/paper-quality-criteria.md - 详细5维度评估标准

知识库:ML论文写作模式

此技能维护从成功ML会议论文提取的写作模式、技术和要求的策划知识库。知识库随您分析更多论文而增长。

知识组织

知识库在references/knowledge/下组织为4类:

类别 文件 内容
结构 structure.md 论文组织、IMRaD模式、过渡、章节流
写作技巧 writing-techniques.md 句子模式、过渡短语、清晰技术
提交指南 submission-guides.md 场所要求(NeurIPS、ICML、ICLR、ACL、AAAI、COLM)
评审响应 review-response.md 反驳策略、处理评审评论

知识库如何维护

paper-miner代理自动从您提供的论文提取和分类写作知识:

您:"从这篇NeurIPS论文学习写作技巧:路径/to/paper.pdf"
↓
paper-miner分析论文
↓
提取模式 → 分类为4类 → 更新知识文件
↓
知识随每篇分析论文增长

提取内容:

  • 结构模式:成功论文如何组织章节、主题间过渡
  • 写作技巧:句子模板、过渡短语、清晰方法
  • 场所要求:页限、必要章节、格式化规则
  • 反驳策略:如何响应特定评审关切

何时使用知识库

用于写作模式:

  • 困于如何措辞过渡?检查writing-techniques.md
  • 需要结构灵感?浏览structure.md
  • 撰写反驳?咨询review-response.md

用于场所要求:

  • 提交到NeurIPS?见submission-guides.md清单
  • 场所间转换?比较页限和要求
  • 不确定必要章节?每个场所有特定要求

贡献到知识库

您分析的每篇论文使知识库更丰富未来使用:

# 从任何上下文触发paper-miner
"从这篇论文提取写作模式:路径/to/paper.pdf"
"分析https://arxiv.org/abs/2301.xxxxx的结构"
"这篇ICLR论文使用什么写作技巧?"

paper-miner代理:

  1. 提取论文内容(PDF、DOCX或arXiv链接)
  2. 分析IMRaD结构和写作模式
  3. 识别场所特定要求
  4. 用新模式更新适当知识文件
  5. 报告添加内容带来源归属

知识库原则

仅可操作模式:每个条目提供带示例的可重用技术。

来源归属:每个模式引用其来源论文以可追溯性。

无重复:添加新模式前检查现有内容。

质量胜于数量:专注于有效技术,非全面列表。

references/knowledge/README.md获取完整知识库文档。


平衡主动性与协作

默认:主动。交付草稿,然后迭代。

置信水平 操作
(清晰仓库,明显贡献) 撰写完整草稿,交付,基于反馈迭代
(一些模糊性) 起草带标记不确定性的草稿,继续
(主要未知) 问1-2个目标问题,然后起草

先起草,随草稿提问(非之前):

章节 自主起草 随草稿标记
摘要 “框架贡献为X——如需调整”
引言 “强调问题Y——如果错误纠正”
方法 “包含细节A、B、C——添加缺失部分”
实验 “突出结果1、2、3——如需重新排序”
相关工作 “引用论文X、Y、Z——添加我遗漏的任何”

仅在以下情况阻塞输入:

  • 目标场所不清晰(影响页限、框架)
  • 多个矛盾框架似乎同样有效
  • 结果似乎不完整或不一致
  • 明确请求在继续前审查

不阻塞:

  • 词汇选择决策
  • 章节排序
  • 显示哪些具体结果(做选择,标记它)
  • 引用完整性(用您找到的起草,记下空白)

叙事原则

最关键的见解:您的论文不是实验集合——它是一个有清晰贡献由证据支持的故事。

每篇成功ML论文围绕Neel Nanda称为"叙事"的东西:一个简短、严谨、基于证据的技术故事,有读者关心的要点。

三大支柱(必须在引言结尾前清晰):

支柱 描述 示例
什么 1-3个具体新颖声明在连贯主题内 “我们证明在条件Z下X实现Y”
为什么 支持声明的严谨经验证据 强基线,区分假设的实验
所以什么 为什么读者应该关心 连接已识别社区问题

如果您无法用一句话陈述您的贡献,您还没有论文。


论文结构工作流

工作流1:撰写完整论文(迭代)

复制此清单并跟踪进度。每步涉及起草 → 反馈 → 修订:

论文写作进度:
- [ ] 步骤1:定义一句贡献(与科学家)
- [ ] 步骤2:起草图1 → 获取反馈 → 修订
- [ ] 步骤3:起草摘要 → 获取反馈 → 修订
- [ ] 步骤4:起草引言 → 获取反馈 → 修订
- [ ] 步骤5:起草方法 → 获取反馈 → 修订
- [ ] 步骤6:起草实验 → 获取反馈 → 修订
- [ ] 步骤7:起草相关工作 → 获取反馈 → 修订
- [ ] 步骤8:起草限制 → 获取反馈 → 修订
- [ ] 步骤9:完成论文清单(必需)
- [ ] 步骤10:最终审查周期和提交

步骤1:定义一句贡献

此步需要科学家明确确认。

撰写任何内容前,阐明并验证:

  • 您的论文贡献的单件事是什么?
  • 在您工作前不明显或不存在的是什么?

“我建议框架贡献为:‘[一句]’。这捕捉 您看到的主要要点吗?我们应该调整重点吗?”

步骤2:起草图1

图1值得特别关注——许多读者直接跳到它。

  • 传达核心理念、方法或最引人注目的结果
  • 使用矢量图形(绘图用PDF/EPS)
  • 撰写无需主文可独立的标题
  • 确保黑白可读性(8%男性有色觉缺陷)

步骤3:写摘要(5句公式)

来自Sebastian Farquhar(DeepMind):

1. 您实现了什么:"我们介绍..."、"我们证明..."、"我们展示..."
2. 为什么这难且重要
3. 您如何做(用专业关键词可发现性)
4. 您有什么证据
5. 您最显著数字/结果

删除通用开头如"大型语言模型已取得显著成功…"

步骤4:写引言(最大1-1.5页)

必须包括:

  • 2-4个子弹贡献列表(双栏格式每行最大1-2行)
  • 清晰问题陈述
  • 简要方法概述
  • 方法应最大在页2-3开始

步骤5:方法章节

启用重新实现:

  • 概念概述或伪代码
  • 列出所有超参数
  • 架构细节足够复现
  • 呈现最终设计决策;消融实验在实验部分

步骤6:实验章节

对每个实验,明确陈述:

  • 它支持什么声明
  • 如何连接到主要贡献
  • 实验设置(细节在附录)
  • 观察什么:“蓝线显示X,展示Y”

要求:

  • 带方法论的误差条(标准差 vs 标准误差)
  • 超参数搜索范围
  • 计算基础设施(GPU类型、总小时)
  • 种子设置方法

步骤7:相关工作

方法论组织,非逐篇论文:

好: “一行工作使用Floogledoodle的假设[引用]而我们使用Doobersnoddle的假设因为…”

差: “Snap等人介绍了X而Crackle等人介绍了Y。”

慷慨引用——评审可能相关论文作者。

步骤8:限制章节(必需)

所有主要会议要求此。反直觉地,诚实帮助:

  • 评审被指示不惩罚诚实限制承认
  • 通过首先识别弱点预批评
  • 解释为什么限制不削弱核心声明

步骤9:论文清单

NeurIPS、ICML和ICLR都要求论文清单。见references/checklists.md


顶级ML会议写作哲学

此节提炼来自领先ML研究人员的最重要写作原则。这些不是可选风格建议——它们区分接受与被拒绝论文。

“论文是一个简短、严谨、基于证据的技术故事,有读者关心的要点。” — Neel Nanda

此指导背后的来源

此技能综合了在顶级场所广泛发表的研究人员的写作哲学:

来源 关键贡献 链接
Neel Nanda (Google DeepMind) 叙事原则,什么/为什么/所以什么框架 如何写ML论文
Sebastian Farquhar (DeepMind) 5句摘要公式 如何写ML论文
Gopen & Swan 7个读者期望原则 科学写作科学
Zachary Lipton 词汇选择,消除犹豫 科学写作启发式
Jacob Steinhardt (UC Berkeley) 精确性,一致术语 写作提示
Ethan Perez (Anthropic) 微观清晰提示 简易论文写作提示
Andrej Karpathy 单贡献焦点 各种讲座

深入任何这些,见:

时间分配(来自Neel Nanda)

大约花相等时间在每项:

  1. 摘要
  2. 引言
  3. 其他一切组合

为什么? 大多数评审在到达您的方法前形成判断。读者遇到您的论文为:标题 → 摘要 → 引言 → 图 → 可能其余。

写作风格指南

句子级清晰(Gopen & Swan的7原则)

这些原则基于读者实际如何处理散文。违反它们迫使读者花认知努力在结构而非内容上。

原则 规则 示例
主语-动词邻近 保持主语和动词接近 ❌ “模型,训练在…上,实现” → ✅ “模型实现…在训练在…上后”
强调位置 将强调放在句子末尾 ❌ “当使用注意力时准确度提高15%” → ✅ “当使用注意力时,准确度提高15%
主题位置 放语境第一,新信息后 ✅ “给定这些约束,我们提出…”
旧前新 熟悉信息 → 不熟悉信息 链接向后,然后引入新
一单元一功能 每段落做一个点 分割多点段落
动词中行动 用动词,非名词化 ❌ “我们进行了分析” → ✅ “我们分析了”
新前语境 在呈现前设置舞台 展示方程前解释

完整7原则带详细示例:references/writing-guide.md

微观提示(Ethan Perez)

这些小变化积累成显著更清晰的散文:

  • 最小化代词: ❌ “这显示…” → ✅ “此结果显示…”
  • 动词早: 位置动词在句子开始附近
  • 展开撇号: ❌ “X的Y” → ✅ “X的Y”(当尴尬时)
  • 删除填充词: “实际上”、“有点”、“非常”、“真的”、“基本上”、“相当”、“本质上”

完整微观提示带示例:references/writing-guide.md

词汇选择(Zachary Lipton)

  • 具体: ❌ “性能” → ✅ “准确度"或"延迟”(说您的意思)
  • 消除犹豫: 删除"可能"和"可以"除非真正不确定
  • 避免增量词汇: ❌ “结合”、“修改”、“扩展” → ✅ “开发”、“提出”、“介绍”
  • 删除强化词: ❌ “提供非常紧密近似” → ✅ “提供紧密近似”

精确性胜于简洁(Jacob Steinhardt)

  • 一致术语: 同一概念不同术语造成混乱。选一个并坚持。
  • 形式陈述假设: 定理前,明确列出所有假设
  • 直觉 + 严谨: 提供直观解释伴随形式证明

评审实际阅读什么

理解评审行为帮助优先努力:

论文章节 % 阅读的评审 影响
摘要 100% 必须完美
引言 90%+(略读) 前载贡献
在方法前检查 图1关键
方法 仅如果感兴趣 不埋导语
附录 很少 仅放补充细节

底线:如果您的摘要和引言不吸引评审,他们可能永远不会读您的出色方法章节。


会议要求快速参考

会议 页限 最终提交额外 关键要求
NeurIPS 2025 9页 +0 强制清单,接受后摘要
ICML 2026 8页 +1 要求更广泛影响声明
ICLR 2026 9页 +1 要求LLM披露,互惠评审
ACL 2025 8页(长) 变化 强制限制章节
AAAI 2026 7页 +1 严格样式文件遵守
COLM 2025 9页 +1 专注于语言模型

通用要求:

  • 双盲评审(匿名化提交)
  • 引用不计入页限
  • 附录无限但评审不需读
  • LaTeX所有场所必需

LaTeX模板:templates/目录所有会议模板。


正确使用LaTeX模板

工作流4:从模板开始新论文

始终首先复制整个模板目录,然后在其中编写。

模板设置清单:
- [ ] 步骤1:复制整个模板目录到新项目
- [ ] 步骤2:验证模板原样编译(在任何更改前)
- [ ] 步骤3:阅读模板的示例内容理解结构
- [ ] 步骤4:按章节替换示例内容
- [ ] 步骤5:保持模板注释/示例作为参考直到完成
- [ ] 步骤6:仅在结束时清理模板工件

步骤1:复制完整模板

# 用完整模板创建您的论文目录
cp -r templates/neurips2025/ ~/papers/my-new-paper/
cd ~/papers/my-new-paper/

# 验证结构完整
ls -la
# 应该看到:main.tex、neurips.sty、Makefile等

⚠️ 重要: 复制整个目录,非仅main.tex。模板包括:

  • 样式文件(.sty) - 编译必需
  • 参考文献样式(.bst) - 引用必需
  • 示例内容 - 有用作为参考
  • Makefiles - 用于简易编译

步骤2:首先验证模板编译

在做出任何更改前,原样编译模板:

# 使用latexmk(推荐)
latexmk -pdf main.tex

# 或手动编译
pdflatex main.tex
bibtex main
pdflatex main.tex
pdflatex main.tex

如果未修改模板不编译,先修复。常见问题:

  • 缺失TeX包 → 通过tlmgr install <package>安装
  • 错误TeX分布 → 使用TeX Live(推荐)

步骤3:保持模板内容作为参考

不要立即删除所有示例内容。反而:

% 保持模板示例注释掉当您编写
% 这显示您期望格式

% 模板示例(保持作为参考):
% \begin{figure}[t]
%   \centering
%   \includegraphics[width=0.8\linewidth]{example-image}
%   \caption{模板显示标题样式}
% \end{figure}

% 您的实际图:
\begin{figure}[t]
  \centering
  \includegraphics[width=0.8\linewidth]{your-figure.pdf}
  \caption{您的标题遵循相同样式。}
\end{figure}

步骤4:按章节替换内容

系统性地工作通过论文:

替换顺序:
1. 标题和作者(为提交匿名化)
2. 摘要
3. 引言
4. 方法
5. 实验
6. 相关工作
7. 结论
8. 参考文献(您的.bib文件)
9. 附录

对每章节:

  1. 阅读模板的示例内容
  2. 注意任何特殊格式化或使用的宏
  3. 替换为您的遵循相同模式的内容
  4. 频繁编译及早捕获错误

步骤5:使用模板宏

模板常定义有用宏。检查前导:

% 常用模板宏使用:

ewcommand{\method}{您的MethodName}  % 一致方法命名

ewcommand{\eg}{e.g.,\xspace}        % 适当缩写

ewcommand{\ie}{i.e.,\xspace}

ewcommand{\etal}{\textit{et al.}\xspace}

步骤6:仅在结束时清理

仅当论文接近完成时移除模板工件:

% 提交前 - 移除这些:
% - 注释掉的模板示例
% - 未使用的包
% - 模板的示例图/表
% - Lorem ipsum或占位符文本

% 保持这些:
% - 所有样式文件(.sty)
% - 参考文献样式(.bst)
% - 模板所需包
% - 您使用的任何自定义宏

模板陷阱避免

陷阱 问题 解决方案
仅复制main.tex 缺失.sty,不编译 复制整个目录
修改.sty文件 破坏会议格式化 绝不编辑样式文件
添加随机包 冲突,破坏模板 仅添加如果必要
太早删除模板内容 失去格式化参考 保持为注释直到完成
不频繁编译 错误累积 每章节后编译

快速模板参考

会议 主文件 关键样式文件 备注
NeurIPS 2025 main.tex neurips.sty 有Makefile
ICML 2026 example_paper.tex icml2026.sty 包括算法包
ICLR 2026 iclr2026_conference.tex iclr2026_conference.sty 有math_commands.tex
ACL acl_latex.tex acl.sty 严格格式化
AAAI 2026 aaai2026-unified-template.tex aaai2026.sty 非常严格遵守
COLM 2025 colm2025_conference.tex colm2025_conference.sty 类似ICLR

会议重新提交 & 格式转换

当论文从一个场所被拒绝或撤回并重新提交到另一个时,需要格式转换。这在ML研究中是常见工作流。

工作流3:在会议格式间转换

格式转换清单:
- [ ] 步骤1:识别源和目标模板差异
- [ ] 步骤2:创建带目标模板的新项目
- [ ] 步骤3:复制内容章节(非前导)
- [ ] 步骤4:调整页限和内容
- [ ] 步骤5:更新会议特定要求
- [ ] 步骤6:验证编译和格式化

步骤1:关键模板差异

从 → 到 页变化 关键调整
NeurIPS → ICML 9 → 8页 切1页,添加更广泛影响如果缺失
ICML → ICLR 8 → 9页 可扩展实验,添加LLM披露
NeurIPS → ACL 9 → 8页 为NLP惯例重构,添加限制
ICLR → AAAI 9 → 7页 需要显著削减,严格样式遵守
任何 → COLM 变化 → 9 为语言模型重点重构

步骤2:内容迁移(非模板合并)

绝不复制LaTeX前导在模板间。反而:

# 1. 以目标模板新鲜开始
cp -r templates/icml2026/ new_submission/

# 2. 复制仅内容章节从旧论文
# - 摘要文本
# - 章节内容(在\section{}命令间)
# - 图和表
# - 参考文献条目

# 3. 粘贴到目标模板结构

步骤3:调整页限

当削减页(例如,NeurIPS 9 → AAAI 7):

  • 移动详细证明到附录
  • 压缩相关工作(引用综述而非个别论文)
  • 合并类似实验到统一表
  • 使用较小图尺寸带子图
  • 收紧写作:消除冗余,使用主动语态

当扩展(例如,ICML 8 → ICLR 9):

  • 添加评审请求的消融研究
  • 扩展限制讨论
  • 包括额外基线
  • 添加定性示例

步骤4:会议特定调整

目标场所 必需添加
ICML 更广泛影响声明(结论后)
ICLR LLM使用披露,互惠评审协议
ACL/EMNLP 限制章节(强制),道德声明
AAAI 严格遵守样式文件(无修改)
NeurIPS 论文清单(附录),接受后摘要

步骤5:更新参考文献

% 移除揭示身份的自引用(为盲评审)
% 更新任何"评审中"引用到发表版本
% 添加上次提交后发表的新的相关工作

步骤6:处理先前评审

当拒绝后重新提交:

  • 在新版本中解决评审关切
  • 添加评审请求的实验/澄清
  • 不做 包括"先前提交变更"章节(盲评审)
  • 不做 引用先前提交或评审

常见转换陷阱:

  • ❌ 复制\usepackage命令(导致冲突)
  • ❌ 保留旧会议页眉/页脚命令
  • ❌ 忘记更新\bibliography{}路径
  • ❌ 缺失会议特定必需章节
  • ❌ 格式更改后超出页限

引用工作流(捏造预防)

⚠️ 关键: AI生成的引用有约40%错误率。绝不从记忆写BibTeX。

黄金规则

如果 您无法通过网络搜索验证引用:
    → 标记它为[CITATION NEEDED]或[PLACEHOLDER - VERIFY]
    → 明确告知科学家
    → 绝不发明听起来合理的引用

强制: 使用WebSearch工具在添加到参考文献前验证每个引用。

工作流2:添加引用

引用验证(每个引用强制):
- [ ] 步骤1:使用WebSearch查找论文
- [ ] 步骤2:在Google Scholar验证论文存在
- [ ] 步骤3:确认论文细节(标题、作者、年、场所)
- [ ] 步骤4:从Google Scholar或DOI检索BibTeX
- [ ] 步骤5:验证您引用的声明实际出现在论文中
- [ ] 步骤6:添加已验证BibTeX到参考文献
- [ ] 步骤7:如果任何步骤失败 → 标记为占位符,通知科学家

步骤1:使用WebSearch查找论文

当您需要引用论文时,始终以网络搜索开始:

WebSearch查询示例:
- "Attention is All You Need Vaswani 2017"
- "RLHF language model alignment 2023"
- "sparse autoencoders interpretability Anthropic"
- "transformer architecture NeurIPS"

在搜索结果中查找什么:

  • 论文标题匹配您的意图引用
  • 作者正确
  • 出版年正确
  • 场所(会议/期刊)识别

步骤2:在Google Scholar验证

找到论文后,在Google Scholar验证其存在:

WebSearch查询:"site:scholar.google.com [论文标题] [第一作者]"

示例:"site:scholar.google.com Attention is All You Need Vaswani"

验证清单:

  • ✅ 论文出现在Google Scholar结果
  • ✅ 标题精确匹配(或非常接近)
  • ✅ 作者匹配
  • ✅ 年匹配
  • ✅ 场所列出(会议/期刊)
  • ✅ 引用计数合理(旧论文非0)

如果论文未在Google Scholar找到:

  • ❌ 停止 - 不引用
  • 标记为[CITATION NEEDED - not found on Google Scholar]
  • 明确通知科学家

步骤3:确认论文细节

在检索BibTeX前,双重检查所有细节:

验证清单:
- 标题:[来自Google Scholar的精确标题]
- 作者:[所有作者,按顺序]
- 年:[出版年]
- 场所:[会议/期刊名]
- DOI:[如果可用]

步骤4:检索BibTeX

选项1:来自Google Scholar(推荐)

  1. 在Google Scholar上找到论文
  2. 点击论文下方的"引用"按钮
  3. 选择"BibTeX"格式
  4. 复制BibTeX条目

选项2:来自DOI(如果可用)

  1. 使用WebSearch查找:"doi.org/[DOI]"
  2. 在出版商页面查找BibTeX导出选项
  3. 复制BibTeX条目

选项3:来自arXiv(预印本)

  1. 在arXiv上找到论文
  2. 点击右侧边栏的"Export BibTeX Citation"
  3. 复制BibTeX条目

关键: 绝不从记忆写BibTeX。始终从已验证源复制。

步骤5:验证声明

在为特定声明引用前,验证声明实际出现在论文中:

验证过程:
1. 使用WebSearch访问论文(PDF或HTML)
2. 搜索与您的声明相关的关键词
3. 确认声明明确陈述或清晰隐含
4. 记下声明出现的章节/页

如果您无法访问论文:

  • ❌ 不为特定声明引用
  • 仅为一般贡献引用(如果在Google Scholar验证)
  • 标记为[CLAIM NOT VERIFIED - no access to paper]

步骤6:添加已验证BibTeX到参考文献

仅在完成所有验证步骤后:

% 添加到您的.bib文件
@inproceedings{vaswani2017attention,
  title={Attention is All You Need},
  author={Vaswani, Ashish and Shazeer, Noam and ...},
  booktitle={Advances in Neural Information Processing Systems},
  year={2017}
}

% 在您论文中使用
\cite{vaswani2017attention}

步骤7:明确处理失败

如果您无法在任一步验证引用:

% 选项1:显式占位符
\cite{PLACEHOLDER_smith2023_verify}  % TODO: 无法验证 - 科学家必须确认

% 选项2:文本中注释
... 如先前工作所示[CITATION NEEDED - could not verify Smith et al. 2023]。

始终告知科学家:

"我无法验证以下引用并已标记它们为占位符:

  • Smith等人2023关于奖励黑客 - 未在Google Scholar找到
  • Jones 2022关于缩放定律 - 找到类似论文但不同作者 提交前请验证这些。"

总结:引用规则

情况 操作
在Google Scholar找到,验证细节,获得BibTeX ✅ 使用引用
找到论文,在Google Scholar验证,无BibTeX ✅ 从Google Scholar信息创建BibTeX
论文存在但细节不匹配 ⚠️ 标记占位符,通知科学家
未在Google Scholar找到 ❌ 标记[CITATION NEEDED],通知科学家
“我认为有关于X的论文” 绝不引用 - 先搜索或标记占位符

🚨 绝不从记忆生成BibTeX—始终通过WebSearch和Google Scholar验证。 🚨

完整引用工作流示例

场景: 您需要引用Transformer论文。

步骤1:WebSearch
查询:"Attention is All You Need Vaswani 2017"
结果:在多个源找到论文

步骤2:Google Scholar验证
查询:"site:scholar.google.com Attention is All You Need Vaswani"
结果:✅ 论文找到,50,000+引用,NeurIPS 2017

步骤3:确认细节
- 标题:"Attention is All You Need"
- 作者:Vaswani, Ashish; Shazeer, Noam; Parmar, Niki; ...
- 年:2017
- 场所:NeurIPS (NIPS)
- DOI:可用

步骤4:检索BibTeX
- 点击Google Scholar上的"引用"
- 选择BibTeX格式
- 复制条目

步骤5:验证声明
- 通过WebSearch访问论文
- 确认声明出现在论文中
- 记下章节/页

步骤6:添加到参考文献
- 粘贴BibTeX到.bib文件
- 在论文中使用\cite{vaswani2017attention}

步骤7:成功
- 引用已验证并添加
- 无需占位符

常见问题与解决方案

问题:摘要太通用

删除第一句如果它可前置到任何ML论文。以您的具体贡献开始。

问题:引言超过1.5页

拆分背景到相关工作。前载贡献子弹。方法应最大在页2-3开始。

问题:实验缺乏明确声明

在每个实验前添加句子:“此实验测试是否[具体声明]…”

问题:评审发现论文难跟随

  • 添加明确路标:“在此章节,我们展示X”
  • 贯穿使用一致术语
  • 包括可独立的图标题

问题:缺失统计显著性

始终包括:

  • 误差条(指定:标准差或标准误差)
  • 运行数量
  • 统计测试如果比较方法

评审评估标准

评审在四个维度评估论文:

标准 评审查找什么
质量 技术正确性,良好支持的声明
清晰性 清晰写作,专家可复现
显著性 社区影响,推进理解
原创性 新见解(不需要新方法)

评分(NeurIPS 6点尺度):

  • 6: 强接受 - 开创性,无瑕
  • 5: 接受 - 技术坚实,高影响
  • 4: 边缘接受 - 坚实,有限评估
  • 3: 边缘拒绝 - 坚实但弱点超过
  • 2: 拒绝 - 技术缺陷
  • 1: 强拒绝 - 已知结果或伦理问题

references/reviewer-guidelines.md获取详细评审指令。


表与图

使用booktabs LaTeX包专业表:

\usepackage{booktabs}
\begin{tabular}{lcc}
\toprule
方法 & 准确度 ↑ & 延迟 ↓ \\
\midrule
基线 & 85.2 & 45ms \\
\textbf{我们的} & \textbf{92.1} & 38ms \\
\bottomrule
\end{tabular}

规则:

  • 加粗每度量最佳值
  • 包括方向符号(↑更高更好,↓更低更好)
  • 右对齐数值列
  • 一致小数精度

  • 矢量图形(PDF、EPS)所有绘图和图表
  • 光栅(PNG 600 DPI)仅用于照片
  • 使用色盲安全调色板(Okabe-Ito或Paul Tol)
  • 验证灰度可读性(8%男性有色觉缺陷)
  • 无图中标题—标题服务此功能
  • 独立标题—读者应无需主文理解

参考与资源

参考文档(深入)

文档 内容
writing-guide.md Gopen & Swan 7原则,Ethan Perez微观提示,词汇选择
citation-workflow.md 引用API,Python代码,BibTeX管理
checklists.md NeurIPS 16项,ICML、ICLR、ACL要求
reviewer-guidelines.md 评估标准,评分,反驳
sources.md 所有来源的完整参考文献
文献研究:
arxiv-search-guide.md arXiv搜索策略,URL模式,Chrome MCP自动化
paper-quality-criteria.md 5维度论文评估标准(创新、方法、实验、写作、影响)

LaTeX模板

templates/目录中的模板:ICML 2026ICLR 2026NeurIPS 2025ACL/EMNLPAAAI 2026COLM 2025

编译到PDF:

  • VS Code/Cursor:安装LaTeX Workshop扩展 + TeX Live → 保存以自动编译
  • 命令行latexmk -pdf main.texpdflatex + bibtex工作流
  • 在线:上传到Overleaf

templates/README.md获取详细设置指令。

关键外部来源

写作哲学:

APIs: Semantic Scholar | CrossRef | arXiv

场所: NeurIPS | ICML | ICLR | ACL