name: paper-2-web description: 这个技能应用于将学术论文转化为推广和演示格式，包括交互式网站(Paper2Web)、演示视频(Paper2Video)和会议海报(Paper2Poster)。使用此技能处理论文传播、会议准备、创建可探索的学术主页、生成视频摘要或从LaTeX或PDF源生成打印就绪的海报。 allowed-tools: [Read, Write, Edit, Bash]

Paper2All: 学术论文转化管道

概述

这个技能使用Paper2All自主管道将学术论文转化为多种推广和演示格式。系统将研究论文(LaTeX或PDF)转化为三种主要输出：

Paper2Web: 具有布局感知设计的交互式、可探索的学术主页
Paper2Video: 带有旁白、幻灯片和可选真人出镜的专业演示视频
Paper2Poster: 具有专业布局的打印就绪会议海报

管道使用LLM驱动的内容提取、设计生成和迭代优化，以创建适合会议、期刊、预印本存储库和学术推广的高质量输出。

何时使用此技能

使用此技能当：

创建会议材料: 为学术会议制作海报、演示视频和配套网站
推广研究: 将已发表论文或预印本转化为可访问、吸引人的网页格式
准备演示: 从论文内容生成视频摘要或完整演示视频
传播发现: 为社交媒体、实验室网站或机构展示创建推广材料
增强预印本: 为bioRxiv、arXiv或其他预印本提交添加交互式主页
批量处理: 为多篇论文同时生成推广材料

触发短语:

“将这篇论文转化为网站”
“从我的LaTeX论文生成会议海报”
“基于这项研究创建视频演示”
“为我的论文制作交互式主页”
“将我的论文转化为推广材料”
“为我的会议演讲生成海报和视频”

通过科学示意图增强视觉效果

使用此技能创建文档时，始终考虑添加科学图表和示意图以增强视觉传达。

如果您的文档不包含示意图或图表：

使用科学示意图技能生成AI驱动的出版物质量图表
只需用自然语言描述您想要的图表
Nano Banana Pro将自动生成、审查和优化示意图

对于新文档: 应默认生成科学示意图，以视觉方式呈现文本中描述的关键概念、工作流程、架构或关系。

如何生成示意图:

python scripts/generate_schematic.py "您的图表描述" -o figures/output.png

AI将自动：

创建具有适当格式的出版物质量图像
通过多次迭代审查和优化
确保可访问性（色盲友好、高对比度）
将输出保存在figures/目录中

何时添加示意图:

论文转化管道示意图
网站布局架构图
视频制作工作流程插图
海报设计过程流程图
内容提取图
系统架构可视化
任何受益于可视化的复杂概念

有关创建示意图的详细指导，请参考科学示意图技能文档。

核心能力

1. Paper2Web: 交互式网站生成

将论文转化为布局感知的交互式学术主页，超越简单的HTML转换。

关键特性:

响应式、多部分布局，适应论文内容
交互式图表、表格和引用
移动友好设计，带导航
自动徽标发现（使用Google搜索API）
美学优化和质量评估

最佳用途: 发布后推广、预印本增强、实验室网站、永久研究展示

→ 参见references/paper2web.md获取详细文档

2. Paper2Video: 演示视频生成

生成带有幻灯片、旁白、光标移动和可选真人出镜视频的专业演示视频。

关键特性:

从论文结构自动生成幻灯片
自然语音合成
同步光标移动和高亮
可选真人出镜视频使用Hallo2（需要GPU）
多语言支持

最佳用途: 视频摘要、会议演示、在线讲座、课程材料、YouTube推广

→ 参见references/paper2video.md获取详细文档

3. Paper2Poster: 会议海报生成

创建具有专业布局和视觉设计的打印就绪学术海报。

关键特性:

自定义海报尺寸（任何大小）
专业设计模板
机构品牌支持
二维码生成用于链接
高分辨率输出（300+ DPI）

最佳用途: 会议海报展示、研讨会、学术展览、虚拟会议

→ 参见references/paper2poster.md获取详细文档

快速开始

前提条件

安装Paper2All:

git clone https://github.com/YuhangChen1/Paper2All.git
cd Paper2All
conda create -n paper2all python=3.11
conda activate paper2all
pip install -r requirements.txt

配置API密钥（创建.env文件）:

OPENAI_API_KEY=您的_openai_api_key_here
# 可选：GOOGLE_API_KEY和GOOGLE_CSE_ID用于徽标搜索

安装系统依赖:
- LibreOffice（文档转换）
- Poppler实用程序（PDF处理）
- NVIDIA GPU，48GB（可选，用于真人出镜视频）

→ 参见references/installation.md获取完整安装指南

基本用法

生成所有组件（网站+海报+视频）:

python pipeline_all.py \
  --input-dir "论文路径" \
  --output-dir "输出路径" \
  --model-choice 1

仅生成网站:

python pipeline_all.py \
  --input-dir "论文路径" \
  --output-dir "输出路径" \
  --model-choice 1 \
  --generate-website

生成自定义尺寸的海报:

python pipeline_all.py \
  --input-dir "论文路径" \
  --output-dir "输出路径" \
  --model-choice 1 \
  --generate-poster \
  --poster-width-inches 60 \
  --poster-height-inches 40

生成视频（轻量管道）:

python pipeline_light.py \
  --model_name_t gpt-4.1 \
  --model_name_v gpt-4.1 \
  --result_dir "输出路径" \
  --paper_latex_root "论文路径"

→ 参见references/usage_examples.md获取全面工作流程示例

工作流程决策树

使用此决策树确定生成哪些组件：

用户需要论文的推广材料？
│
├─ 需要永久在线存在？
│  └─→ 生成Paper2Web（交互式网站）
│
├─ 需要物理会议材料？
│  ├─→ 海报展示？ → 生成Paper2Poster
│  └─→ 口头演示？ → 生成Paper2Video
│
├─ 需要视频内容？
│  ├─→ 期刊视频摘要？ → 生成Paper2Video（5-10分钟）
│  ├─→ 会议演讲？ → 生成Paper2Video（15-20分钟）
│  └─→ 社交媒体？ → 生成Paper2Video（1-3分钟）
│
└─ 需要完整包？
   └─→ 生成所有三个组件

输入要求

支持的输入格式

1. LaTeX源（推荐）:

论文目录/
├── main.tex              # 主论文文件
├── sections/             # 可选：分割章节
├── figures/              # 所有图形文件
├── tables/               # 表文件
└── bibliography.bib      # 参考文献

2. PDF:

高质量PDF，带嵌入字体
可选中文本（非扫描图像）
高分辨率图形（建议300+ DPI）

输入组织

单篇论文:

输入/
└── 论文名称/
    ├── main.tex（或paper.pdf）
    ├── figures/
    └── bibliography.bib

多篇论文（批量处理）:

输入/
├── 论文1/
│   └── main.tex
├── 论文2/
│   └── main.tex
└── 论文3/
    └── main.tex

常见参数

模型选择

--model-choice 1: GPT-4（质量和成本的最佳平衡）
--model-choice 2: GPT-4.1（最新功能，更高成本）
--model_name_t gpt-3.5-turbo: 更快，成本更低（可接受质量）

组件选择

--generate-website: 启用网站生成
--generate-poster: 启用海报生成
--generate-video: 启用视频生成
--enable-talking-head: 为视频添加真人出镜（需要GPU）

自定义

--poster-width-inches [宽度]: 自定义海报宽度
--poster-height-inches [高度]: 自定义海报高度
--video-duration [秒]: 目标视频长度
--enable-logo-search: 自动机构徽标发现

输出结构

生成的输出按论文和组件组织：

输出/
└── 论文名称/
    ├── website/
    │   ├── index.html
    │   ├── styles.css
    │   └── assets/
    ├── poster/
    │   ├── poster_final.pdf
    │   ├── poster_final.png
    │   └── poster_source/
    └── video/
        ├── final_video.mp4
        ├── slides/
        ├── audio/
        └── subtitles/

最佳实践

输入准备

尽可能使用LaTeX: 提供最佳内容提取和结构
正确组织文件: 将所有资产（图形、表格、参考文献）保存在论文目录中
高质量图形: 使用矢量格式（PDF、SVG）或高分辨率栅格（300+ DPI）
干净的LaTeX: 移除编译工件，确保源代码成功编译

模型选择策略

GPT-4: 用于生产质量输出、会议、出版物最佳
GPT-4.1: 当需要最新功能或最佳可能质量时使用
GPT-3.5-turbo: 用于快速草稿、测试或简单论文

组件优先级

对于紧截止日期，按此顺序生成：

网站（最快、最通用，约15-30分钟）
海报（中等速度，用于打印截止日期，约10-20分钟）
视频（最慢，可稍后生成，约20-60分钟）

质量保证

在最终确定输出前：

网站: 在多种设备上测试，验证所有链接工作，检查图形质量
海报: 打印测试页，验证3-6英尺距离的文本可读性，检查颜色
视频: 观看整个视频，验证音频同步，在不同设备上测试

资源需求

处理时间

网站: 每篇论文15-30分钟
海报: 每篇论文10-20分钟
视频（无真人出镜）: 每篇论文20-60分钟
视频（带真人出镜）: 每篇论文60-120分钟

计算需求

CPU: 多核处理器用于并行处理
RAM: 最小16GB，建议32GB用于大型论文
GPU: 可选用于标准输出，真人出镜需要（NVIDIA A6000 48GB）
存储: 每篇论文1-5GB，取决于组件和质量设置

API成本（近似）

网站: 每篇论文$0.50-2.00（GPT-4）
海报: 每篇论文$0.30-1.00（GPT-4）
视频: 每篇论文$1.00-3.00（GPT-4）
完整包: 每篇论文$2.00-6.00（GPT-4）

故障排除

常见问题

LaTeX解析错误:

确保LaTeX源代码成功编译：pdflatex main.tex
检查所有引用文件存在
验证无自定义包阻止解析

图形质量差:

使用矢量格式（PDF、SVG、EPS）代替栅格
确保栅格图像为300+ DPI
检查图形在编译的PDF中正确渲染

视频生成失败:

验证足够磁盘空间（建议5GB+）
检查所有依赖已安装（LibreOffice、Poppler）
查看输出目录中的错误日志

海报布局问题:

验证海报尺寸合理（24"-72"范围）
检查内容长度（非常长的论文可能需要手动整理）
确保图形具有适合海报尺寸的分辨率

API错误:

验证.env文件中的API密钥
检查API信用余额
确保无速率限制（等待并重试）

平台特定功能

社交媒体优化

系统自动检测目标平台：

Twitter/X（英语，数字文件夹名）:

mkdir -p input/001_twitter/
# 生成英语推广内容

Xiaohongshu/小红书（中文，字母数字文件夹名）:

mkdir -p input/xhs_paper/
# 生成中文推广内容

会议特定格式

指定会议要求：

标准海报尺寸（4’×3’、5’×4’、A0、A1）
视频摘要长度限制（通常3-5分钟）
机构品牌要求
颜色方案偏好

集成和部署

网站部署

部署生成的网站到：

GitHub Pages: 免费托管，带自定义域名
学术托管: 大学Web服务器
个人服务器: AWS、DigitalOcean等
Netlify/Vercel: 带CI/CD的现代托管

海报打印

打印就绪文件适用于：

专业海报打印服务
大学打印店
在线服务（如Spoonflower、VistaPrint）
大型格式打印机（如果可用）

视频分发

在以下平台分享视频：

YouTube: 公开或未列明以获取最大覆盖
机构存储库: 大学视频平台
会议平台: 虚拟会议系统
社交媒体: Twitter、LinkedIn、ResearchGate

高级用法

批量处理

高效处理多篇论文：

# 在批处理目录中组织论文
for paper in paper1 paper2 paper3; do
    python pipeline_all.py \
      --input-dir input/$paper \
      --output-dir output/$paper \
      --model-choice 1 &
done
wait

自定义品牌

应用机构或实验室品牌：

在论文目录中提供徽标文件
在配置中指定颜色方案
使用自定义模板（高级）
匹配会议要求

多语言支持

生成不同语言的内容：

在配置中指定目标语言
系统适当翻译内容
为视频旁白选择适当语音
适应文化设计惯例

参考资料和资源

此技能包括全面参考文档：

references/installation.md: 完整安装和配置指南
references/paper2web.md: 详细Paper2Web文档，包含所有功能
references/paper2video.md: 全面Paper2Video指南，包括真人出镜设置
references/paper2poster.md: 完整Paper2Poster文档，含设计模板
references/usage_examples.md: 真实世界示例和工作流程模式

外部资源:

GitHub存储库：https://github.com/YuhangChen1/Paper2All
精选数据集：可在Hugging Face获取（13个研究类别）
基准套件：参考网站和评估指标

评估和质量指标

Paper2All系统包括内置质量评估：

内容质量

完整性: 论文内容覆盖
准确性: 发现的忠实表示
清晰度: 可访问性和可理解性
信息性: 关键信息突出

设计质量

美学: 视觉吸引力和专业性
布局: 平衡、层次和组织
可读性: 文本可读性和图形清晰度
一致性: 统一风格和品牌

技术质量

性能: 加载时间、响应性
兼容性: 跨浏览器、跨设备支持
可访问性: WCAG合规性、屏幕阅读器支持
标准: 有效HTML/CSS、打印就绪PDF

所有输出在生成完成前经过自动质量检查。