智能科研图表生成器Skill scientific-schematics

智能科研图表生成器利用Nano Banana Pro AI和Gemini 3 Pro AI进行智能迭代精炼,自动生成出版物质量的科学图表,包括神经网络架构、系统图、流程图、生物通路等复杂可视化。适用于期刊论文、会议报告、学术海报等多种文档类型,通过智能迭代优化质量,提高科研绘图效率。关键词:科学图表、AI生成、科研绘图、出版物质量、智能迭代、科研可视化、AIGC、学术图表。

科研绘图 0 次安装 0 次浏览 更新于 3/22/2026

名称: scientific-schematics 描述: “使用Nano Banana Pro AI通过智能迭代精炼创建出版物质量的科学图表。使用Gemini 3 Pro进行质量审查。仅在质量低于文档类型阈值时重新生成。专精于神经网络架构、系统图、流程图、生物通路和复杂科学可视化。” 允许工具: [读取, 写入, 编辑, Bash]

科学示意图和图表

概述

科学示意图和图表将复杂概念转化为清晰的视觉表示,用于出版物。此技能使用Nano Banana Pro AI进行图表生成,并配有Gemini 3 Pro质量审查。

工作原理:

  • 用自然语言描述您的图表
  • Nano Banana Pro自动生成出版物质量的图像
  • Gemini 3 Pro根据文档类型阈值审查质量
  • 智能迭代: 仅在质量低于阈值时重新生成
  • 几分钟内输出出版物就绪的结果
  • 无需编码、模板或手动绘图

按文档类型的质量阈值:

文档类型 阈值 描述
期刊 8.5/10 Nature、Science、同行评审期刊
会议 8.0/10 会议论文
论文 8.0/10 学位论文、毕业论文
资助 8.0/10 资助提案
预印本 7.5/10 arXiv、bioRxiv等
报告 7.5/10 技术报告
海报 7.0/10 学术海报
演示 6.5/10 幻灯片、演讲
默认 7.5/10 通用目的

只需描述您想要的内容,Nano Banana Pro就会创建它。 所有图表都存储在figures/子文件夹中,并在论文/海报中引用。

快速开始: 生成任何图表

通过简单描述创建任何科学图表。Nano Banana Pro使用智能迭代自动处理一切:

# 为期刊论文生成(最高质量阈值: 8.5/10)
python scripts/generate_schematic.py "CONSORT参与者流程图,包括500筛选、150排除、350随机化" -o figures/consort.png --doc-type journal

# 为演示生成(较低阈值: 6.5/10 - 更快)
python scripts/generate_schematic.py "Transformer编码器-解码器架构,显示多头注意力" -o figures/transformer.png --doc-type presentation

# 为海报生成(中等阈值: 7.0/10)
python scripts/generate_schematic.py "从EGFR到基因转录的MAPK信号通路" -o figures/mapk_pathway.png --doc-type poster

# 自定义最大迭代次数(最多2次)
python scripts/generate_schematic.py "复杂电路图,包含运算放大器、电阻和电容" -o figures/circuit.png --iterations 2 --doc-type journal

幕后过程:

  1. 生成1: Nano Banana Pro遵循科学图表最佳实践创建初始图像
  2. 审查1: Gemini 3 Pro根据文档类型阈值评估质量
  3. 决策: 如果质量 >= 阈值 → 完成(无需更多迭代!)
  4. 如果低于阈值: 基于批评改进提示,重新生成
  5. 重复: 直到质量达到阈值或达到最大迭代次数

智能迭代优势:

  • ✅ 如果第一次生成足够好,节省API调用
  • ✅ 期刊论文更高的质量标准
  • ✅ 演示/海报更快的周转时间
  • ✅ 针对每个用例的适当质量

输出: 版本化图像加上详细审查日志,包括质量分数、批评和提前停止信息。

配置

设置您的OpenRouter API密钥:

export OPENROUTER_API_KEY='your_api_key_here'

获取API密钥:https://openrouter.ai/keys

AI生成最佳实践

科学图表的有效提示:

好提示(具体、详细):

  • “CONSORT流程图显示从筛选(n=500)到随机化的参与者流程”
  • “Transformer神经网络架构,左侧编码器堆栈,右侧解码器堆栈,显示多头注意力和交叉注意力连接”
  • “生物信号级联:EGFR受体 → RAS → RAF → MEK → ERK → 细胞核,标记磷酸化步骤”
  • “IoT系统框图:传感器 → 微控制器 → WiFi模块 → 云服务器 → 移动应用”

避免模糊提示

  • “制作流程图”(太泛)
  • “神经网络”(哪种类型?什么组件?)
  • “通路图”(哪条通路?什么分子?)

包含的关键元素:

  • 类型:流程图、架构图、通路、电路等
  • 组件:包含的特定元素
  • 流程/方向:元素如何连接(从左到右、从上到下)
  • 标签:关键注释或文本
  • 风格:任何特定的视觉要求

科学质量指南(自动应用):

  • 清洁白色/浅色背景
  • 高对比度以提高可读性
  • 清晰、可读的标签(最小10点)
  • 专业排版(无衬线字体)
  • 色盲友好颜色(Okabe-Ito调色板)
  • 适当间距以防止拥挤
  • 适当比例尺、图例、轴
  • 无图号 - 图像不应包含"Figure 1:"、"Fig. 1"或类似标签(这些由文档/LaTeX添加)
  • 输出中无元指令 - 生成的图像必须不包含任何可见文本显示提示、系统指令或AI相关元数据。包括:布局描述(如"左面板"、“右面板”、“中心面板”)、字体规格、配色方案描述或用于创建图像的任何其他技术指令。图像应仅包含请求的图表内容,而非生成它的任何指令

何时使用此技能

此技能应在以下情况下使用:

  • 创建神经网络架构图(Transformers、CNNs、RNNs等)
  • 说明系统架构和数据流程图
  • 绘制研究设计的方法流程图(CONSORT、PRISMA)
  • 可视化算法工作流和处理管道
  • 创建电路图和电气示意图
  • 描述生物通路和分子相互作用
  • 生成网络拓扑和层次结构
  • 说明概念框架和理论模型
  • 设计技术论文的框图

如何使用此技能

只需用自然语言描述您的图表。 Nano Banana Pro自动生成:

python scripts/generate_schematic.py "您的图表描述" -o output.png

就是这样! AI处理:

  • ✓ 布局和构图
  • ✓ 标签和注释
  • ✓ 颜色和样式
  • ✓ 质量审查和精炼
  • ✓ 出版物就绪输出

适用于所有图表类型:

  • 流程图(CONSORT、PRISMA等)
  • 神经网络架构
  • 生物通路
  • 电路图
  • 系统架构
  • 框图
  • 任何科学可视化

无需编码、模板或手动绘图。


AI生成模式(Nano Banana Pro + Gemini 3 Pro审查)

智能迭代精炼工作流

AI生成系统使用智能迭代 - 仅在质量低于您的文档类型阈值时重新生成:

智能迭代工作原理

┌─────────────────────────────────────────────────────┐
│  1. 使用Nano Banana Pro生成图像                    │
│                    ↓                                │
│  2. 使用Gemini 3 Pro审查质量                       │
│                    ↓                                │
│  3. 分数 >= 阈值?                                 │
│       是 → 完成!(提前停止)                       │
│       否 → 改进提示,转到步骤1                      │
│                    ↓                                │
│  4. 重复直到质量达到或达到最大迭代次数             │
└─────────────────────────────────────────────────────┘

迭代1: 初始生成

提示构建:

科学图表指南 + 用户请求

输出: diagram_v1.png

Gemini 3 Pro的质量审查

Gemini 3 Pro评估图表的以下方面:

  1. 科学准确性(0-2分) - 正确的概念、符号、关系
  2. 清晰度和可读性(0-2分) - 易于理解、清晰的层次结构
  3. 标签质量(0-2分) - 完整、可读、一致的标签
  4. 布局和构图(0-2分) - 逻辑流程、平衡、无重叠
  5. 专业外观(0-2分) - 出版物就绪质量

示例审查输出:

分数: 8.0

优势:
- 从上到下的清晰流程
- 所有阶段正确标记
- 专业排版

问题:
- 参与者计数略小
- 排除框有轻微重叠

判决: 可接受(对于海报,阈值7.0)

决策点: 继续还是停止?

如果分数… 行动
>= 阈值 停止 - 质量对此文档类型足够好
< 阈值 继续到下一迭代,改进提示

示例:

  • 对于海报(阈值7.0):分数7.5 → 1次迭代后完成!
  • 对于期刊(阈值8.5):分数7.5 → 继续改进

后续迭代(仅在需要时)

如果质量低于阈值,系统:

  1. 从Gemini 3 Pro的审查中提取具体问题
  2. 用改进指令增强提示
  3. 使用Nano Banana Pro重新生成
  4. 再次使用Gemini 3 Pro审查
  5. 重复直到阈值达到或最大迭代次数达到

审查日志

所有迭代都保存为JSON审查日志,包括提前停止信息:

{
  "user_prompt": "CONSORT参与者流程图...",
  "doc_type": "poster",
  "quality_threshold": 7.0,
  "iterations": [
    {
      "iteration": 1,
      "image_path": "figures/consort_v1.png",
      "score": 7.5,
      "needs_improvement": false,
      "critique": "分数: 7.5
优势:..."
    }
  ],
  "final_score": 7.5,
  "early_stop": true,
  "early_stop_reason": "质量分数7.5满足海报阈值7.0"
}

注意: 使用智能迭代,如果质量提前达到,您可能只看到1次迭代而不是完整的2次!

高级AI生成使用

Python API

from scripts.generate_schematic_ai import ScientificSchematicGenerator

# 初始化生成器
generator = ScientificSchematicGenerator(
    api_key="your_openrouter_key",
    verbose=True
)

# 生成带有迭代精炼(最多2次迭代)
results = generator.generate_iterative(
    user_prompt="Transformer架构图",
    output_path="figures/transformer.png",
    iterations=2
)

# 访问结果
print(f"最终分数: {results['final_score']}/10")
print(f"最终图像: {results['final_image']}")

# 审查单个迭代
for iteration in results['iterations']:
    print(f"迭代 {iteration['iteration']}: {iteration['score']}/10")
    print(f"批评: {iteration['critique']}")

命令行选项

# 基本使用(默认阈值7.5/10)
python scripts/generate_schematic.py "图表描述" -o output.png

# 指定文档类型以获取适当质量阈值
python scripts/generate_schematic.py "图表" -o out.png --doc-type journal      # 8.5/10
python scripts/generate_schematic.py "图表" -o out.png --doc-type conference   # 8.0/10
python scripts/generate_schematic.py "图表" -o out.png --doc-type poster       # 7.0/10
python scripts/generate_schematic.py "图表" -o out.png --doc-type presentation # 6.5/10

# 自定义最大迭代次数(1-2)
python scripts/generate_schematic.py "复杂图表" -o diagram.png --iterations 2

# 详细输出(查看所有API调用和审查)
python scripts/generate_schematic.py "流程图" -o flow.png -v

# 通过标志提供API密钥
python scripts/generate_schematic.py "图表" -o out.png --api-key "sk-or-v1-..."

# 组合选项
python scripts/generate_schematic.py "神经网络" -o nn.png --doc-type journal --iterations 2 -v

提示工程技巧

1. 具体布局:

✓ "具有垂直流程的流程图,从上到下"
✓ "架构图,左侧编码器,右侧解码器"
✓ "圆形通路图,顺时针流程"

2. 包含定量细节:

✓ "神经网络,输入层(784节点)、隐藏层(128节点)、输出(10节点)"
✓ "流程图显示n=500筛选、n=150排除、n=350随机化"
✓ "电路包含1kΩ电阻、10µF电容、5V电源"

3. 指定视觉风格:

✓ "简约框图,清洁线条"
✓ "详细生物通路,含蛋白质结构"
✓ "技术示意图,使用工程符号"

4. 请求特定标签:

✓ "所有箭头标记激活/抑制"
✓ "每个框内包含层维度"
✓ "显示时间进展,含时间戳"

5. 提及颜色要求:

✓ "使用色盲友好颜色"
✓ "灰度兼容设计"
✓ "按功能颜色编码:蓝色输入、绿色处理、红色输出"

AI生成示例

示例1: CONSORT流程图

python scripts/generate_schematic.py \
  "随机对照试验的CONSORT参与者流程图。 \
   顶部以'评估资格(n=500)'开始。 \
   显示'排除(n=150)'及其原因:年龄<18(n=80)、拒绝(n=50)、其他(n=20)。 \
   然后'随机化(n=350)'分成两组: \
   '治疗组(n=175)'和'对照组(n=175)'。 \
   每组显示'失访'(n=15和n=10)。 \
   以'分析'(n=160和n=165)结束。 \
   使用蓝色框表示过程步骤、橙色表示排除、绿色表示最终分析。" \
  -o figures/consort.png

示例2: 神经网络架构

python scripts/generate_schematic.py \
  "Transformer编码器-解码器架构图。 \
   左侧:编码器堆栈,包含输入嵌入、位置编码、 \
   多头自注意力、添加与归一化、前馈、添加与归一化。 \
   右侧:解码器堆栈,包含输出嵌入、位置编码、 \
   掩码自注意力、添加与归一化、交叉注意力(从编码器接收)、 \
   添加与归一化、前馈、添加与归一化、线性与softmax。 \
   用虚线显示从编码器到解码器的交叉注意力连接。 \
   使用浅蓝色表示编码器、浅红色表示解码器。 \
   清晰标记所有组件。" \
  -o figures/transformer.png --iterations 2

示例3: 生物通路

python scripts/generate_schematic.py \
  "MAPK信号通路图。 \
   顶部从细胞膜上的EGFR受体开始。 \
   箭头向下到RAS(标记GTP)。 \
   箭头到RAF激酶。 \
   箭头到MEK激酶。 \
   箭头到ERK激酶。 \
   最终箭头到细胞核,显示基因转录。 \
   用'磷酸化'或'激活'标记每个箭头。 \
   使用圆角矩形表示蛋白质,每种颜色不同。 \
   包含顶部的膜边界线。" \
  -o figures/mapk_pathway.png

示例4: 系统架构

python scripts/generate_schematic.py \
  "IoT系统架构框图。 \
   底层:传感器(温度、湿度、运动)在绿色框中。 \
   中层:微控制器(ESP32)在蓝色框中。 \
   连接到WiFi模块(橙色框)和显示器(紫色框)。 \
   顶层:云服务器(灰色框)连接到移动应用(浅蓝色框)。 \
   显示所有组件之间的数据流箭头。 \
   用协议标记连接:I2C、UART、WiFi、HTTPS。" \
  -o figures/iot_architecture.png

命令行使用

生成科学示意图的主要入口点:

# 基本使用
python scripts/generate_schematic.py "图表描述" -o output.png

# 自定义迭代次数(最多2次)
python scripts/generate_schematic.py "复杂图表" -o diagram.png --iterations 2

# 详细模式
python scripts/generate_schematic.py "图表" -o out.png -v

注意: Nano Banana Pro AI生成系统在其迭代精炼过程中包括自动质量审查。每次迭代都评估科学准确性、清晰度和可访问性。

最佳实践总结

设计原则

  1. 清晰胜于复杂 - 简化,移除不必要元素
  2. 一致样式 - 使用模板和样式文件
  3. 色盲可访问性 - 使用Okabe-Ito调色板,冗余编码
  4. 适当排版 - 无衬线字体,最小7-8点
  5. 矢量格式 - 出版物始终使用PDF/SVG

技术要求

  1. 分辨率 - 首选矢量,或300+ DPI用于栅格
  2. 文件格式 - LaTeX用PDF,Web用SVG,PNG作为备用
  3. 颜色空间 - 数字用RGB,打印用CMYK(如需转换)
  4. 线宽 - 最小0.5点,典型1-2点
  5. 文本大小 - 最终尺寸最小7-8点

集成指南

  1. 在LaTeX中包含 - 使用\includegraphics{}用于生成的图像
  2. 完整标题 - 描述所有元素和缩写
  3. 文本中引用 - 在叙述流程中解释图表
  4. 保持一致性 - 论文中所有图形相同样式
  5. 版本控制 - 在存储库中保存提示和生成的图像

常见问题故障排除

AI生成问题

问题:文本或元素重叠

  • 解决方案:AI生成自动处理间距
  • 解决方案:增加迭代次数:--iterations 2用于更好精炼

问题:元素连接不正确

  • 解决方案:使您的提示更具体关于连接和布局
  • 解决方案:增加迭代次数用于更好精炼

图像质量问题

问题:导出质量差

  • 解决方案:AI生成自动产生高质量图像
  • 解决方案:增加迭代次数用于更好结果:--iterations 2

问题:生成后元素重叠

  • 解决方案:AI生成自动处理间距
  • 解决方案:增加迭代次数:--iterations 2用于更好精炼
  • 解决方案:使您的提示更具体关于布局和间距要求

质量检查问题

问题:误报重叠检测

  • 解决方案:调整阈值:detect_overlaps(image_path, threshold=0.98)
  • 解决方案:在视觉报告中手动审查标记区域

问题:生成的图像质量低

  • 解决方案:AI生成默认产生高质量图像
  • 解决方案:增加迭代次数用于更好结果:--iterations 2

问题:色盲模拟显示对比度差

  • 解决方案:在代码中明确切换到Okabe-Ito调色板
  • 解决方案:添加冗余编码(形状、图案、线型)
  • 解决方案:增加颜色饱和度和亮度差异

问题:检测到高严重性重叠

  • 解决方案:审查overlap_report.json以获取确切位置
  • 解决方案:在那些特定区域增加间距
  • 解决方案:用调整后的参数重新运行并再次验证

问题:视觉报告生成失败

  • 解决方案:检查Pillow和matplotlib安装
  • 解决方案:确保图像文件可读:Image.open(path).verify()
  • 解决方案:检查报告生成有足够磁盘空间

可访问性问题

问题:灰度中颜色难以区分

  • 解决方案:运行可访问性检查器:verify_accessibility(image_path)
  • 解决方案:添加图案、形状或线型用于冗余
  • 解决方案:增加相邻元素之间的对比度

问题:打印时文本太小

  • 解决方案:运行分辨率验证器:validate_resolution(image_path)
  • 解决方案:设计时使用最终尺寸,最小7-8点字体
  • 解决方案:检查物理尺寸在分辨率报告中

问题:可访问性检查持续失败

  • 解决方案:审查accessibility_report.json以获取特定失败
  • 解决方案:增加颜色对比度至少20%
  • 解决方案:最终确定前用实际灰度转换测试

资源和参考

详细参考

加载这些文件以获取特定主题的全面信息:

  • references/diagram_types.md - 科学图表类型目录及示例
  • references/best_practices.md - 出版物标准和可访问性指南

外部资源

Python库

出版物标准

与其他技能集成

此技能与以下技能协同工作:

  • 科学写作 - 图表遵循图形最佳实践
  • 科学可视化 - 共享调色板和样式
  • LaTeX海报 - 为海报演示生成图表
  • 研究资助 - 提案的方法图表
  • 同行评审 - 评估图表清晰度和可访问性

快速参考清单

提交图表前,验证:

视觉质量

  • [ ] 高质量图像格式(AI生成的PNG)
  • [ ] 无重叠元素(AI自动处理)
  • [ ] 所有组件间适当间距(AI优化)
  • [ ] 清洁、专业对齐
  • [ ] 所有箭头正确连接到预期目标

可访问性

  • [ ] 使用色盲安全调色板(Okabe-Ito)
  • [ ] 灰度下工作(用可访问性检查器测试)
  • [ ] 元素间足够对比度(已验证)
  • [ ] 适当冗余编码(形状 + 颜色)
  • [ ] 色盲模拟通过所有检查

排版和可读性

  • [ ] 文本最终尺寸最小7-8点
  • [ ] 所有元素清晰完整标记
  • [ ] 一致字体家族和大小
  • [ ] 无文本重叠或截断
  • [ ] 适用时包含单位

出版物标准

  • [ ] 与手稿中其他图形一致样式
  • [ ] 完整标题,定义所有缩写
  • [ ] 在手稿文本中适当引用
  • [ ] 满足期刊特定尺寸要求
  • [ ] 导出为期刊所需格式(PDF/EPS/TIFF)

质量验证(必需)

  • [ ] 运行run_quality_checks()并获得PASS状态
  • [ ] 审查重叠检测报告(零高严重性重叠)
  • [ ] 通过可访问性验证(灰度和色盲)
  • [ ] 在目标DPI(打印300+)验证分辨率
  • [ ] 生成并审查视觉质量报告
  • [ ] 所有质量报告与图形文件一起保存

文档和版本控制

  • [ ] 源文件(.tex, .py)保存以供未来修订
  • [ ] 质量报告存档在quality_reports/目录中
  • [ ] 配置参数文档化(颜色、间距、大小)
  • [ ] Git提交包括源、输出和质量报告
  • [ ] README或注释解释如何重新生成图形

最终集成检查

  • [ ] 图形在编译手稿中正确显示
  • [ ] 交叉引用工作(\ref{}指向正确图形)
  • [ ] 图形编号匹配文本引用
  • [ ] 标题相对于图形出现在正确页面
  • [ ] 无与图形相关的编译警告或错误

环境设置

# 必需
export OPENROUTER_API_KEY='your_api_key_here'

# 获取密钥:https://openrouter.ai/keys

开始使用

最简单使用:

python scripts/generate_schematic.py "您的图表描述" -o output.png

使用此技能创建清晰、可访问、出版物质量的图表,有效传达复杂科学概念。AI驱动的工作流与迭代精炼确保图表满足专业标准。