名称: 科学示意图描述: “使用Nano Banana Pro AI智能迭代优化创建出版质量的科学示意图。使用Gemini 3 Pro进行质量审查。仅当质量低于文档类型阈值时才重新生成。专长于神经网络架构、系统图、流程图、生物通路和复杂科学可视化。” 允许工具: [读取, 写入, 编辑, Bash]

科学示意图和图表

概述

科学示意图和图表将复杂概念转化为清晰的视觉表示，用于出版。此技能使用Nano Banana Pro AI进行图表生成，并通过Gemini 3 Pro进行质量审查。

工作原理:

用自然语言描述您的图表
Nano Banana Pro自动生成出版质量的图像
Gemini 3 Pro根据文档类型阈值审查质量
智能迭代: 仅当质量低于阈值时重新生成
出版就绪的输出在几分钟内完成
无需编码、模板或手动绘制

按文档类型的质量阈值:

文档类型	阈值	描述
期刊	8.5/10	Nature、Science等同行评审期刊
会议	8.0/10	会议论文
学位论文	8.0/10	论文、学位论文
资助申请	8.0/10	资助提案
预印本	7.5/10	arXiv、bioRxiv等
报告	7.5/10	技术报告
海报	7.0/10	学术海报
演示	6.5/10	幻灯片、演讲
默认	7.5/10	通用目的

只需描述您想要的内容，Nano Banana Pro即可创建。 所有图表存储在figures/子文件夹中，并在论文/海报中引用。

快速开始：生成任何图表

通过简单描述创建任何科学图表。Nano Banana Pro通过智能迭代自动处理所有内容：

# 为期刊论文生成（最高质量阈值：8.5/10）
python scripts/generate_schematic.py "CONSORT参与者流程图，包含500个筛选、150个排除、350个随机化" -o figures/consort.png --doc-type journal

# 为演示生成（较低阈值：6.5/10 - 更快）
python scripts/generate_schematic.py "Transformer编码器-解码器架构，展示多头注意力" -o figures/transformer.png --doc-type presentation

# 为海报生成（中等阈值：7.0/10）
python scripts/generate_schematic.py "从EGFR到基因转录的MAPK信号通路" -o figures/mapk_pathway.png --doc-type poster

# 自定义最大迭代次数（最大2）
python scripts/generate_schematic.py "复杂电路图，包含运放、电阻和电容" -o figures/circuit.png --iterations 2 --doc-type journal

后台过程:

生成1: Nano Banana Pro遵循科学图表最佳实践创建初始图像
审查1: Gemini 3 Pro根据文档类型阈值评估质量
决策: 如果质量 >= 阈值 → 完成（无需更多迭代！）
如果低于阈值: 基于批评改进提示，重新生成
重复: 直到质量满足阈值或达到最大迭代次数

智能迭代优势:

✅ 如果首次生成足够好，节省API调用
✅ 期刊论文的更高质量标准
✅ 演示/海报的更快周转
✅ 每个用例的适当质量

输出: 版本化图像加上详细审查日志，包含质量分数、批评和提前停止信息。

配置

设置您的OpenRouter API密钥：

export OPENROUTER_API_KEY='您的API密钥'

获取API密钥：https://openrouter.ai/keys

AI生成最佳实践

科学图表的有效提示：

✓ 好提示（具体、详细）：

“CONSORT流程图展示参与者从筛选（n=500）到最终分析的流程”
“Transformer神经网络架构，左侧编码器堆栈，右侧解码器堆栈，展示多头注意力和交叉注意力连接”
“生物信号级联：EGFR受体 → RAS → RAF → MEK → ERK → 细胞核，标记磷酸化步骤”
“物联网系统框图：传感器 → 微控制器 → WiFi模块 → 云服务器 → 移动应用”

✗ 避免模糊提示:

“做一个流程图”（太泛）
“神经网络”（哪种类型？哪些组件？）
“通路图”（哪条通路？哪些分子？）

包含的关键元素:

类型: 流程图、架构图、通路、电路等
组件: 包含的具体元素
流程/方向: 元素如何连接（从左到右、从上到下）
标签: 关键注释或文本
样式: 任何特定的视觉要求

科学质量指南（自动应用）：

干净的白/浅色背景
高对比度以提高可读性
清晰、可读的标签（最小10pt）
专业排版（无衬线字体）
色盲友好颜色（Okabe-Ito调色板）
适当的间距以防止拥挤
适当的位置使用比例尺、图例、坐标轴
无图号 - 图像不应包含"图1:"、"Fig. 1"或类似标签（这些由文档/LaTeX添加）
无输出中的元指令 - 生成的图像必须不含任何可见文本显示提示、系统指令或AI相关元数据。这包括：布局描述（如"左面板"、“右面板”、“中心面板”）、字体规格、颜色方案描述或任何其他用于创建图像的技术指令。图像应仅包含请求的图表内容，而不是任何生成它的指令

何时使用此技能

此技能应在以下情况下使用：

创建神经网络架构图（Transformers、CNNs、RNNs等）
说明系统架构和数据流图
绘制研究设计的方法流程图（CONSORT、PRISMA）
可视化算法工作流和处理流水线
创建电路图和电气示意图
描述生物通路和分子相互作用
生成网络拓扑和层次结构
说明概念框架和理论模型
为技术论文设计框图

如何使用此技能

只需用自然语言描述您的图表。 Nano Banana Pro自动生成：

python scripts/generate_schematic.py "您的图表描述" -o output.png

就是这样！ AI处理：

✓ 布局和构图
✓ 标签和注释
✓ 颜色和样式
✓ 质量审查和优化
✓ 出版就绪的输出

适用于所有图表类型:

流程图（CONSORT、PRISMA等）
神经网络架构
生物通路
电路图
系统架构
框图
任何科学可视化

无需编码、模板或手动绘制。

AI生成模式（Nano Banana Pro + Gemini 3 Pro审查）

智能迭代优化工作流

AI生成系统使用智能迭代 - 仅当质量低于文档类型阈值时才重新生成：

智能迭代如何工作

┌─────────────────────────────────────────────────────┐
│  1. 使用Nano Banana Pro生成图像                  │
│                    ↓                                │
│  2. 使用Gemini 3 Pro审查质量                     │
│                    ↓                                │
│  3. 分数 >= 阈值？                               │
│       是 → 完成！（提前停止）                     │
│       否 → 改进提示，转到步骤1                    │
│                    ↓                                │
│  4. 重复直到质量满足或达到最大迭代次数           │
└─────────────────────────────────────────────────────┘

迭代1：初始生成

提示构建:

科学图表指南 + 用户请求

输出: diagram_v1.png

Gemini 3 Pro的质量审查

Gemini 3 Pro评估图表基于：

科学准确性（0-2分） - 正确概念、符号、关系
清晰度和可读性（0-2分） - 易于理解、清晰层次
标签质量（0-2分） - 完整、可读、一致的标签
布局和构图（0-2分） - 逻辑流、平衡、无重叠
专业外观（0-2分） - 出版就绪的质量

示例审查输出:

分数: 8.0

优势:
- 从上到下的清晰流程
- 所有阶段适当标记
- 专业排版

问题:
- 参与者计数略小
- 排除框有轻微重叠

判定: 可接受（对于海报，阈值7.0）

决策点：继续或停止？

如果分数…	动作
>= 阈值	停止 - 质量对此文档类型足够好
< 阈值	继续到下一次迭代，使用改进提示

示例:

对于海报（阈值7.0）：分数7.5 → 迭代1后完成！
对于期刊（阈值8.5）：分数7.5 → 继续改进

后续迭代（仅当需要时）

如果质量低于阈值，系统：

从Gemini 3 Pro审查中提取具体问题
用改进指令增强提示
用Nano Banana Pro重新生成
用Gemini 3 Pro再次审查
重复直到阈值满足或最大迭代次数达到

审查日志

所有迭代都保存在JSON审查日志中，包含提前停止信息：

{
  "user_prompt": "CONSORT参与者流程图...",
  "doc_type": "poster",
  "quality_threshold": 7.0,
  "iterations": [
    {
      "iteration": 1,
      "image_path": "figures/consort_v1.png",
      "score": 7.5,
      "needs_improvement": false,
      "critique": "分数: 7.5
优势:..."
    }
  ],
  "final_score": 7.5,
  "early_stop": true,
  "early_stop_reason": "分数7.5满足海报的阈值7.0"
}

注意: 通过智能迭代，如果质量提前达到，您可能只看到1次迭代而不是完整的2次！

高级AI生成使用

Python API

from scripts.generate_schematic_ai import ScientificSchematicGenerator

# 初始化生成器
generator = ScientificSchematicGenerator(
    api_key="您的openrouter密钥",
    verbose=True
)

# 生成与迭代优化（最大2次迭代）
results = generator.generate_iterative(
    user_prompt="Transformer架构图",
    output_path="figures/transformer.png",
    iterations=2
)

# 访问结果
print(f"最终分数: {results['final_score']}/10")
print(f"最终图像: {results['final_image']}")

# 审查单个迭代
for iteration in results['iterations']:
    print(f"迭代 {iteration['iteration']}: {iteration['score']}/10")
    print(f"批评: {iteration['critique']}")

命令行选项

# 基本使用（默认阈值7.5/10）
python scripts/generate_schematic.py "图表描述" -o output.png

# 指定文档类型以使用适当质量阈值
python scripts/generate_schematic.py "图表" -o out.png --doc-type journal      # 8.5/10
python scripts/generate_schematic.py "图表" -o out.png --doc-type conference   # 8.0/10
python scripts/generate_schematic.py "图表" -o out.png --doc-type poster       # 7.0/10
python scripts/generate_schematic.py "图表" -o out.png --doc-type presentation # 6.5/10

# 自定义最大迭代次数（1-2）
python scripts/generate_schematic.py "复杂图表" -o diagram.png --iterations 2

# 详细输出（查看所有API调用和审查）
python scripts/generate_schematic.py "流程图" -o flow.png -v

# 通过标志提供API密钥
python scripts/generate_schematic.py "图表" -o out.png --api-key "sk-or-v1-..."

# 组合选项
python scripts/generate_schematic.py "神经网络" -o nn.png --doc-type journal --iterations 2 -v

提示工程技巧

1. 具体布局:

✓ "垂直流程的流程图，从上到下"
✓ "架构图，左侧编码器，右侧解码器"
✓ "顺时针流的圆形通路图"

2. 包含定量细节:

✓ "神经网络，输入层（784节点）、隐藏层（128节点）、输出（10节点）"
✓ "流程图显示n=500筛选、n=150排除、n=350随机化"
✓ "电路，1kΩ电阻、10µF电容、5V源"

3. 指定视觉样式:

✓ "简洁框图，干净线条"
✓ "详细生物通路，包含蛋白质结构"
✓ "技术示意图，使用工程符号"

4. 请求特定标签:

✓ "所有箭头标记激活/抑制"
✓ "每个框包含层维度"
✓ "显示时间进度，带时间戳"

5. 提及颜色要求:

✓ "使用色盲友好颜色"
✓ "灰度兼容设计"
✓ "按功能颜色编码：蓝色为输入、绿色为处理、红色为输出"

AI生成示例

示例1：CONSORT流程图

python scripts/generate_schematic.py \
  "CONSORT参与者流程图，用于随机对照试验。 \
   从顶部的'评估资格（n=500）'开始。 \
   显示'排除（n=150）'，原因：年龄<18（n=80）、拒绝（n=50）、其他（n=20）。 \
   然后'随机化（n=350）'分成两个组： \
   '治疗组（n=175）'和'对照组（n=175）'。 \
   每个组显示'失访'（n=15和n=10）。 \
   以'分析'（n=160和n=165）结束。 \
   使用蓝色框表示过程步骤、橙色表示排除、绿色表示最终分析。" \
  -o figures/consort.png

示例2：神经网络架构

python scripts/generate_schematic.py \
  "Transformer编码器-解码器架构图。 \
   左侧：编码器堆栈，包含输入嵌入、位置编码、 \
   多头自注意力、添加与归一化、前馈、添加与归一化。 \
   右侧：解码器堆栈，包含输出嵌入、位置编码、 \
   掩码自注意力、添加与归一化、交叉注意力（接收编码器输出）、 \
   添加与归一化、前馈、添加与归一化、线性与softmax。 \
   显示从编码器到解码器的交叉注意力连接，用虚线。 \
   使用浅蓝色表示编码器、浅红色表示解码器。 \
   清晰标记所有组件。" \
  -o figures/transformer.png --iterations 2

示例3：生物通路

python scripts/generate_schematic.py \
  "MAPK信号通路图。 \
   从细胞膜的EGFR受体（顶部）开始。 \
   箭头向下到RAS（带GTP标签）。 \
   箭头到RAF激酶。 \
   箭头到MEK激酶。 \
   箭头到ERK激酶。 \
   最终箭头到细胞核，显示基因转录。 \
   标记每个箭头为'磷酸化'或'激活'。 \
   使用圆角矩形表示蛋白质，每种不同颜色。 \
   顶部包含膜边界线。" \
  -o figures/mapk_pathway.png

示例4：系统架构

python scripts/generate_schematic.py \
  "物联网系统架构框图。 \
   底层：传感器（温度、湿度、运动）在绿色框中。 \
   中层：微控制器（ESP32）在蓝色框中。 \
   连接到WiFi模块（橙色框）和显示器（紫色框）。 \
   顶层：云服务器（灰色框）连接到移动应用（浅蓝色框）。 \
   显示所有组件之间的数据流箭头。 \
   标记连接为协议：I2C、UART、WiFi、HTTPS。" \
  -o figures/iot_architecture.png

命令行使用

生成科学示意图的主要入口点：

# 基本使用
python scripts/generate_schematic.py "图表描述" -o output.png

# 自定义迭代次数（最大2）
python scripts/generate_schematic.py "复杂图表" -o diagram.png --iterations 2

# 详细模式
python scripts/generate_schematic.py "图表" -o out.png -v

注意: Nano Banana Pro AI生成系统在其迭代优化过程中包含自动质量审查。每次迭代都评估科学准确性、清晰度和可访问性。

最佳实践总结

设计原则

清晰胜于复杂 - 简化，移除不必要的元素
一致样式 - 使用模板和样式文件
色盲可访问性 - 使用Okabe-Ito调色板，冗余编码
适当排版 - 无衬线字体，最小7-8 pt
矢量格式 - 始终使用PDF/SVG用于出版

技术要求

分辨率 - 首选矢量，或300+ DPI用于光栅
文件格式 - LaTeX用PDF，Web用SVG，PNG作为备选
颜色空间 - 数字用RGB，打印用CMYK（如需要转换）
线宽 - 最小0.5 pt，典型1-2 pt
文本大小 - 最终尺寸时最小7-8 pt

集成指南

在LaTeX中包含 - 使用\includegraphics{}用于生成的图像
详细标题 - 描述所有元素和缩写
在文本中引用 - 在叙述流程中解释图表
保持一致性 - 同一论文中所有图的相同样式
版本控制 - 在存储库中保留提示和生成的图像

常见问题故障排除

AI生成问题

问题: 重叠文本或元素

解决方案: AI生成自动处理间距
解决方案: 增加迭代次数：--iterations 2以更好优化

问题: 元素未正确连接

解决方案: 使您的提示更具体于连接和布局
解决方案: 增加迭代次数以更好优化

图像质量问题

问题: 导出质量差

解决方案: AI生成自动产生高质量图像
解决方案: 增加迭代次数以更好结果：--iterations 2

问题: 生成后元素重叠

解决方案: AI生成自动处理间距
解决方案: 增加迭代次数：--iterations 2以更好优化
解决方案: 使您的提示更具体于布局和间距要求

质量检查问题

问题: 错误的重叠检测

解决方案: 调整阈值：detect_overlaps(image_path, threshold=0.98)
解决方案: 手动审查视觉报告中标记的区域

问题: 生成图像质量低

解决方案: AI生成默认产生高质量图像
解决方案: 增加迭代次数以更好结果：--iterations 2

问题: 色盲模拟显示对比度差

解决方案: 显式切换到Okabe-Ito调色板
解决方案: 添加冗余编码（形状、图案、线样式）
解决方案: 增加颜色饱和度和亮度差异

问题: 检测到高严重性重叠

解决方案: 审查overlap_report.json获取确切位置
解决方案: 在那些特定区域增加间距
解决方案: 使用调整参数重新运行并再次验证

问题: 视觉报告生成失败

解决方案: 检查Pillow和matplotlib安装
解决方案: 确保图像文件可读：Image.open(path).verify()
解决方案: 检查报告生成的足够磁盘空间

可访问性问题

问题: 灰度中颜色无法区分

解决方案: 运行可访问性检查器：verify_accessibility(image_path)
解决方案: 添加图案、形状或线样式以冗余
解决方案: 增加相邻元素之间的对比度

问题: 打印时文本太小

解决方案: 运行分辨率验证器：validate_resolution(image_path)
解决方案: 在最终尺寸设计，使用最小7-8 pt字体
解决方案: 在分辨率报告中检查物理尺寸

问题: 可访问性检查持续失败

解决方案: 审查accessibility_report.json获取具体失败
解决方案: 至少增加20%颜色对比度
解决方案: 在最终确定前用实际灰度转换测试

资源和参考文献

详细参考文献

加载这些文件以获取特定主题的全面信息：

references/diagram_types.md - 科学图表类型目录，带示例
references/best_practices.md - 出版标准和可访问性指南

外部资源

Python库

Schemdraw文档: https://schemdraw.readthedocs.io/
NetworkX文档: https://networkx.org/documentation/
Matplotlib文档: https://matplotlib.org/

出版标准

Nature图指南: https://www.nature.com/nature/for-authors/final-submission
Science图指南: https://www.science.org/content/page/instructions-preparing-initial-manuscript
CONSORT图: http://www.consort-statement.org/consort-statement/flow-diagram

与其他技能集成

此技能协同工作于：

科学写作 - 图表遵循图最佳实践
科学可视化 - 共享颜色调色板和样式
LaTeX海报 - 为海报演示生成图表
研究资助 - 为提案生成方法图
同行评审 - 评估图清晰度和可访问性

快速参考检查表

提交图表前，验证：

视觉质量

[ ] 高质量图像格式（AI生成的PNG）
[ ] 无重叠元素（AI自动处理）
[ ] 所有组件之间的适当间距（AI优化）
[ ] 干净、专业对齐
[ ] 所有箭头正确连接到目标

可访问性

[ ] 使用色盲安全调色板（Okabe-Ito）
[ ] 在灰度中工作（用可访问性检查器测试）
[ ] 元素之间足够对比度（已验证）
[ ] 适当位置冗余编码（形状+颜色）
[ ] 色盲模拟通过所有检查

排版和可读性

[ ] 文本最小7-8 pt在最终尺寸
[ ] 所有元素清晰完整标记
[ ] 一致字体家族和大小
[ ] 无文本重叠或截断
[ ] 适用位置包含单位

出版标准

[ ] 与手稿中其他图一致样式
[ ] 完整标题编写，所有缩写定义
[ ] 在手稿文本中适当引用
[ ] 满足期刊特定尺寸要求
[ ] 导出为期刊所需格式（PDF/EPS/TIFF）

质量验证（必需）

[ ] 运行run_quality_checks()并达到PASS状态
[ ] 审查重叠检测报告（零高严重性重叠）
[ ] 通过可访问性验证（灰度和色盲）
[ ] 分辨率在目标DPI验证（打印300+）
[ ] 视觉质量报告生成并审查
[ ] 所有质量报告与图文件一起保存

文档和版本控制

[ ] 源文件（.tex、.py）保存以供未来修订
[ ] 质量报告存档在quality_reports/目录
[ ] 配置参数文档化（颜色、间距、大小）
[ ] Git提交包括源、输出和质量报告
[ ] README或注释解释如何重新生成图

最终集成检查

[ ] 图在编译手稿中正确显示
[ ] 交叉引用工作（\ref{}指向正确图）
[ ] 图号匹配文本引用
[ ] 标题出现在图相对于图的正确页
[ ] 无与图相关的编译警告或错误

环境设置

# 必需
export OPENROUTER_API_KEY='您的API密钥'

# 获取密钥：https://openrouter.ai/keys

入门

最简单的可能使用：

python scripts/generate_schematic.py "您的图表描述" -o output.png

使用此技能创建清晰、可访问、出版质量的图表，有效传达复杂科学概念。AI驱动的工作流与迭代优化确保图表满足专业标准。