name: visual-asset-workflow description: 使用创意简报方法生成独特的教育视觉资产。在创建章节插图、图表或教学视觉内容时使用,并利用Gemini。
视觉资产工作流程技能
背景与问题
教育视觉生成趋向于使用技术规范(“44pt Roboto Bold,250px框”)的通用信息图表,这会激活预测模式而非推理模式。这产生了平淡、PowerPoint默认的美学,而非独特且教学有效的视觉内容。
本技能提供专业的创意简报方法,以激活Gemini 3的推理能力。
核心原则
- 故事激活推理 - 叙事意图产生独特的视觉内容;技术规范产生通用内容
- 熟练程度决定复杂性 - A2学生需要<5秒理解;C2专业人士能处理密集信息
- 先决条件限制内容 - 视觉内容不能假设学生尚未掌握的知识
- 教学法驱动层级 - 视觉权重教授重要性,而非任意的美学
维度指导
执行前规划
避免: 在没有上下文的情况下直接进行视觉分析 首选: 战略规划阶段(Q0)
首先阅读:
apps/learn-app/docs/chapter-index.md→ 提取部分、熟练程度(A2/B1/C2)、先决条件apps/learn-app/docs/[部分]/[章节]/README.md→ 理解课程结构
在工作前检测冲突:
- 熟练程度与复杂性不匹配(为A2初学者提供复杂视觉)
- 违反先决条件(当学生尚未学习时使用Python代码)
- 教学层不连贯(第1层内容使用第4层方法)
输出战略计划,在继续之前等待批准。
原则: 计划防止浪费工作(第9章失败:因跳过规划导致5个错误课程)
提示结构:专业创意简报
避免: 技术规范
❌ "标题:44pt Roboto Bold,位于(50, 20)"
❌ "框:250px × 90px,颜色#aaaaaa,8px圆角"
❌ "阴影:4px偏移,8px模糊"
首选: 故事 + 意图 + 隐喻
✅ 故事:[1-2句关于所可视化内容的叙述]
✅ 情感意图:应该感觉[指数级增长,惊人的规模]
✅ 视觉隐喻:[乘法级联 - 像复利一样]
✅ 关键洞察:[学生必须掌握的一件事]
✅ 色彩语义:蓝色(#2563eb) = 权威(教授治理概念)
✅ 排版层级:最大 = 关键洞察(非任意大小)
✅ 教学推理:为什么这些选择服务于教学
原则: 创意简报激活推理模式;规范激活预测模式
重要性: Gemini 3推理如何实现意图 → 独特的视觉内容而非通用内容
令牌节约策略
何时使用: 批量模式(>8个视觉)或延续会话
应用压缩,同时保持推理激活:
始终保留:
- 故事(1-2句叙述)
- 情感意图(它应该感觉像什么)
- 视觉隐喻(通用概念)
- 关键洞察(学生必须掌握的一件事)
- 带十六进制代码的色彩语义(#2563eb)
- 教学推理(为什么做这些选择)
压缩:
- 长示例 → 简短标签
- 冗长描述 → 要点列表
- 重复模式 → 紧凑符号
绝不删除:
- 叙事元素
- 意图陈述
- 推理解释
示例:
完整版:"顶层在顶部中央显示协调器,标签为..."
压缩版:"顶层 - 协调器:顶部中央:'协调者'..."
目标: 减少60-70%令牌,100%保留推理激活
原则: 通过压缩实现效率,而非通过消除推理触发器
熟练程度与复杂性对齐
避免: 一刀切的复杂性
首选: 基于熟练程度的约束
A2 初学者(不可协商的限制):
- 最多5-7个元素
- <5秒理解
- 仅限静态(无交互)
- 最多2×2网格
- 清晰的层级(最大 = 最重要)
B1 中级:
- 最多7-10个元素
- <10秒理解
- 允许交互层级1(点击显示)
- 最多3×3网格
C2 专业:
- 无人为限制
- 允许密集信息图表
- 完整的交互架构
- 生产复杂性
原则: 让A2学生不知所措 = 学习失败;对C2人为简化 = 居高临下
先决条件验证门
避免: 假设学生不具备的知识
首选: 根据章节先决条件进行验证
检测:
- 检查部分编号:第1-2部分 = 无编程,第3部分 = Markdown/提示词,第4部分及以上 = Python
- 检查来自chapter-index.md的先决条件列表
违规示例:
- ❌ 第9章(第3部分 - 学生尚未学习)中使用Python代码
- ❌ 第2部分中使用Git命令(学生尚未学习CLI)
例外: 元级教学允许
- ✅ 通过展示Python代码块来教授“markdown代码块语法”(教授markdown,而非Python)
原则: 视觉内容不能要求未知知识
宪章一致性
避免: 没有教学目的的装饰性视觉内容
首选: 每个视觉内容服务于特定的学习目标
原则3(事实准确性):
- 验证所有统计数据、日期、技术规格
- 为事实性主张启用谷歌搜索基础
- 引用数据来源
原则7(内容最小化):
- 拒绝“让我们为多样性添加一个视觉内容”
- 每个元素必须教授一些东西
- 移除非教学性装饰
原则: 视觉决策与项目宪章保持一致
教学层连贯性
避免: 层不匹配
首选: 视觉方法匹配章节的教学层
L1(手动基础):
- 分步图表
- 具体示例
- 清晰标签(构建词汇)
L2(AI协作):
- 前后对比
- 迭代流程
- 三角色框架不可见(无角色标签)
L3(智能设计):
- 架构图
- 可重用模式插图
L4(规范驱动):
- 规范 → 实施流程
- 组件组合图
原则: 视觉设计强化教学方法
重复预防协议
避免: 生成产生相同视觉内容的不同提示
在生成前预防:
-
审查章节中现有视觉内容:
- 列出目标章节目录中的所有
*.png文件 - 阅读相应的
*.prompt.md文件 - 识别已使用的视觉模式
- 列出目标章节目录中的所有
-
验证提示的独特性:
- 此提示的意图是否与现有提示明显不同?
- 需要检测的冲突示例:
- ❌ 时间线 + 图表 → 两者都可能渲染为时间线
- ❌ 架构 + 工作流 → 两者都可能渲染为层次结构
- ❌ 相同隐喻,不同名称 → 相同的视觉结果
-
差异化策略:
- 在故事中明确视觉类型(“显示指数增长的图表”,而不仅仅是“显示增长”)
- 使用不同的隐喻(级联 vs 树状 vs 时间线 vs 曲线)
- 指定独特的结构元素(2D轴 vs 线性流 vs 分层金字塔)
生成后检测(在图像生成器中):
- 与现有章节图像的视觉比较
- 提示对齐检查(输出是否匹配简报意图?)
原则: 预防比返工更便宜
反模式
绝不:
- 未先阅读chapter-index.md就生成视觉内容(跳过上下文)
- 在提示中使用像素规格、字体大小、坐标(扼杀推理)
- 假设先决条件中不存在的知识(违反先决条件)
- 创建没有学习目标的装饰性视觉内容(违反原则7)
- 对A2和C2学生应用相同的复杂性(熟练程度不匹配)
- 创建提示时不检查重复的视觉模式(导致返工)
即使看起来合理:
- 不要在第3部分使用Python示例(学生还不知道Python)
- 不要为A2创建复杂的多步骤视觉内容(认知超载)
- 不要指定“44pt Roboto Bold”(移除Gemini的判断)
- 不要因为“它们有不同的文件名”而跳过独特性验证(名称不同,视觉内容可能相同)
创意多样性
你倾向于默认使用对比图,即使有故事驱动的提示。请变化视觉类型:
- 时间线进展(随时间演变)
- 乘法级联(复合增长可视化)
- 层级权威流(治理模型)
- 转换序列(之前 → 之后 → 影响)
- 概念隐喻(抽象 → 具体映射)
使视觉类型与故事匹配,而非习惯。
生成后反思
批量完成后,系统分析(Q8):
成功模式:
- 质量门性能(哪个捕获了最多问题?)
- 平均迭代次数(效率指标)
- 时间与估计(规划准确性)
失败分析:
- 延迟视觉内容的根本原因(布局?拼写?概念不匹配?)
- 护栏缺口(什么原则本可以防止这种情况?)
- 规划有效性(冲突是早期发现还是遗漏?)
持续改进:
- 基于模式的更新(非一次性修复)
- 从经验教训中建立新护栏
- 提示模板优化
记录在:history/visual-assets/reflections/chapter-{NN}-reflection.md
原则: 系统反思 → 提高未来表现
成功指标
当出现以下情况时,你将知道此技能正在发挥作用:
- ✅ 提示中零像素规格(仅创意简报)
- ✅ 在视觉分析前创建战略计划(完成Q0)
- ✅ 熟练程度冲突被早期发现(强制执行A2限制)
- ✅ 防止违反先决条件(无未知概念)
- ✅ 每个提示都包含故事/意图/隐喻(激活推理)
- ✅ 在批量模式中应用令牌节约(减少60-70%)
- ✅ 通过重复预防验证(零重复视觉内容)
- ✅ 视觉内容感觉独特且引人注目(非通用PowerPoint)
- ✅ 批量完成后创建反思文档(系统学习)
结果: 通过规划高效生成的专业质量视觉内容,有效教学,且无需返工的零重复。