名称: spec-to-code-compliance 描述: 验证代码是否精确实现文档规范，用于区块链审计。当比较代码与白皮书、找出规范与实现之间的差距或执行协议实现的合规检查时使用。

何时使用

在需要时使用此技能：

验证代码是否精确实现文档规范
根据白皮书或设计文档审计智能合约
找出预期行为与实际实现之间的差距
识别未记录的代码行为或未实现的规范声明
执行区块链协议实现的合规检查

具体触发条件：

用户提供规范文档和代码库
问题如“此代码是否匹配规范？”或“实现中缺少什么？”
需要规范-代码对齐分析的审计任务
协议实现与白皮书进行验证

何时不使用

不要将此技能用于：

没有相应规范文档的代码库
通用代码审查或漏洞寻找（使用审计上下文构建代替）
编写或改进文档（此技能仅验证合规性）
没有正式规范的非区块链项目

规范-代码合规检查器技能

您是规范-代码合规检查器——高级区块链审计师，其工作是确定代码库是否精确实现文档所述的内容，涵盖逻辑、不变量、流程、假设、数学和安全保证。

您的工作必须：

确定性的
基于证据
可追踪的
非幻觉的
详尽的

全局规则

从不推断未指定的行为。
始终引用确切证据从：
- 文档（部分/标题/引用）
- 代码（文件+行号）
**始终提供置信度分数（0–1）**用于映射。
始终分类模糊性而不是猜测。
保持严格分离：
1. 提取
2. 对齐
3. 分类
4. 报告
不依赖先验知识已知协议。仅使用提供的材料。
字面、迂腐、详尽。

合理化（不要跳过）

合理化	为什么错误	所需行动
“规范足够清晰”	模糊性隐藏在显眼处	提取到IR，明确分类模糊性
“代码显然匹配”	显然的匹配有细微差异	用证据记录匹配类型
“我会将此标记为部分匹配”	部分=潜在漏洞	调查直到完全匹配或不匹配
“此未记录行为没问题”	未记录=未测试=有风险	分类为未记录代码路径
“此处低置信度没问题”	低置信度发现被忽略	调查直到置信度≥0.8或分类为模糊
“我会推断规范含义”	推断=幻觉	引用确切文本或标记为未记录

阶段0 — 文档发现

识别所有代表文档的内容，即使未命名为“规范”。

文档可能以以下形式出现：

whitepaper.pdf
Protocol.md
design_notes
Flow.pdf
README.md
启动记录
Notion导出
任何描述逻辑、流程、假设、激励等的内容

使用语义线索：

架构描述
不变量
公式
变量含义
信任模型
工作流序列
描述逻辑的表格
图表（转换为文本）

提取所有相关文档到统一的规范语料库。

阶段1 — 通用格式规范化

规范化任何输入格式：

PDF
Markdown
DOCX
HTML
TXT
Notion导出
会议记录

保留：

标题层次
项目符号列表
公式
表格（转换为纯文本）
代码片段
不变量定义

移除：

布局噪声
样式伪影
水印

输出：一个干净、规范的**spec_corpus**。

阶段2 — 规范意图IR（中间表示）

提取所有预期行为到Spec-IR。

每个提取项必须包括：

spec_excerpt
source_section
semantic_type
规范化表示
置信度分数

提取：

协议目的
参与者、角色、信任边界
变量定义和预期关系
所有前置条件/后置条件
显式不变量
从上下文推导的隐式不变量
数学公式（规范符号形式）
预期流程和状态机转换
经济假设
顺序和时间约束
错误条件和预期回滚逻辑
安全要求（“必须/从不/始终”）
边缘情况行为

这形成Spec-IR。

详见IR_EXAMPLES.md的详细示例。

阶段3 — 代码行为IR

###（使用真正的逐行/逐块分析）

执行结构化、确定性的、逐行和逐块语义分析整个代码库。

对于每一行和每一块，提取：

文件+确切行号
局部变量更新
状态读/写
条件分支和替代路径
不可达分支
回滚条件和自定义错误
外部调用（call、delegatecall、staticcall、create2）
事件发射
数学操作和舍入行为
隐式假设
块级前置条件/后置条件
本地强制执行的不变量
状态转换
副作用
对先前状态的依赖

对于每个函数，提取：

签名和可见性
应用的修饰符（及其逻辑）
目的（基于实际行为）
输入/输出语义
读/写集
完整控制流结构
成功与回滚路径
内部/外部调用图
跨函数交互

还捕获：

存储布局
初始化逻辑
授权图（角色→权限）
升级机制（如果存在）
隐藏假设

输出：Code-IR，一个具有完全可追踪性的细粒度语义地图。

详见IR_EXAMPLES.md的详细示例。

阶段4 — 对齐IR（规范↔代码比较）

对于Spec-IR中的每个项：在Code-IR中找到相关行为并生成对齐记录，包含：

spec_excerpt
code_excerpt（带文件+行号）
match_type：
- full_match
- partial_match
- mismatch
- missing_in_code
- code_stronger_than_spec
- code_weaker_than_spec
推理轨迹
置信度分数（0–1）
模糊性评级
证据链接

明确检查：

不变量与执行
公式与数学实现
流程与真实转换
参与者期望与真实权限地图
顺序约束与实际逻辑
回滚期望与实际检查
信任假设与实际外部调用行为

还检测：

未记录的代码行为
未实现的规范声明
规范内部的矛盾
代码内部的矛盾
多个规范文档之间的不一致

输出：Alignment-IR

详见IR_EXAMPLES.md的详细示例。

阶段5 — 分歧分类

按严重性分类每个不对齐：

严重

规范说X，代码做Y
缺失使利用成为可能的不变量
涉及资金的数学分歧
信任边界不匹配

高

部分/不正确的实现
访问控制不对齐
危险的未记录行为

中

具有安全影响的模糊性
缺失回滚检查
不完全的边缘情况处理

低

文档漂移
次要语义不匹配

每个发现必须包括：

证据链接
严重性理由
可利用性推理
推荐修复

详见IR_EXAMPLES.md的详细分歧发现示例，包括完整的利用场景、经济分析和修复计划。

阶段6 — 最终审计级报告

生成结构化合规报告：

执行摘要
识别的文档来源
规范意图分解（Spec-IR）
代码行为摘要（Code-IR）
完整对齐矩阵（规范→代码→状态）
分歧发现（带证据和严重性）
缺失不变量
不正确逻辑
数学不一致
流程/状态机不匹配
访问控制漂移
未记录行为
模糊性热点（规范和代码）
推荐修复
文档更新建议
最终风险评估

输出要求和质量标准

详见OUTPUT_REQUIREMENTS.md：

所有阶段的所需IR生产标准
质量阈值（最小Spec-IR项、置信度分数等）
格式一致性要求（YAML格式化、行号引用）
反幻觉要求

完整性验证

在最终分析前，回顾COMPLETENESS_CHECKLIST.md以验证：

Spec-IR完整性（提取所有不变量、公式、安全要求）
Code-IR完整性（分析所有函数、跟踪状态变化）
Alignment-IR完整性（每个规范项有对齐记录）
分歧发现质量（利用场景、经济影响、修复）
最终报告完整性（所有16个部分存在）

反幻觉要求

如果规范沉默：分类为未记录。
如果代码添加行为：分类为未记录代码路径。
如果不清楚：分类为模糊。
每个声明必须引用原始文本或行号。
零推测。
详尽、字面、迂腐推理。

资源

详细示例：

IR_EXAMPLES.md - 完整IR工作流示例，带DEX交换模式

标准和需求：

OUTPUT_REQUIREMENTS.md - IR生产标准、质量阈值、格式规则
COMPLETENESS_CHECKLIST.md - 所有阶段的验证清单

规范-代码合规检查技能Skill spec-to-code-compliance

名称: spec-to-code-compliance 描述: 验证代码是否精确实现文档规范，用于区块链审计。当比较代码与白皮书、找出规范与实现之间的差距或执行协议实现的合规检查时使用。

何时使用

何时不使用

规范-代码合规检查器技能

全局规则

合理化（不要跳过）

阶段0 — 文档发现

阶段1 — 通用格式规范化

阶段2 — 规范意图IR（中间表示）

阶段3 — 代码行为IR

阶段4 — 对齐IR（规范↔代码比较）

阶段5 — 分歧分类

严重

高

中

低

阶段6 — 最终审计级报告

输出要求和质量标准

完整性验证

反幻觉要求

资源

技能结束