name: binder-design description: > 用于选择合适蛋白质结合剂设计工具的指南。 在以下情况使用此技能:(1) 在 BoltzGen、BindCraft 或 RFdiffusion 之间做决定时,(2) 规划结合剂设计项目时,(3) 理解不同方法之间的权衡时,(4) 为特定靶标类型选择工具时。
关于具体工具参数,请使用各个工具技能 (boltzgen, bindcraft, rfdiffusion 等)。 license: MIT category: orchestration tags: [guidance, tool-selection, workflow]
结合剂设计工具选择
决策树
从头设计结合剂?
│
├─ 标准靶标 → BoltzGen (推荐)
│ 全原子输出 (无需单独的 ProteinMPNN 步骤)
│ 更适合配体/小分子结合
│ 单步设计 (骨架 + 序列 + 侧链)
│
├─ 需要多样性/探索 → RFdiffusion + ProteinMPNN
│ 最大骨架多样性
│ 两步法:先骨架后序列
│
├─ 集成验证 → BindCraft
│ 内置 AF2 验证
│ 端到端流程
│
├─ 配体结合 → BoltzGen ✓
│ 全原子扩散处理配体上下文
│
├─ 肽段/纳米抗体 → Germinal
│ VHH/纳米抗体设计
│ 种系感知优化
│
└─ 抗体/纳米抗体
+-- VHH 设计 --> germinal 技能
工具对比
| 工具 | 优势 | 劣势 | 最佳适用场景 |
|---|---|---|---|
| BoltzGen | 全原子、单步、配体感知 | GPU 要求较高 | 标准场景 (推荐) |
| BindCraft | 端到端、内置 AF2 验证 | 多样性较低 | 生产项目 |
| RFdiffusion | 高多样性、快速 | 需要 ProteinMPNN | 探索、多样性 |
| Germinal | 纳米抗体/VHH 设计 | 专用工具 | 抗体优化 |
推荐流程:BoltzGen → Chai → QC
BoltzGen 提供全原子设计,并内置侧链包装:
靶标 → BoltzGen → 验证 → 过滤
(pdb) (全原子) (chai) (qc)
1. 靶标准备
# 从 PDB 获取结构
# 使用 pdb 技能获取指导
- 修剪至结合区域 + 10A 缓冲区
- 移除水分子和配体
- 如有需要,重新编号链
2. 热点选择
- 选择 3-6 个暴露残基
- 优先选择带电/芳香族残基
- 空间聚类 (在 10-15A 内)
3. 使用 BoltzGen 设计 (推荐)
首先,创建一个 YAML 配置文件 (例如,binder.yaml):
entities:
- protein:
id: B
sequence: 70..100
- file:
path: target.cif
include:
- chain:
id: A
binding_types:
- chain:
id: A
binding: 45,67,89
然后运行:
modal run modal_boltzgen.py \
--input-yaml binder.yaml \
--protocol protein-anything \
--num-designs 50
为什么选择 BoltzGen?
- 全原子输出 (无需单独的 ProteinMPNN 步骤)
- 更适合配体/小分子结合
- 单步设计 (骨架 + 序列 + 侧链)
4. 备选方案:RFdiffusion 流程
当需要最大多样性或偏好仅骨架设计时:
# 步骤 1: 骨架生成
modal run modal_rfdiffusion.py \
--pdb target.pdb \
--contigs "A1-150/0 70-100" \
--hotspot "A45,A67,A89" \
--num-designs 500
# 步骤 2: 序列设计
modal run modal_ligandmpnn.py \
--pdb-path backbone.pdb \
--num-seq-per-target 16 \
--sampling-temp 0.1
5. 验证
modal run modal_chai1.py \
--input-faa sequences.fasta \
--out-dir predictions/
6. 过滤
应用标准阈值:
- pLDDT > 0.80
- ipTM > 0.50
- PAE_interface < 10
- scRMSD < 2.0 A
详情请见 protein-qc 技能。
设计数量
| 阶段 | 数量 | 目的 |
|---|---|---|
| 骨架生成 | 500-1000 | 多样性 |
| 每个骨架的序列 | 8-16 | 序列空间 |
| AF2 预测 | 全部 | 验证 |
| 过滤后 | 50-200 | 候选者 |
| 实验测试 | 10-50 | 最终选择 |
常见错误
错误的热点
- 使用埋藏残基
- 热点过多 (过度约束)
- 错误的链/残基编号
多样性不足
- 生成的设计太少
- ProteinMPNN 温度过低
- 未探索多个骨架
靶标准备不佳
- 包含整个蛋白质而非结合区域
- 遗漏重要结构特征
- 错误的质子化状态
时间线指南
| 步骤 | 计算时间 |
|---|---|
| RFdiffusion (500 个设计) | 2-4 小时 |
| ProteinMPNN (8000 个序列) | 1-2 小时 |
| AF2 预测 (8000 个序列) | 12-24 小时 |
| 过滤和分析 | 1-2 小时 |
总计:1-2 天计算时间