name: binder-design description: > 用于选择合适蛋白质结合剂设计工具的指南。在以下情况使用此技能：(1) 在 BoltzGen、BindCraft 或 RFdiffusion 之间做决定时，(2) 规划结合剂设计项目时，(3) 理解不同方法之间的权衡时，(4) 为特定靶标类型选择工具时。

关于具体工具参数，请使用各个工具技能 (boltzgen, bindcraft, rfdiffusion 等)。 license: MIT category: orchestration tags: [guidance, tool-selection, workflow]

结合剂设计工具选择

决策树

从头设计结合剂？
│
├─ 标准靶标 → BoltzGen (推荐)
│   全原子输出 (无需单独的 ProteinMPNN 步骤)
│   更适合配体/小分子结合
│   单步设计 (骨架 + 序列 + 侧链)
│
├─ 需要多样性/探索 → RFdiffusion + ProteinMPNN
│   最大骨架多样性
│   两步法：先骨架后序列
│
├─ 集成验证 → BindCraft
│   内置 AF2 验证
│   端到端流程
│
├─ 配体结合 → BoltzGen ✓
│   全原子扩散处理配体上下文
│
├─ 肽段/纳米抗体 → Germinal
│   VHH/纳米抗体设计
│   种系感知优化
│
└─ 抗体/纳米抗体
    +-- VHH 设计 --> germinal 技能

工具对比

工具	优势	劣势	最佳适用场景
BoltzGen	全原子、单步、配体感知	GPU 要求较高	标准场景 (推荐)
BindCraft	端到端、内置 AF2 验证	多样性较低	生产项目
RFdiffusion	高多样性、快速	需要 ProteinMPNN	探索、多样性
Germinal	纳米抗体/VHH 设计	专用工具	抗体优化

推荐流程：BoltzGen → Chai → QC

BoltzGen 提供全原子设计，并内置侧链包装：

靶标 → BoltzGen → 验证 → 过滤
 (pdb)  (全原子)   (chai)     (qc)

1. 靶标准备

# 从 PDB 获取结构
# 使用 pdb 技能获取指导

修剪至结合区域 + 10A 缓冲区
移除水分子和配体
如有需要，重新编号链

2. 热点选择

选择 3-6 个暴露残基
优先选择带电/芳香族残基
空间聚类 (在 10-15A 内)

3. 使用 BoltzGen 设计 (推荐)

首先，创建一个 YAML 配置文件 (例如，binder.yaml)：

entities:
  - protein:
      id: B
      sequence: 70..100

  - file:
      path: target.cif
      include:
        - chain:
            id: A
      binding_types:
        - chain:
            id: A
            binding: 45,67,89

然后运行：

modal run modal_boltzgen.py \
  --input-yaml binder.yaml \
  --protocol protein-anything \
  --num-designs 50

为什么选择 BoltzGen？

全原子输出 (无需单独的 ProteinMPNN 步骤)
更适合配体/小分子结合
单步设计 (骨架 + 序列 + 侧链)

4. 备选方案：RFdiffusion 流程

当需要最大多样性或偏好仅骨架设计时：

# 步骤 1: 骨架生成
modal run modal_rfdiffusion.py \
  --pdb target.pdb \
  --contigs "A1-150/0 70-100" \
  --hotspot "A45,A67,A89" \
  --num-designs 500

# 步骤 2: 序列设计
modal run modal_ligandmpnn.py \
  --pdb-path backbone.pdb \
  --num-seq-per-target 16 \
  --sampling-temp 0.1

5. 验证

modal run modal_chai1.py \
  --input-faa sequences.fasta \
  --out-dir predictions/

6. 过滤

应用标准阈值：

pLDDT > 0.80
ipTM > 0.50
PAE_interface < 10
scRMSD < 2.0 A

详情请见 protein-qc 技能。

设计数量

阶段	数量	目的
骨架生成	500-1000	多样性
每个骨架的序列	8-16	序列空间
AF2 预测	全部	验证
过滤后	50-200	候选者
实验测试	10-50	最终选择

常见错误

错误的热点

使用埋藏残基
热点过多 (过度约束)
错误的链/残基编号

多样性不足

生成的设计太少
ProteinMPNN 温度过低
未探索多个骨架

靶标准备不佳

包含整个蛋白质而非结合区域
遗漏重要结构特征
错误的质子化状态

时间线指南

步骤	计算时间
RFdiffusion (500 个设计)	2-4 小时
ProteinMPNN (8000 个序列)	1-2 小时
AF2 预测 (8000 个序列)	12-24 小时
过滤和分析	1-2 小时

总计：1-2 天计算时间