蛋白质结合剂设计工具选择指南 binder-design

本技能提供关于如何选择和使用蛋白质结合剂设计工具的全面指南。它通过决策树和对比表格,帮助用户在 BoltzGen、BindCraft、RFdiffusion 等主流工具之间做出明智选择,并规划高效的设计流程。内容涵盖靶标准备、热点选择、设计生成、验证过滤等关键步骤,旨在优化蛋白质工程和药物发现项目。关键词:蛋白质设计,结合剂设计,AI蛋白质工程,BoltzGen,RFdiffusion,BindCraft,AlphaFold2,药物发现,生物信息学,计算生物学。

药物研发 0 次安装 0 次浏览 更新于 2/27/2026

name: binder-design description: > 用于选择合适蛋白质结合剂设计工具的指南。 在以下情况使用此技能:(1) 在 BoltzGen、BindCraft 或 RFdiffusion 之间做决定时,(2) 规划结合剂设计项目时,(3) 理解不同方法之间的权衡时,(4) 为特定靶标类型选择工具时。

关于具体工具参数,请使用各个工具技能 (boltzgen, bindcraft, rfdiffusion 等)。 license: MIT category: orchestration tags: [guidance, tool-selection, workflow]

结合剂设计工具选择

决策树

从头设计结合剂?
│
├─ 标准靶标 → BoltzGen (推荐)
│   全原子输出 (无需单独的 ProteinMPNN 步骤)
│   更适合配体/小分子结合
│   单步设计 (骨架 + 序列 + 侧链)
│
├─ 需要多样性/探索 → RFdiffusion + ProteinMPNN
│   最大骨架多样性
│   两步法:先骨架后序列
│
├─ 集成验证 → BindCraft
│   内置 AF2 验证
│   端到端流程
│
├─ 配体结合 → BoltzGen ✓
│   全原子扩散处理配体上下文
│
├─ 肽段/纳米抗体 → Germinal
│   VHH/纳米抗体设计
│   种系感知优化
│
└─ 抗体/纳米抗体
    +-- VHH 设计 --> germinal 技能

工具对比

工具 优势 劣势 最佳适用场景
BoltzGen 全原子、单步、配体感知 GPU 要求较高 标准场景 (推荐)
BindCraft 端到端、内置 AF2 验证 多样性较低 生产项目
RFdiffusion 高多样性、快速 需要 ProteinMPNN 探索、多样性
Germinal 纳米抗体/VHH 设计 专用工具 抗体优化

推荐流程:BoltzGen → Chai → QC

BoltzGen 提供全原子设计,并内置侧链包装:

靶标 → BoltzGen → 验证 → 过滤
 (pdb)  (全原子)   (chai)     (qc)

1. 靶标准备

# 从 PDB 获取结构
# 使用 pdb 技能获取指导
  • 修剪至结合区域 + 10A 缓冲区
  • 移除水分子和配体
  • 如有需要,重新编号链

2. 热点选择

  • 选择 3-6 个暴露残基
  • 优先选择带电/芳香族残基
  • 空间聚类 (在 10-15A 内)

3. 使用 BoltzGen 设计 (推荐)

首先,创建一个 YAML 配置文件 (例如,binder.yaml):

entities:
  - protein:
      id: B
      sequence: 70..100

  - file:
      path: target.cif
      include:
        - chain:
            id: A
      binding_types:
        - chain:
            id: A
            binding: 45,67,89

然后运行:

modal run modal_boltzgen.py \
  --input-yaml binder.yaml \
  --protocol protein-anything \
  --num-designs 50

为什么选择 BoltzGen?

  • 全原子输出 (无需单独的 ProteinMPNN 步骤)
  • 更适合配体/小分子结合
  • 单步设计 (骨架 + 序列 + 侧链)

4. 备选方案:RFdiffusion 流程

当需要最大多样性或偏好仅骨架设计时:

# 步骤 1: 骨架生成
modal run modal_rfdiffusion.py \
  --pdb target.pdb \
  --contigs "A1-150/0 70-100" \
  --hotspot "A45,A67,A89" \
  --num-designs 500

# 步骤 2: 序列设计
modal run modal_ligandmpnn.py \
  --pdb-path backbone.pdb \
  --num-seq-per-target 16 \
  --sampling-temp 0.1

5. 验证

modal run modal_chai1.py \
  --input-faa sequences.fasta \
  --out-dir predictions/

6. 过滤

应用标准阈值:

  • pLDDT > 0.80
  • ipTM > 0.50
  • PAE_interface < 10
  • scRMSD < 2.0 A

详情请见 protein-qc 技能。

设计数量

阶段 数量 目的
骨架生成 500-1000 多样性
每个骨架的序列 8-16 序列空间
AF2 预测 全部 验证
过滤后 50-200 候选者
实验测试 10-50 最终选择

常见错误

错误的热点

  • 使用埋藏残基
  • 热点过多 (过度约束)
  • 错误的链/残基编号

多样性不足

  • 生成的设计太少
  • ProteinMPNN 温度过低
  • 未探索多个骨架

靶标准备不佳

  • 包含整个蛋白质而非结合区域
  • 遗漏重要结构特征
  • 错误的质子化状态

时间线指南

步骤 计算时间
RFdiffusion (500 个设计) 2-4 小时
ProteinMPNN (8000 个序列) 1-2 小时
AF2 预测 (8000 个序列) 12-24 小时
过滤和分析 1-2 小时

总计:1-2 天计算时间