名称: 无细胞蛋白表达
描述: >
无细胞蛋白合成(CFPS)优化指南。适用于:
(1) 规划CFPS实验,
(2) 排查低产量或聚集问题,
(3) 为CFPS优化DNA模板设计,
(4) 表达困难蛋白(富含二硫键、毒性、膜蛋白)。
许可证: MIT
类别: 实验性
标签: [表达, cfps, 验证]
无细胞蛋白合成 (CFPS)
系统选择指南
| 系统 |
最适合 |
产量 |
翻译后修饰 |
二硫键 |
成本 |
| 大肠杆菌提取物 |
快速原型、原核蛋白 |
高 (100-400 μg/mL) |
无 |
差(还原环境) |
低 |
| 大肠杆菌 PURE |
条件明确、非天然氨基酸 |
中等 (50-150 μg/mL) |
无 |
可控 |
高 |
| 小麦胚芽 |
真核蛋白、膜蛋白 |
高 (100-500 μg/mL) |
有限 |
中等 |
中等 |
| 兔网织红细胞 |
哺乳动物蛋白、翻译后研究 |
低 (10-50 μg/mL) |
部分 |
差 |
高 |
| 昆虫 (Sf21) |
糖蛋白、复杂折叠 |
中等 (50-100 μg/mL) |
糖基化 |
好 |
高 |
| HeLa/CHO |
天然哺乳动物蛋白 |
低 (10-50 μg/mL) |
完整哺乳动物修饰 |
好 |
非常高 |
CFPS 问题排查矩阵
| 问题 |
可能原因 |
设计修复 |
试剂修复 |
| 无表达 |
N端稀有密码子、RBS差 |
优化前30个密码子 |
使用BL21-CodonPlus提取物 |
| 产量低 |
mRNA二级结构强、模板问题 |
优化5’ UTR (ΔG > -5 kcal/mol) |
增加Mg²⁺ (10-18 mM)、ATP |
| 聚集 |
疏水蛋白、翻译过快 |
添加可溶性标签 (MBP, SUMO) |
添加0.1% Tween-20、分子伴侣 |
| 蛋白失活 |
错误折叠、缺少辅因子 |
减慢翻译速度(使用稀有密码子!) |
添加GroEL/ES、DnaK/J |
| 截断 |
稀有密码子簇、mRNA不稳定 |
移除AGG/AGA/CUA簇 |
补充稀有tRNA |
| 降解 |
蛋白酶解 |
N端Met-Ala |
添加蛋白酶抑制剂 |
CFPS 密码子优化
大肠杆菌CFPS中应避免的密码子
| 密码子 |
氨基酸 |
问题 |
tRNA丰度 |
| AGG |
Arg |
非常稀有,易停滞 |
0.2% |
| AGA |
Arg |
非常稀有,易停滞 |
0.4% |
| CUA |
Leu |
丰度低 |
0.4% |
| AUA |
Ile |
稀有 |
0.5% |
| CGA |
Arg |
解码效率低 |
0.6% |
| CCC |
Pro |
可能导致暂停 |
0.5% |
| GGA |
Gly |
中等 |
1.1% |
设计规则
- 前30个密码子:最关键 - 仅使用高频密码子
- 稀有密码子簇:避免10个核苷酸内出现2个以上稀有密码子
- 稀有密码子含量:保持整体<5%的编码序列
- GC含量:目标40-60%以获得平衡表达
- 避免重复序列:无>6个连续的G或C残基(二级结构)
- 策略性慢速密码子:在结构域之间放置稀有密码子(有助于折叠!)
何时使用稀有密码子
- 结构域边界(允许共翻译折叠)
- 复杂结构元件之前
- 当蛋白易于错误折叠时
mRNA模板设计
5’ UTR优化
| 元件 |
最优设计 |
影响 |
| RBS (SD序列) |
AGGAGG,距起始位点7-9 nt |
核糖体结合 |
| 间距 |
SD与AUG之间7 nt |
翻译起始 |
| 二级结构 |
ΔG > -5 kcal/mol |
可及性 |
| 上游AUG |
避免(导致错误起始) |
减少截断 |
二级结构目标
| 区域 |
理想ΔG |
影响 |
| AUG周围-30到+30 |
> -5 kcal/mol |
翻译起始 |
| 完整5’ UTR |
> -10 kcal/mol |
核糖体加载 |
| RBS可及性 |
未配对 |
关键 |
模板格式
| 格式 |
优点 |
缺点 |
| 质粒 |
稳定、产量高 |
需要克隆 |
| 线性PCR产物 |
快速、无需克隆 |
可能需要稳定化 |
| mRNA |
直接翻译 |
不稳定、昂贵 |
二硫键形成
系统能力
| 系统 |
天然二硫键支持 |
所需添加剂 |
| 标准大肠杆菌提取物 |
差(存在DTT) |
IAM、PDI、GSSG/GSH |
| 氧化型大肠杆菌提取物 |
好 |
预氧化谷胱甘肽 |
| 小麦胚芽 |
中等 |
降低DTT、添加PDI |
| PURE系统 |
极少 |
完整氧化系统 |
| 昆虫/哺乳动物 |
好 |
微粒体膜 |
氧化折叠方案(大肠杆菌提取物)
1. 从提取物中去除DTT(透析或用5 mM IAM处理)
2. 添加氧化/还原型谷胱甘肽:4 mM GSSG,1 mM GSH(4:1比例)
3. 添加10 μM PDI(蛋白二硫键异构酶)
4. 可选:添加5 μM DsbC(二硫键异构酶)
5. 在25°C(非37°C)表达以获得更好折叠
6. 孵育时间:4-6小时
富含二硫键蛋白提示
- 从小麦胚芽或氧化型提取物开始
- 使用PURE系统进行精确控制
- 考虑共表达PDI/DsbC
- 通过非还原SDS-PAGE验证
从序列预测表达
| 特征 |
好 |
一般 |
差 |
| 稀有密码子含量 |
<3% |
3-8% |
>10% |
| 前30个密码子稀有 |
0 |
1-2 |
>2 |
| GC含量 |
45-55% |
35-45% 或 55-65% |
<30% 或 >70% |
| 5’ UTR ΔG |
> -3 kcal/mol |
-3 到 -8 |
< -10 kcal/mol |
| 疏水连续序列 |
<5个连续 |
5-7 |
>8个连续 |
| N端残基 |
Met-Ala, Met-Ser, Met-Gly |
Met-Val, Met-Thr |
Met-Arg, Met-Lys |
| 半胱氨酸对 |
成对(偶数) |
混合 |
奇数(游离巯基) |
可溶性增强策略
融合标签(按有效性排序)
| 标签 |
大小 |
可溶性增强 |
切割 |
备注 |
| MBP |
40 kDa |
极佳 |
TEV, Factor Xa |
总体最佳 |
| SUMO |
11 kDa |
非常好 |
SUMO蛋白酶 |
切割后获得天然N端 |
| NusA |
55 kDa |
极佳 |
- |
尺寸大 |
| Trx |
12 kDa |
好 |
肠激酶 |
用于二硫键蛋白 |
| GST |
26 kDa |
中等 |
- |
二聚体 |
| His₆ |
1 kDa |
极小 |
- |
主要用于纯化 |
提高可溶性的缓冲液添加剂
| 添加剂 |
浓度 |
机制 |
| 海藻糖 |
50-100 mM |
化学分子伴侣 |
| 甘油 |
5-10% |
减少疏水聚集 |
| L-精氨酸 |
50-100 mM |
抑制聚集 |
| Tween-20 |
0.05-0.1% |
防止表面吸附 |
| 脯氨酸 |
50 mM |
渗透压稳定剂 |
分子伴侣补充
| 分子伴侣系统 |
目标问题 |
浓度 |
| GroEL/GroES |
一般折叠 |
1-2 μM |
| DnaK/DnaJ/GrpE |
易聚集蛋白 |
各1 μM |
| Trigger Factor |
新生链 |
1-2 μM |
| ClpB |
聚集物再溶解 |
0.5 μM |
温度优化
| 温度 |
使用场景 |
权衡 |
| 37°C |
快速表达、稳定蛋白 |
聚集风险更高 |
| 30°C |
平衡(默认) |
良好折中 |
| 25°C |
二硫键蛋白、复杂折叠 |
较慢、折叠更好 |
| 18-20°C |
易聚集蛋白 |
非常慢、最佳折叠 |
| 16°C |
冷休克蛋白 |
极慢、专用 |
大肠杆菌提取物制备(关键变量)
| 变量 |
影响 |
最佳范围 |
| 收获时细胞密度 |
核糖体含量 |
OD₆₀₀ 2.5-3.5 |
| 裂解方法 |
提取物活性 |
超声、珠磨 |
| Run-off反应 |
去除内源mRNA |
37°C 20-80分钟 |
| Mg²⁺浓度 |
翻译保真度 |
10-18 mM |
| K⁺浓度 |
翻译速率 |
150-200 mM |
| 能量系统 |
持续合成 |
ATP/GTP、磷酸肌酸 |
PURE系统详情
优点
- 成分明确(无蛋白酶/核酸酶)
- 线性DNA模板效果好
- 非天然氨基酸掺入
- 批次间可重复
局限性
- 无分子伴侣(需单独添加)
- 无翻译后修饰
- 产量低于粗提物
- 成本更高
何时使用PURE
- 非天然氨基酸掺入
- 研究翻译机制
- 需要“干净”蛋白
- 蛋白酶敏感靶标
- 线性模板表达
常见假象及解决方案
低分子量条带
原因:提前终止、蛋白酶解、内部起始
解决方案:
- 优化稀有密码子簇
- 添加蛋白酶抑制剂
- 检查内部AUG密码子
- 使用PURE系统
高分子量条带
原因:终止不完全、通读、聚集
解决方案:
- 确保强终止密码子(首选UAA)
- 检查模板3’端
- 添加释放因子(RF1/RF2)
- 降低蛋白浓度
无可溶性蛋白
原因:合成过程中聚集
解决方案:
- 降低温度(25°C → 18°C)
- 添加分子伴侣
- 使用可溶性标签
- 优化翻译速率
参考文献
CFPS概述
提取物制备
PURE系统
小麦胚芽
密码子优化
二硫键形成
可溶性标签
温度效应