Nature｜“剪刀定制”新时代：用机器学习精准设计PAM特异性Cas9酶

传统CRISPR-Cas9被誉为“基因剪刀”，但你是否曾思考：剪刀选在哪里“剪”，对编辑的效率和安全性影响有多大？

2025年4月22日，Benjamin P. Kleinstiver团队在Nature发表论文：Custom CRISPR—Cas9 PAM variants via scalable engineering and machine learning。他们开发出一套集饱和突变、机器学习与进化模拟于一体的系统性平台，成功构建出一个“PAM定制”的Cas9酶库，为精准基因编辑开辟全新路径。

一、背景回顾：PAM限制了Cas9的“用武之地”

Cas9酶识别目标DNA的前提是其旁边存在一个“protospacer adjacent motif”（PAM）序列。以最常用的SpCas9为例，其只能识别NGG序列，这限制了其靶点选择范围。为扩展Cas9应用场景，科研人员开发了许多“PAM-relaxed”变体，如SpG和SpRY，使其能识别更广泛的PAM序列。但广谱识别的代价是脱靶风险显著上升。

该文献的核心思路是：与其做“泛用型”Cas9，不如做“定制型”Cas9，即让每一个Cas9变体精准识别一个特定PAM，从而提升编辑效率并显著降低脱靶效应。

二、研究亮点一：从饱和突变出发，探索64百万种PAM组合空间

作者通过结构分析与前人研究，选取了SpCas9 PAM结合域（PI domain）中6个关键氨基酸位点，构建了一个6位点饱和突变文库，理论上可产生高达64,000,000种酶变体。随后，他们通过细菌选择体系筛选出634个活性良好的变体，并借助高通量PAM活性测定法（HT-PAMDA）构建出PAM识别谱。

但实验筛选只触及了变体宇宙的冰山一角，接下来的主角——机器学习，正式登场。

三、研究亮点二：PAMmla——用神经网络解码“氨基酸序列→PAM特异性”映射

研究者将实验数据训练进神经网络模型PAMmla，成功实现了从氨基酸序列预测PAM识别谱的能力，预测准确度达到Pearson’s r=0.91。同时，PAMmla还能区分活性与非活性酶（AUROC=0.99），并对未见过的酶具备良好的泛化能力。

他们进一步利用PAMmla对64M种变体进行in silico预测筛选，选出活性最高且PAM选择性最强的Cas9变体，并在体内外验证其强大的定向编辑能力。

四、研究亮点三：打破进化瓶颈，实现等位基因特异性编辑

PAMmla不仅能做预测，还能用于“进化”。团队开发了一种计算机辅助定向进化算法（ISDE），从SpCas9出发，进化出能仅识别P23H突变等位基因（NGTG PAM）而不识别WT（NGGG PAM）的Cas9变体MRRWMR和KRHWMR，并在细胞与小鼠视网膜中成功实现等位基因特异性敲除，优于现有的SpG或SpRY工具。

这代表着一个关键能力的实现：在人类疾病模型中实现精准的“突变等位基因靶向治疗”。

五、科研启示：AI×蛋白工程=Cas9定制时代的开启

这项研究的意义远超“找到了几种新酶”：

概念升维：从“PAM扩展”转向“PAM定制”，强调特异性而非通用性；

方法升维：融合高通量实验与深度学习，用PAMmla预测+筛选+进化，效率远胜传统定向进化；

工具升维：从一把“通用剪刀”升级为“定制剪刀”，能适应不同疾病、不同位点的精准需求；

平台升维：PAMmla网页工具现已公开，任何研究者可输入序列获取定制Cas9建议

https://pammla.streamlit.app/

六、总结：精准基因编辑的未来

Cas酶的进化不再局限于自然选择或人工突变，而是进入了人工智能辅助设计的定量时代。这篇论文为我们提供了一整套“如何系统性设计精准、高效、安全Cas酶”的范式，不仅对基础研究具有巨大推动力，也为临床治疗带来了希望。

文章链接：

https://www.nature.com/articles/s41586-025-09021-y

本文转自【胡纯一实验室 Hu lab】公众号

--------- End ---------

感兴趣的读者，可以添加小邦微信加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位或姓名-学校-职务/研究方向。