Py学习  »  机器学习算法

Nature|“剪刀定制”新时代:用机器学习精准设计PAM特异性Cas9酶

智药邦 • 2 月前 • 95 次点击  

传统CRISPR-Cas9被誉为“基因剪刀”,但你是否曾思考:剪刀选在哪里“剪”,对编辑的效率和安全性影响有多大?

2025年4月22日,Benjamin P. Kleinstiver团队在Nature发表论文:Custom CRISPR—Cas9 PAM variants via scalable engineering and machine learning。他们开发出一套集饱和突变、机器学习与进化模拟于一体的系统性平台,成功构建出一个“PAM定制”的Cas9酶库,为精准基因编辑开辟全新路径

一、背景回顾:PAM限制了Cas9的“用武之地”

Cas9酶识别目标DNA的前提是其旁边存在一个“protospacer adjacent motif”(PAM)序列。以最常用的SpCas9为例,其只能识别NGG序列,这限制了其靶点选择范围。为扩展Cas9应用场景,科研人员开发了许多“PAM-relaxed”变体,如SpG和SpRY,使其能识别更广泛的PAM序列。但广谱识别的代价是脱靶风险显著上升。

该文献的核心思路是:与其做“泛用型”Cas9,不如做“定制型”Cas9,即让每一个Cas9变体精准识别一个特定PAM,从而提升编辑效率并显著降低脱靶效应。

二、研究亮点一:从饱和突变出发,探索64百万种PAM组合空间

作者通过结构分析与前人研究,选取了SpCas9 PAM结合域(PI domain)中6个关键氨基酸位点,构建了一个6位点饱和突变文库,理论上可产生高达64,000,000种酶变体。随后,他们通过细菌选择体系筛选出634个活性良好的变体,并借助高通量PAM活性测定法(HT-PAMDA)构建出PAM识别谱。

但实验筛选只触及了变体宇宙的冰山一角,接下来的主角——机器学习,正式登场。

三、研究亮点二:PAMmla——用神经网络解码“氨基酸序列→PAM特异性”映射

研究者将实验数据训练进神经网络模型PAMmla,成功实现了从氨基酸序列预测PAM识别谱的能力,预测准确度达到Pearson’s r=0.91。同时,PAMmla还能区分活性与非活性酶(AUROC=0.99),并对未见过的酶具备良好的泛化能力。

他们进一步利用PAMmla对64M种变体进行in silico预测筛选,选出活性最高且PAM选择性最强的Cas9变体,并在体内外验证其强大的定向编辑能力。

四、研究亮点三:打破进化瓶颈,实现等位基因特异性编辑

PAMmla不仅能做预测,还能用于“进化”。团队开发了一种计算机辅助定向进化算法(ISDE),从SpCas9出发,进化出能仅识别P23H突变等位基因(NGTG PAM)而不识别WT(NGGG PAM)的Cas9变体MRRWMR和KRHWMR,并在细胞与小鼠视网膜中成功实现等位基因特异性敲除,优于现有的SpG或SpRY工具。

这代表着一个关键能力的实现:在人类疾病模型中实现精准的“突变等位基因靶向治疗”

五、科研启示:AI×蛋白工程=Cas9定制时代的开启

这项研究的意义远超“找到了几种新酶”:

概念升维:从“PAM扩展”转向“PAM定制”,强调特异性而非通用性;

方法升维:融合高通量实验与深度学习,用PAMmla预测+筛选+进化,效率远胜传统定向进化;

工具升维:从一把“通用剪刀”升级为“定制剪刀”,能适应不同疾病、不同位点的精准需求;

平台升维:PAMmla网页工具现已公开,任何研究者可输入序列获取定制Cas9建议

https://pammla.streamlit.app/

六、总结:精准基因编辑的未来

Cas酶的进化不再局限于自然选择或人工突变,而是进入了人工智能辅助设计的定量时代。这篇论文为我们提供了一整套“如何系统性设计精准、高效、安全Cas酶”的范式,不仅对基础研究具有巨大推动力,也为临床治疗带来了希望。

文章链接:

https://www.nature.com/articles/s41586-025-09021-y

本文转自【胡纯一实验室 Hu lab】公众号

--------- End ---------

感兴趣的读者,可以添加小邦微信加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位姓名-学校-职务/研究方向

图片
图片

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181778
 
95 次点击