传统CRISPR-Cas9被誉为“基因剪刀”,但你是否曾思考:剪刀选在哪里“剪”,对编辑的效率和安全性影响有多大?
2025年4月22日,Benjamin P. Kleinstiver团队在Nature发表论文:Custom CRISPR—Cas9 PAM variants via scalable engineering and machine learning。他们开发出一套集饱和突变、机器学习与进化模拟于一体的系统性平台,成功构建出一个“PAM定制”的Cas9酶库,为精准基因编辑开辟全新路径。
Cas9酶识别目标DNA的前提是其旁边存在一个“protospacer adjacent motif”(PAM)序列。以最常用的SpCas9为例,其只能识别NGG序列,这限制了其靶点选择范围。为扩展Cas9应用场景,科研人员开发了许多“PAM-relaxed”变体,如SpG和SpRY,使其能识别更广泛的PAM序列。但广谱识别的代价是脱靶风险显著上升。
该文献的核心思路是:与其做“泛用型”Cas9,不如做“定制型”Cas9,即让每一个Cas9变体精准识别一个特定PAM,从而提升编辑效率并显著降低脱靶效应。
二、研究亮点一:从饱和突变出发,探索64百万种PAM组合空间
作者通过结构分析与前人研究,选取了SpCas9 PAM结合域(PI domain)中6个关键氨基酸位点,构建了一个6位点饱和突变文库,理论上可产生高达64,000,000种酶变体。随后,他们通过细菌选择体系筛选出634个活性良好的变体,并借助高通量PAM活性测定法(HT-PAMDA)构建出PAM识别谱。
但实验筛选只触及了变体宇宙的冰山一角,接下来的主角——机器学习,正式登场。
三、研究亮点二:PAMmla——用神经网络解码“氨基酸序列→PAM特异性”映射
研究者将实验数据训练进神经网络模型PAMmla,成功实现了从氨基酸序列预测PAM识别谱的能力,预测准确度达到Pearson’s r=0.91。同时,PAMmla还能区分活性与非活性酶(AUROC=0.99),并对未见过的酶具备良好的泛化能力。
他们进一步利用PAMmla对64M种变体进行in silico预测筛选,选出活性最高且PAM选择性最强的Cas9变体,并在体内外验证其强大的定向编辑能力。
四、研究亮点三:打破进化瓶颈,实现等位基因特异性编辑
PAMmla不仅能做预测,还能用于“进化”。团队开发了一种计算机辅助定向进化算法(ISDE),从SpCas9出发,进化出能仅识别P23H突变等位基因(NGTG PAM)而不识别WT(NGGG PAM)的Cas9变体MRRWMR和KRHWMR,并在细胞与小鼠视网膜中成功实现等位基因特异性敲除,优于现有的SpG或SpRY工具。
这代表着一个关键能力的实现:在人类疾病模型中实现精准的“突变等位基因靶向治疗”。
五、科研启示:AI×蛋白工程=Cas9定制时代的开启
这项研究的意义远超“找到了几种新酶”:
概念升维:从“PAM扩展”转向“PAM定制”,强调特异性而非通用性;
方法升维:融合高通量实验与深度学习,用PAMmla预测+筛选+进化,效率远胜传统定向进化;
工具升维:从一把“通用剪刀”升级为“定制剪刀”,能适应不同疾病、不同位点的精准需求;
平台升维:PAMmla网页工具现已公开,任何研究者可输入序列获取定制Cas9建议
https://pammla.streamlit.app/
Cas酶的进化不再局限于自然选择或人工突变,而是进入了人工智能辅助设计的定量时代。这篇论文为我们提供了一整套“如何系统性设计精准、高效、安全Cas酶”的范式,不仅对基础研究具有巨大推动力,也为临床治疗带来了希望。
文章链接:
https://www.nature.com/articles/s41586-025-09021-y
本文转自【胡纯一实验室 Hu lab】公众号
感兴趣的读者,可以添加小邦微信加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位或姓名-学校-职务/研究方向。