社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

定制化CRISPR来啦!高通量工程+机器学习解锁精准基因编辑,登Nature

ScienceAI • 2 周前 • 15 次点击  

将 ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯


编辑 | 白菜叶
蛋白质的工程改造和表征可能既耗时又繁琐,这促使人们开发通用型 CRISPR-Cas 酶,以实现多样化的基因组编辑应用。然而,这类酶也存在一些缺陷,例如脱靶编辑的风险较高。
为了实现 Cas9 酶的可扩展重编程,哈佛医学院(Harvard Medical School)、麻省总医院(Massachusetts General Hospital)等机构的研究人员将高通量蛋白质工程与机器学习 (ML) 相结合,以获得更适合特定目标的定制编辑器。
通过基于结构/功能的饱和诱变和细菌筛选,研究人员获得了近 1000 个工程化的 SpCas9 酶,并鉴定了它们的原型间隔区相邻基序(PAM)要求,从而训练了一个将氨基酸序列与PAM特异性关联起来的神经网络。
通过利用训练产生的 PAM 机器学习算法(PAMmla)预测 6400 万个 SpCas9 酶的 PAM,研究人员鉴定出了一些高效且特异的酶,它们在人类细胞中作为核酸酶和碱基编辑器的性能优于基于进化和工程化的 SpCas9 酶,同时降低了脱靶率。
一种计算机定向进化方法支持用户自主设计 Cas9 酶,包括针对人类细胞和小鼠中 RHO P23H 等位基因的等位基因选择性靶向。
PAMmla 将机器学习 (ML) 与蛋白质工程相结合,整理出一系列满足不同 PAM 需求的 SpCas9 酶,可以使研究人员在各种应用中使用高效安全的定制 Cas9 酶,而非通用酶。
该研究以「Custom CRISPR—Cas9 PAM variants via scalable engineering and machine learning」为题,于 2025 年 4 月 22 日发布在《Nature》。
机器学习模型 PAMmla 能够仅根据氨基酸序列预测数百万种 SpCas9 酶的 PAM 需求。PAMmla 能够发现在人类细胞和小鼠中有效的新型 Cas9 酶,其优势在于比通用的 PAM 宽松酶更高水平的定点编辑和更低的全基因组脱靶率。
为了加快 SpCas9 酶的定制化用于研究或转化用途,研究人员开发了一个网页工具,用于基于 PAMmla 模型生成预测,并通过 ISDE 对具有用户自定义属性的酶进行优先排序。
相关链接:https://pammla.streamlit.app/
机器学习 (ML) 与可扩展的实验分析相结合,使研究人员能够探索庞大而多样的蛋白质序列空间,从而识别有用的酶。PAMmla 为 Cas9 如何指定核酸靶标的可塑性提供了新的见解。
在 PAMmla 之前,与更常见的 PAM-relaxed 酶相比, PAM-altered 酶的例子很少。这种差异表明,PAM-relaxed 可能是赋予 Cas 酶新的靶向能力最简单的进化轨迹,这或许是因为 PAM-altered 酶可能需要几个特定的同时突变,这些突变上位性地发挥作用来指定新的 PAM。
因此,在不包含反选择步骤以保持 PAM 选择性的实验工程方法(例如定向进化)中,PAM-altered 酶不太可能被发现。
最近,基于进化序列数据训练的模型已经可以预测变异效应,其性能与实验测定相当。然而,该团队发现一些基于进化序列的模型无法预测他们酶组在非规范 PAM 上的活性。之前基于机器学习的方法试图预测序列多样化的 Cas9 酶或改进的 SaCas9-KKH 酶。虽然这些研究支持使用机器学习来改造 Cas 酶,但建模主要局限于在规范 PAM 上的活性。
这些数据表明,仅凭自然序列信息可能不足以训练出能够准确预测 PAM 要求与自然界不同的酶的模型。
综上所述,PAMmla 能够实现用户定制 SpCas9 PAM 变体酶的设计,并推动从通用的 PAM-relaxed 酶向提高各种应用的基因组编辑效率和安全性方面转变。
更广泛地说,PAMmla 的开发突显了实验工程与机器学习 (ML) 之间的协同作用,以实现快速且可扩展的蛋白质检测和优化。
论文链接:https://www.nature.com/articles/s41586-025-09021-y

人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展

欢迎注标星,并点击右下角点赞在看

点击读原文,加入专业从业者社区,以获得更多交流合作机会及服务。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181451
 
15 次点击