Py学习  »  机器学习算法

浙大计剑/张鹏团队: 机器学习+组合化学显著加速抗菌化合物高效筛选

RSC英国皇家化学会 • 2 周前 • 27 次点击  

研究背景

筛选具有特定功能的化合物往往需要耗费大量的时间和金钱。传统的筛选流程需要研究人员根据先验知识进行分子设计,随后进行实验室合成与表征,再根据实验结果,对分子结构进行相应调整,并重复以上实验过程,直至达到设计目标。这种试错式的研发模式效率低下,且严重限制了对广阔的化学空间的探索。因此,有效构建庞大的化学空间,并于此基础上高效筛选目标功能分子是当前开发新型分子的巨大挑战。
组合化学手段通过高效的核心反应,快速组合不同的化合物基元,能够构建广阔的化合物文库,为探索具有高合成可及性的广阔化学空间提供了一个有力的工具。然而,如何从庞杂的数据中总结抽提相应的规律,以期避免对整个化合物文库困难又耗时的机械式遍历表征,仍然是文库筛选中的难题。

机器学习作为人工智能的分支,善于从已有数据中挖掘规律,不断自我完善并对未知数据做出预测和判断,近年来在辅助分子文库筛选中表现出了极大的潜力,但是大多数依赖于局限的数据集,如收集文献中抗菌肽数据以辅助新型抗菌多肽开发,或者仅在小规模文库筛选中进行了尝试。利用组合化学手段拓展分子文库多样性,并将机器学习模型结合到筛选流程之中因而具有极大的探索价值。

文章简介

近日,浙江大学计剑教授和张鹏研究员带领研究团队设计了一套基于组合化学和机器学习的高通量方法,并应用于抗菌化合物的高效筛选,成功得到 3 种对 MRSA(耐甲氧西林葡萄球菌)具有强力抗菌效果的小分子产物。

该研究采用 Ugi 四组分组合化学反应,选取 38 种酸、20 种醛、21 种胺和 7 种不同的异腈,构建了具有 111,720 种 Ugi 产物的多样化文库。为获得初筛数据,采用一致流形近似与投影技术将文库的高维信息降为二维分布图,从中尽可能均匀地选取了 360 个具有代表性的组合。随后合成了所有 360 个组合,并通过高通量实验对其抗菌性能进行了表征,以 OD 吸光度作为抗菌性能标签,具有良好抗菌性能的组合(深红色)占比极少,若以 OD 值低于 0.1 为界划分,则筛选命中率仅为 5.3%

  • Figure 1. 基于 Ugi 反应的组合化学文库构建及特征融合机器学习辅助文库快速筛选。

  • Figure 2. 初筛文库的抗菌性能热图。

分子特征的选取是机器学习用于化合物属性预测过程中极为重要的步骤,其中分子指纹描述符(Fingerprint descriptor)和物理化学描述符(Physicochemical descriptor)是经典的两种分子特征描述,其分别反映了具体分子的化学结构和物理化学性质。该研究团队设想这两种描述符包含互补信息,融合两种特征可能会提高模型的性能,稳定学习过程,由此采用了基于特征融合的机器学习模型来辅助文库筛选 。
采用该模型对整体文库中 11 万种产物的抗菌性能做出预测并排序,通过湿实验合成了模型预测的最优抗菌性能组合,最终研究团队筛选得到了三种具有优异抗 MRSA 性能的 Ugi 产物结构,筛选成功率大幅提升(60%),且这三种抗菌分子表现出了极低的诱导细菌耐药性产生能力。

该工作流程突出了机器学习模型与组合化学文库的集成,显著加快了抗菌化合物高质量数据的收集和数据挖掘效率。相关成果以“Combinatorial discovery of antibacterials via a feature-fusion based machine learning workflow”(《基于特征融合的机器学习加速组合化学文库抗菌筛选》)为题发表在英国皇家化学会期刊 Chemical Science 上。

论文信息

  • Combinatorial discovery of antibacterials via a feature-fusion based machine learning workflow
    Cong Wang, † Yuhui Wu, † Yunfan Xue,† Lingyun Zou, Yue Huang, Peng Zhang*(张鹏,浙江大学), and Jian Ji*(计剑,浙江大学)
    Chem. Sci., 2024
    https://doi.org
    /10.1039/D3SC06441G

作者简介

王聪 博士研究生
浙江大学

本文第一作者,浙江大学高分子科学与工程学系 2019 级博士研究生,主要研究方向为机器学习辅助组合化学文库高通量筛选。






吴宇晖 博士研究生
浙江大学

本文第一作者,浙江大学高分子科学与工程学系 2021 级博士研究生,主要研究方向为机器学习辅助的生物医用材料设计。






薛云帆 博士研究生
浙江大学

本文第一作者,浙江大学高分子科学与工程学系 2017 级博士研究生,主要研究方向为机器学习用于材料特性预测以及深度学习用于细胞图像处理。





计剑 教授
浙江大学

本文通讯作者,浙江大学教授,国家杰出青年科学基金获得者,教育部长江特聘教授。主要从事生物医用界面材料和植介入医用材料的应用基础研究。从宏观和微观两个层次,建立了复杂生命体系中实现高选择性生物医用界面的新方法和新理论。针对心血管原位再生材料的关键问题,发现并证明了复杂体内环境中细胞竞争行为对心血管内皮原位再生的关键作用,并成功研制了具有原位内皮再生功能的新型心血管支架,成果获浙江省科学技术奖一等奖;并致力于生物材料基因工程创新方法和应用示范的研究,建立了“数据挖掘指导-高通量实验验证”联动的数据驱动新材料研究模式,有效推动了多种高端植介入医疗器械的创新研发效率。






张鹏 研究员
浙江大学

本文通讯作者,国家级青年人才项目获得者,2009 及 2012 年分别获得天津大学材料学本科与硕士学位。2018年在 Shaoyi Jiang 教授指导下于美国华盛顿大学化学工程系获得博士学位。2018-2020 年于麻省理工学院从事博士后研究,师从“组织工程和药物递送之父”Robert Langer 院士。主要方向为免疫活性生物材料、生物材料表界面和数据驱动的生物材料研究。迄今已在 Nat. Biomed. Eng.、Sci. Transl. Med.、PNAS、Chem. Rev.、Angew. Chem. 等期刊发表学术论文 50 余篇,引用 6000 余次,h 因子 35,研究成果被包括 Science、Scientific American、C&E News 等在内的国际主要科技媒体多次专题报道。

相关期刊

Home to exceptional research and thought-provoking ideas. Open and free, for authors and readers.

rsc.li/chemical-science

Chem. Sci.

2-年影响因子*8.4
5-年影响因子*8.6
最高 JCR 分区*Q1化学-综合
CiteScore 分15.2
中位一审周期34 


Chemical Science 是涵盖化学科学各领域的跨学科综合性期刊,也是英国皇家化学会的旗舰期刊。所发表的论文不仅要在相应的领域内具有重大意义,而且还应能引起化学科学其它领域的读者的广泛兴趣。所发表的论文应包含重大进展、概念上的创新与进步或者是对领域发展的真知灼见。发文范围包括但不限于有机化学、无机化学、物理化学、材料科学、纳米科学、催化、化学生物学、分析化学、超分子化学、理论化学、计算化学、绿色化学、能源与环境化学等。作为一本钻石开放获取的期刊,读者可以免费获取所发表论文的全文,同时从该刊的论文版面费由英国皇家化学会承担,论文作者无需付费。

Editor-in-Chief
  • Andrew Cooper
    🇬🇧 利物浦大学

Associate editors

  • Vincent Artero
    🇫🇷 格勒诺布尔阿尔卑斯大学/法国原子能和替代能源委员会

  • Luis M. Campos
    🇺🇸 哥伦比亚大学

  • Michelle Chang
    🇺🇸 加州大学伯克利分校

  • Lin Chen
    🇺🇸 西北大学

  • Graeme Day
    🇬🇧 南安普敦大学

  • Serena DeBeer
    🇩🇪 马普化学能转化研究所

  • Mircea Dincă
    🇺🇸 麻省理工学院

  • François Gabbaï
    🇺🇸 得克萨斯农工大学

  • Subi George
    🇮🇳 贾瓦哈拉尔·尼赫鲁高级科学研究中心

  • Ryan Gilmour
    🇩🇪 明斯特大学

  • Stephen Goldup
    🇬🇧 伯明翰大学

  • Jinlong Gong (巩金龙)
    🇨🇳 天津大学

  • Zaiping Guo (郭再萍)
    🇦🇺 阿德莱德大学

  • Christian Hackenberger
    🇩🇪 德国莱布尼茨分子药理学研究所

  • Christopher A Hunter
    🇬🇧 剑桥大学

  • Malika Jeffries-EL
    🇺🇸 波士顿大学

  • Ning Jiao (焦宁)
    🇨🇳 北京大学

  • Tanja Junkers
    🇦🇺 莫纳什大学

  • Rebekka Klausen
    🇺🇸 约翰霍普金斯大学

  • Hemamala Karunadasa
    🇺🇸 斯坦福大学

  • Maja Köhn
    🇩🇪 弗莱堡大学

  • Yi-Tao Long (龙亿涛)
    🇨🇳 南京大学

  • James K McCusker
    🇺🇸 密歇根州立大学

  • Thomas J Meade
    🇺🇸 西北大学

  • Paolo Melchiorre
    🇮🇹 博洛尼亚大学

  • Gabriel Merino
    🇲🇽 墨西哥国家理工学院科研和高级研究中心

  • Dmitri Talapin
    🇺🇸 芝加哥大学

  • Toshiharu Teranishi
    🇯🇵 京都大学

* 2022 Journal Citation Reports (Clarivate, 2023)

 CiteScore 2022 by Elsevier

 中位数,仅统计进入同行评审阶段的稿件








欢迎联系我们发布论文报道
📧 RSCChina@rsc.org

点击下方「阅读原文」查看

↓↓↓

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/169697
 
27 次点击