社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

浙大谢昌谕:专注AI+小分子药物研发,破解分子对接和生成难题,已开发多款深度学习模型

生辉 • 1 年前 • 202 次点击  



科学技术进步推动了人类社会的发展。


伴随着科学技术的发展,人类社会相继进入蒸汽时代、电气时代、信息时代。如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网等,AI 正在成为推动人类进入智能时代的决定性力量。


2016 年,谷歌 DeepMind 旗下的 AlphaGo 击败了围棋世界冠军李世石,展示了 AI 在复杂策略游戏中的强大实力;2020 年,AlphaFold2 基于氨基酸序列精确预测出了蛋白质三维结构,预测水准与实验室水平相差无几,一举破解了困扰学界长达五十年之久的“蛋白质折叠”难题;2022 年底,OpenAI 推出的对话机器人 ChatGPT 被比喻为“搜索引擎+社交软件”的结合体,能够通过实时互动获得问题的答案,范围涵盖编程、视频、艺术、写作、游戏、数学计算、生物医药等等...


AI 正在为各个领域带来深刻的变化。为了深入了解 AI 在生物制药领域的发展,生辉邀请到浙江大学药学院教授谢昌谕,他向生辉介绍了其在 AI+ 制药领域的研究工作以及对 AI 制药的见解。


图|谢昌谕教授(来源:受访者提供)


谢昌谕现在是浙江大学求是工程教授,拥有量子物理、人工智能双重背景。此前,他在加拿大渥太华大学获理学博士学位,并分别在多伦多大学与麻省理工学院从事理论化学与量子开放体系的博士后研究。后续,还在腾讯量子实验室探索量子计算与人工智能等前沿计算技术在自然科学领域的应用。


关注小分子药物开发,通过 AI 加速分子对接


长久以来,谢昌谕的研究生涯围绕着基于电子间相互作用的理论建模和前沿分子模拟算法开发。从研究如何利用半导体量子点中的电子自旋进行量子计算,探索化学动力学中的量子效应,到利用量子计算机模拟化学问题等等。


在腾讯期间,谢昌谕开始逐渐探索量子计算与 AI 结合,以及量子计算在落地应用场景中的潜力,并逐渐挖掘 AI 技术应用于科学问题的价值。


“期间,我做了大量的调研工作,对 AI 技术应用于生物制药领域进行了评估。产业学界对于AI应用于制药普遍持乐观态度, 近年来也有很多技术上的突破。综合考量之后,我认为 AI+ 制药是一个极具前景的方向,也希望在这个方向探索更多有意义的研究。谢昌谕说。


后续,谢昌谕入职浙江大学药学院,他实验室的研究方向是 AI 辅助药物设计、AI for Science 以及量子计算。现阶段,实验室在药物设计领域的核心方向研发为更快更准的 AI 分子活性预测和对接,以及基于生成式 AI 的分子设计。据谢昌谕介绍,在分子活性和对接方面,研究团队采用的是图神经网络的算法架构,基于图神经网络预测配体和受体的亲和力,在预测精度和泛化能力上具有明显优势。


2021 年,谢昌谕与浙大侯廷军教授等开发出了一款于图表示学习方法的高精度打分函数模型 InteractionGraphNet (IGN)。这也是研究团队在基于深度学习进行分子活性预测上具有代表性的一个早期工作。


根据论文资料,与传统基于深度学习的打分函数不同,这款打分函数可直接从蛋白-配体三维复合物中端到端地学习蛋白-配体相互作用模式。在蛋白-配体结合亲和力方面预测效果优于现有方法的水平,虚拟筛选性能也明显优于常用的分子对接方法,如 RFScore-VS 和 Glide SP。



今年 9 月,研究团队提出了一种称之为 KarmaDock 的分子对接深度学习模型,该模型能够快速、精确生成结合构象和预测结合强度,并通过后处理技术,纠正预测配体构象中检测到的键长和角度不准确的问题。谢昌谕告诉络绎科学,这种方法的速度比传统方法提升了至少 163 倍,精度提高了至少 22.3%,在针对 LTK 靶标的虚拟筛选中仅耗时 8.4 小时即可完成 177 万分子的筛选,且经过了湿实验的测试验证。


“大数据时代背景下,虚拟分子库的分子量级达到了十亿级别,速度和精度的大幅度提升非常关键。这从一定程度上表明,AI 模型有更大潜力用于真实世界中药物研发过程中的分子对接任务。


聚焦关键问题,提出突破性分子生成新方法


上文提到,研究团队在分子活性预测和分子对接方面取得了许多重要的进展。与此同时,该研究团队分子设计和生成上同样做了大量工作。


在分子设计方面,整体来看,研究团队通过针对不同的需求开发算法,并基于这些生成式AI算法模型设计和生成小分子化合物。


首先,研究团队解决的是分子生成过程中的多目标优化问题,这需要满足和平衡药物设计中不同方面的要求,设计出一批活性高、特异性强又具有多样性的新颖小分子;第二个需要解决的问题是通过 3D 数据去有效的学习小分子与蛋白质相互作用的规律,从而即使在较少的数据前提下,几何深度学习框架也能设计出合理有效的小分子药物;第三个需要解决的问题是分子合成问题,即生成模型设计的分子在合成可及性上受限,难以使用现有的合成手段获得。


“我们的想法是将化学合成规则融入到分子生成的过程,这有助于实现分子生成+实验室自动化闭环的智能化愿景:AI 算法设计分子,自动化设备合成与测试分子后再给予 AI 模型反馈。我们的目标是希望能够从底层评估和解决真实世界分子设计过程中存在的难题,开发出适用于真实药物研发场景的算法工具。


公开资料显示,研究团队已经提出了基于经典锁钥模型的分子生成方法 SurfGen,以蛋白质口袋为条件的三维分子生成模型 ResGen,以及一种能够在分子生成过程中考虑到蛋白-配体相互作用的深度学习全新药物设计新方法——RELATION 模型等 AI 分子生成模型。


图|来源:Nature Computational Science


值得一提的是,谢昌谕也在推进实验室研究成果的转化工作,他现在是 AI 新药发现公司碳硅智慧的算法探索副总裁,加速有价值的前沿算法的应用。


根据官网的资料,碳硅智慧专注于为新药研发领域提供人工智能基础设施和服务,目前已经建立起了一站式新药发现 SaaS 平台 DrugFlow,包括靶标发现、虚拟筛选、先导化合物优化、成药性预测等模块。


理性乐观看待 AI 制药发展


计算科学在制药领域的战线早已拉开。


早在上世纪 80 年代,默沙东公司已经开始通过计算机辅助设计药物,当时美国《财富》杂志将称这为 “下一次工业革命”。其在药物设计过程中使用的三维定量构效关系分析、分子对接、分子动力学模拟等计算技术在如今的药物发现中仍然扮演着重要的角色。


“虽然早期使用的机器学习等技术比较传统,但是领域内一直在尝试和探索机器学习应用于制药领域,尤其是小分子药物研发。也因此领域内对小分子药物研发的基础问题定义、数据集、测评方式等流程都相对成熟。一定程度上,这些经验和技术储备为 AI 技术广泛应用于制药领域奠定了基础。谢昌谕说。


后续,随着 AI 技术的持续进步以及生物数据的积累,AI 与制药领域碰撞出了火花。在揭示疾病基因通路的复杂性甚至是生物学复杂性方面,我们也期望 AI 未来可以通过深度学习算法、海量的数据和强大的算力给出 “最优解”。


从 2013 年前后,AI 制药领域一片欣欣向荣。从 AI 制药初创公司如雨后春笋般纷纷浮出水面,到一笔笔大额融资交割,再到 AI 制药公司与制药大厂签单。


无论是大厂的合作,还是资本的涌入,这些一定程度上领域内对 AI 技术的认可;另一方面也加速了对 AI 平台的验证,让 AI 制药初创有技术和资金的底气开发新药管线。2021 年之后,资本开始收紧钱包,AI 制药领域内喧嚣日渐散去,开始步入到冷静和理性阶段。


谢昌谕坦言,回顾 AI 制药的发展历程,未来我仍然对这一技术路径持理性乐观的态度。


不过,他也指出,AI 制药领域同样面临着一些难题有待解决。首先是数据集问题,例如数据少、噪声大、不平衡等;其次是需要提升泛化能力和可解释性能力等。


“未来,我觉得 AI 的突破方向多种多样,除了泛化能力和可解释性之外,跨尺度和跨模态数据整合也是一个关键的突破方向;或许在更长远的未来还可以将 AI 与量子计算相结合;同时我也比较看好大语言模型的潜力,在一定场景下,大语言模型可以与其他算法交互,完成更复杂的任务。谢昌谕总结道。


参考资料:

1.https://www.nature.com/articles/s43588-023-00530-2.https://pubs.acs.org/doi/abs/10.1021/acs.jmedchem.1c01830


免责声明:本文旨在传递生命科学和医疗健康产业最新讯息,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。


素材来源官方媒体/网络新闻










Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/165294
 
202 次点击