Py学习  »  chatgpt

DrugGPT离ChatGPT还有多远?

科创板日报 • 9 月前 • 72 次点击  

腾迈医药CEO何骑表示,现在整个医药行业还处于寒冬中,但AI制药的赛道已经开始回温。“对于AI制药企业来说,它的核心就建立在数据生产能力上。”晶泰科技首席科学官张佩宇表示。数据的匮乏不止体现在量上,深势科技战略负责人王小佛表示,更麻烦的是质也无法得到完全保证。


记者 | 余诗琪 朱洁琰

在刚刚过去的2023WAIC世界人工智能大会上,生成式AI的热潮几乎贯穿了整场大会。作为当前最受关注的变革性风口,投资人、产业界、学术界都对其抱有诸多期待,尤其是如何在应用层面挖掘出颠覆性的机会。
AI+医药是被看到的机会之一。在本次大会上,美国超威半导体公司(AMD)董事会主席兼首席执行官苏姿丰在发言中就表示,医疗保健是AI能真正影响人类结果的领域,会帮助医生作出更好的诊断,加速疾病预防研究。
她的老对手动作更快。7月12日,英伟达宣布以私募股权的形式向AI制药公司Recursion投资5000万美元。其创始人兼CEO黄仁勋在公告中表示,在开发新药和新的疗法方面,生成式AI是一种革命性的工具。Recursion正在使用英伟达的相关产品在生化领域进行开创性的工作,加速开发世界上最大的生物分子生成型AI模型,以此推动生物科技的发展并加速制药公司的药物发现。
AI制药在国内一直是风口之一,已经涌现出一批在技术上跑到世界前列的头部企业。当时代的机会来临,身处一线的AI制药企业如何认知当前的变化,《科创板日报》邀请到腾迈医药联合创始人、CEO何骑、晶泰科技首席科学官张佩宇、深势科技战略负责人王小佛三位产业界代表,分享他们眼中的机会和挑战。

“卡脖子”的不是算力是数据

对生成式AI浪潮带来的影响,三位企业家共同的感知是“热度”起来了。
腾迈医药CEO何骑表示,现在整个医药行业还处于寒冬中,但AI制药的赛道已经开始回温。腾迈在今年3月份完成了3500万美元A轮融资,当时得到了很多头部机构的支持,现在也有不少机构表示对业务模式感兴趣。
晶泰科技的首席科学官张佩宇和深势科技战略负责人王小佛都认为,生成式AI的影响还没有直接传导到AI制药上,但已经给行业带来了正面的信号。张佩宇提到,“现在GPT的投资热点还是围绕大模型、数据库、图形计算这些,这只是开始,未来肯定是要向医药、制造这些更细分的应用层迁移,这是向上生长的必然过程。
在ChatGPT爆火出圈前,AI赋能新药研发已经成为行业的共识。研报显示,通过机器学习(machine learning,ML)、深度学习(deeplearning,DL)等方式赋能药物靶点发现、化合物筛选等环节,能够使新药研发的成功率从12%提高到14%,每年为全球节约化合物筛选和临床试验费用约550亿美元。
但另一方面,AI制药也面临着瓶颈。AI制药目前主要应用在药物发现、先导化合物筛选等早期阶段,在临床试验阶段更多还是要依靠人来完成相关工作。同时AI制药也受限于数据同质化的影响。通俗意义上说,AI的学习资料是人类已经创造的实验数据,对于冷门的靶点数据,AI无法无中生有。这也意味着生成式AI最具想象空间的能力受到了限制。
因此摆在AI制药企业面前的困境和现在的大模型公司是截然不同的。张佩宇在采访中直言,算力、算法都不是限制AI制药企业发展的核心关卡。几百个GPU和当前不断迭代的算法已经足够支持一家AI制药公司的需求, 关键在于数据。
“不论是通过AI算力优势进行模拟计算,加速筛选优化先导物,还是基于经验和大数据的训练,设计全新的分子结构,都需要大量的数据作为支撑。对于AI制药企业来说,它的核心就建立在数据生产能力上。”张佩宇表示。
在何骑看来,现在AI之所以在药物后期开发当中能发挥的作用还相对有限,主要问题就是数据匮乏,尤其是在临床阶段或者是转化医学上所需要的数据。这对大模型的训练造成了很大的挑战。
数据的匮乏不止体现在量上,王小佛进一步剖析了问题的核心,“现在数据的量是不够的,因为通过实验产生数据的成本非常高。更麻烦的是质也无法得到完全保证,比如同样的实验,甲来做和乙来做,可能做出来的结果会不一样,它本身是有很多场外因素的影响和关联误差存在的。底层数据的量、质无法保证,直接结果就是AI学习的表现和成果就大打折扣了。”
在几位AI制药从业者看来,从ChatGPT走向DrugGPT的道路曲折且艰难,卡住脖子的不是算力而是底层数据生产能力。但同样的,生成式AI浪潮下,AI制药有机会给整个制药行业带来质变,打破创新的瓶颈,解决研发效率的根本问题。

DrugGPT的未来还有多远?

首要解决的是数据生产能力的问题。
晶泰的思路是“自动化+智能化”。张佩宇认为,药物研发的过程是一个不断试错迭代的过程,其中不少环节传统上都属于劳动密集型,完全可以通过自动化来替代人类劳动,提高效率和精确度。现在他们做的很多工作就是把传统工艺转化为自动化工艺,并且以自动化的流程全程追溯高精度数据,实时反馈给AI模型。这种方式能比人类实验收集更多、更全面真实的数据,提高人效数倍的同时,赋能人类去做更多更成功的创新探索。
自动化产生的数据源源不断地驱动智能化算法的开发和优化。自动化的效率越高,智能化算法的预测越精确、适用范围越广。同时,智能化还体现于把非结构化的信息转变为结构化数据。据他介绍,现在AI可以将非结构化的文献和专利中隐藏的合成路径、分子结构等信息抽取出来,转成结构化数据,提高算法的表现,再将设计的合成路径输出给自动化设备,进入化学合成测试、数据生产流程中。在这个过程中,AI还能起到调度规划的作用,高效并行地调用各种各样的工具,针对不同的应用场景完成算法预测到实验验证的闭环。
“这是个值得期待的发展方向,走到最后,仅靠AI就能把设计和生产的闭环串联起来,自动地完成药物研发。”张佩宇表示。
深势则提出了AI for Science的科研新范式,简单来说就是用AI去学习一系列事物底层运作的科学规律。王小佛表示,面对数据匮乏的问题,他们将AI引入更底层的科研领域后,让AI利用自身强大的函数拟合和数据分析能力,去学习科学规律和原理,得出可用模型来解决实际的科研问题,特别是辅助科学家在不同的假设条件下进行大量的验证和试错,从而大大加速科研探索的进程。
目前已经能看到在效率上的提升,王小佛提到,此前在药物筛选过程中可能需要做很多次的高通量实验,现在先用AI for Science的新范式去计算,算完之后再去进行小部分验证,最近我们有试过做比过去少一个数量级的实验,就能拿到候选药物。这等于获得了一个不止10倍以上的效率提升。
效率的加持带来了更底层的变化。据张佩宇介绍,现在晶泰为生物医药设计的自动化数智实验室,不仅可以用于药物研发,还可以进一步拓展到同样需要实验筛选的化工、新材料方向,底层原理是相通的。但这些领域的安全性要求、验证周期和项目复杂度显著更低。这是一个不弱于制药的巨大市场,目前他们已经和一些石油化工、储能材料等新材料研发企业达成了合作。
对于未来,他有相当乐观的预期,在跨越数据生产的瓶颈之后,AI制药有机会以量变引起质变,未来的药物研发可能整个过程都是通过AI去指导实现,使难成药靶点及新的成药机制催生出新一代优质药物,创造新的药物管线及增量市场。在二三十年后,可以期待,新药研发中90%的工作都可以让AI来更加高效地完成,创新门槛降低的同时,药物研发的天花板被抬高,以更少的资源、时间和失败风险,让更多药物来到患者身边。
当下,何骑认为,AI对药物研发的推动力已经到了第二曲线,Biotech公司在做创新药研发当中,都不可避免需要在计算方面做大的投入。基于这一痛点,提供了设备和算力,还有专家支持的AI制药企业,已经能得到不少客户的认可。打下商业化基础之后,企业可以以更长远的视角,探索更多AI赋能药物研发的路径。



推荐阅读





Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/157868
 
72 次点击