社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

DrugGPT离ChatGPT还有多远?

科创板日报 • 1 年前 • 240 次点击  

腾迈医药CEO何骑表示,现在整个医药行业还处于寒冬中,但AI制药的赛道已经开始回温。“对于AI制药企业来说,它的核心就建立在数据生产能力上。”晶泰科技首席科学官张佩宇表示。数据的匮乏不止体现在量上,深势科技战略负责人王小佛表示,更麻烦的是质也无法得到完全保证。


记者 | 余诗琪 朱洁琰

在刚刚过去的2023WAIC世界人工智能大会上,生成式AI的热潮几乎贯穿了整场大会。作为当前最受关注的变革性风口,投资人、产业界、学术界都对其抱有诸多期待,尤其是如何在应用层面挖掘出颠覆性的机会。
AI+医药是被看到的机会之一。在本次大会上,美国超威半导体公司(AMD)董事会主席兼首席执行官苏姿丰在发言中就表示,医疗保健是AI能真正影响人类结果的领域,会帮助医生作出更好的诊断,加速疾病预防研究。
她的老对手动作更快。7月12日,英伟达宣布以私募股权的形式向AI制药公司Recursion投资5000万美元。其创始人兼CEO黄仁勋在公告中表示,在开发新药和新的疗法方面,生成式AI是一种革命性的工具。Recursion正在使用英伟达的相关产品在生化领域进行开创性的工作,加速开发世界上最大的生物分子生成型AI模型,以此推动生物科技的发展并加速制药公司的药物发现。
AI制药在国内一直是风口之一,已经涌现出一批在技术上跑到世界前列的头部企业。当时代的机会来临,身处一线的AI制药企业如何认知当前的变化,《科创板日报》邀请到腾迈医药联合创始人、CEO何骑、晶泰科技首席科学官张佩宇、深势科技战略负责人王小佛三位产业界代表,分享他们眼中的机会和挑战。

“卡脖子”的不是算力是数据

对生成式AI浪潮带来的影响,三位企业家共同的感知是“热度”起来了。
腾迈医药CEO何骑表示,现在整个医药行业还处于寒冬中,但AI制药的赛道已经开始回温。腾迈在今年3月份完成了3500万美元A轮融资,当时得到了很多头部机构的支持,现在也有不少机构表示对业务模式感兴趣。
晶泰科技的首席科学官张佩宇和深势科技战略负责人王小佛都认为,生成式AI的影响还没有直接传导到AI制药上,但已经给行业带来了正面的信号。张佩宇提到,“现在GPT的投资热点还是围绕大模型、数据库、图形计算这些,这只是开始,未来肯定是要向医药、制造这些更细分的应用层迁移,这是向上生长的必然过程。
在ChatGPT爆火出圈前,AI赋能新药研发已经成为行业的共识。研报显示,通过机器学习(machine learning,ML)、深度学习(deeplearning,DL)等方式赋能药物靶点发现、化合物筛选等环节,能够使新药研发的成功率从12%提高到14%,每年为全球节约化合物筛选和临床试验费用约550亿美元。
但另一方面,AI制药也面临着瓶颈。AI制药目前主要应用在药物发现、先导化合物筛选等早期阶段,在临床试验阶段更多还是要依靠人来完成相关工作。同时AI制药也受限于数据同质化的影响。通俗意义上说,AI的学习资料是人类已经创造的实验数据,对于冷门的靶点数据,AI无法无中生有。这也意味着生成式AI最具想象空间的能力受到了限制。
因此摆在AI制药企业面前的困境和现在的大模型公司是截然不同的。张佩宇在采访中直言,算力、算法都不是限制AI制药企业发展的核心关卡。几百个GPU和当前不断迭代的算法已经足够支持一家AI制药公司的需求, 关键在于数据。
“不论是通过AI算力优势进行模拟计算,加速筛选优化先导物,还是基于经验和大数据的训练,设计全新的分子结构,都需要大量的数据作为支撑。对于AI制药企业来说,它的核心就建立在数据生产能力上。”张佩宇表示。
在何骑看来,现在AI之所以在药物后期开发当中能发挥的作用还相对有限,主要问题就是数据匮乏,尤其是在临床阶段或者是转化医学上所需要的数据。这对大模型的训练造成了很大的挑战。
数据的匮乏不止体现在量上,王小佛进一步剖析了问题的核心,“现在数据的量是不够的,因为通过实验产生数据的成本非常高。更麻烦的是质也无法得到完全保证,比如同样的实验,甲来做和乙来做,可能做出来的结果会不一样,它本身是有很多场外因素的影响和关联误差存在的。底层数据的量、质无法保证,直接结果就是AI学习的表现和成果就大打折扣了。”
在几位AI制药从业者看来,从ChatGPT走向DrugGPT的道路曲折且艰难,卡住脖子的不是算力而是底层数据生产能力。但同样的,生成式AI浪潮下,AI制药有机会给整个制药行业带来质变,打破创新的瓶颈,解决研发效率的根本问题。

DrugGPT的未来还有多远?

首要解决的是数据生产能力的问题。
晶泰的思路是“自动化+智能化”。张佩宇认为,药物研发的过程是一个不断试错迭代的过程,其中不少环节传统上都属于劳动密集型,完全可以通过自动化来替代人类劳动,提高效率和精确度。现在他们做的很多工作就是把传统工艺转化为自动化工艺,并且以自动化的流程全程追溯高精度数据,实时反馈给AI模型。这种方式能比人类实验收集更多、更全面真实的数据,提高人效数倍的同时,赋能人类去做更多更成功的创新探索。
自动化产生的数据源源不断地驱动智能化算法的开发和优化。自动化的效率越高,智能化算法的预测越精确、适用范围越广。同时,智能化还体现于把非结构化的信息转变为结构化数据。据他介绍,现在AI可以将非结构化的文献和专利中隐藏的合成路径、分子结构等信息抽取出来,转成结构化数据,提高算法的表现,再将设计的合成路径输出给自动化设备,进入化学合成测试、数据生产流程中。在这个过程中,AI还能起到调度规划的作用,高效并行地调用各种各样的工具,针对不同的应用场景完成算法预测到实验验证的闭环。
“这是个值得期待的发展方向,走到最后,仅靠AI就能把设计和生产的闭环串联起来,自动地完成药物研发。”张佩宇表示。
深势则提出了AI for Science的科研新范式,简单来说就是用AI去学习一系列事物底层运作的科学规律。王小佛表示,面对数据匮乏的问题,他们将AI引入更底层的科研领域后,让AI利用自身强大的函数拟合和数据分析能力,去学习科学规律和原理,得出可用模型来解决实际的科研问题,特别是辅助科学家在不同的假设条件下进行大量的验证和试错,从而大大加速科研探索的进程。
目前已经能看到在效率上的提升,王小佛提到,此前在药物筛选过程中可能需要做很多次的高通量实验,现在先用AI for Science的新范式去计算,算完之后再去进行小部分验证,最近我们有试过做比过去少一个数量级的实验,就能拿到候选药物。这等于获得了一个不止10倍以上的效率提升。
效率的加持带来了更底层的变化。据张佩宇介绍,现在晶泰为生物医药设计的自动化数智实验室,不仅可以用于药物研发,还可以进一步拓展到同样需要实验筛选的化工、新材料方向,底层原理是相通的。但这些领域的安全性要求、验证周期和项目复杂度显著更低。这是一个不弱于制药的巨大市场,目前他们已经和一些石油化工、储能材料等新材料研发企业达成了合作。
对于未来,他有相当乐观的预期,在跨越数据生产的瓶颈之后,AI制药有机会以量变引起质变,未来的药物研发可能整个过程都是通过AI去指导实现,使难成药靶点及新的成药机制催生出新一代优质药物,创造新的药物管线及增量市场。在二三十年后,可以期待,新药研发中90%的工作都可以让AI来更加高效地完成,创新门槛降低的同时,药物研发的天花板被抬高,以更少的资源、时间和失败风险,让更多药物来到患者身边。
当下,何骑认为,AI对药物研发的推动力已经到了第二曲线,Biotech公司在做创新药研发当中,都不可避免需要在计算方面做大的投入。基于这一痛点,提供了设备和算力,还有专家支持的AI制药企业,已经能得到不少客户的认可。打下商业化基础之后,企业可以以更长远的视角,探索更多AI赋能药物研发的路径。



推荐阅读





Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/157868
 
240 次点击