社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

ChatGPT热炒下的AI制药:不能承受之重

生物制品圈 • 2 年前 • 250 次点击  

3 月 15 日,OpenAI 发布 GPT-4,成为公司在ChatGPT之后最先进的人工智能系统。


ChatGPT的出现,再次让和AI相关的一切领域站上风口。“2021年那一波AI制药的投资人又开始活跃起来了,见面就聊ChatGPT能不能带来什么新的机会,这也是最近医药寒冬里为数不多的积极话题了。”一名投资机构人员说到。


而看到这条消息,国内最早从事AI行业的曹翎(化名)在朋友圈留下了一句很“不应景”的话:“真正的失落都是无声的。”


十几年来,曹翎一直在AI行业穿行不歇。他的最后一份工作,是在国内某知名大厂背景的AI制药公司从事AIDD(AI药物发现和设计)。如今退圈的他有一些写书的计划,只想“为这个行业做一些基础建设工作”。


对于像曹翎一样的AI从业者而言,这个行业就像是幸运大转盘上的指针,曾经定格在电商、游戏、直播等行业。2021年,这枚指针落到了生物医药领域。一众国内AI制药初创便像雨后春笋一般崛起。但随之而来的,还有意料之中的内卷、路演,和资本的游戏。


一边,AI制药已经成为了一个大型投注箱,其中回荡着金钱的碰撞声:如果人类生命科技的未来注定属于多特异性药物,那善于分析复杂分子的AI必定大有可为;另一边,则是AI制药的算力、数据库、准确性问题一直没有得到突破性解决,现阶段AI只能把药物研发效率从11%提高到14%。


“制药行业其实根本不在乎AI。”曹翎有点苦涩地说。“你AI做成的数据再漂亮,药企可能只会花研发中的5%的权重去买它。现在大药企就是看这些AI制药企业表演着,等表演得差不多了,再大家一起把这一块儿买走。”


而在大药企作壁上观的另一边,是这些AI初创人员为了数据准确性能再提升零点几加班加点、苦不堪谈。“AI制药是一个数据驱动的活儿,产品迭代特别快,但其实背后的规律性没有搞透,真正的生物科学家又看不上。”——在曹翎看来,如今的AI制药从所谓的前沿科技渐渐滑落为一种四不像的尴尬产品,这是行业真正的失落所在。


相比于过去的AI投资人再次燃起的热情,在二级市场重新吃香的相关企业,诸如复星医药、成都先导、药石科技等,却在业内人士看来并不是纯粹的AI制药企业:要么是AI技术只占公司业务很小一部分,要么底子上是制造业化工的逻辑。而二级市场的重新繁荣,并没有带动起整个投融圈的热情。业内人士透露,对于大部分真正只做AI制药的初创而言,现金流即将在半年之内出现巨大黑洞。


如今,大部分的人已经认清AI制药的工具属性,应服从制药业本身的逻辑。而只要它在行业中的应用程度和作用强度不发生改变,那么不管是股市的喧嚣一片、还是AI技术的飞驰而过,对于AI制药行业都只是一些遥远的消息而已。


-01-

2021-2023,AI制药资本的冷与热


去年12月,晶泰科技回应了港股 18C咨询文件,这距离它最后一次融资已经过去了一年半的时间。


作为国内AI制药的头部,晶泰科技在2021年时也经历过50家国际机构融资竞标、额度达到8亿美元、投后估值达到19.68亿美元的盛况。然而,随着2022年生物医药市场环境的失速,公司不得不搁浅了美股IPO的计划。


2021年是AI制药最好的年头。DeepMind的深度学习算法Alphafold刚刚被验证能够准确预测蛋白质的三维结构,就遇到了那一年的biotech上升期。AI制药公司的数亿融资俯拾皆是,与药企合作捷报频传。“当时我们公司为了挖人,曾经开出过100万美元的天价高薪。”一名AI制药企业员工回忆。


然而,仅仅一年时间,AI制药卷起的泡沫就被打得粉碎。医药寒冬一来,钱去人空不可避免。去年一整年,部分美国上市的AI制药市值已经低于1亿美元,跌幅超过90%,其中不乏Absci、Schrdinger这样的独角兽。在国内,风口也巅峰不再,去年上半年融资总额同比缩水2/3。


除了突如其来的资本风暴以外,AI制药式微的主要原因还在于:它并没有像原先人们所料想的那样,帮药企解决卡点问题。本质上,它只是把药企目前面临的问题,用不同的语言再重新书写一遍。


一名AI制药领域的专家介绍到,这个行业最早是卖软件的,但是只收服务费,上限比较低;如今是在做CRO还是做药之间产生分歧:晶泰偏CRO,英矽偏biotech——但不管是哪种路线,它都没有在根本上解决药物研发的失败率和成本问题。


资本市场曾经流行着一个诱人的故事:AI可以将公司的药物发现成本降低高达70%。但事实上,这只是理想数据,因为目前市场还没有见证到AI制药的最终产品——2022年,第一款由AI设计、号称只用了12个月便进入临床的分子DSP-1181因I期未达标而折戟。


公司需要在前期打通数据、算力、算法,这绝非小数目;交叉学科中人才的稀缺问题,造成昂贵的人才成本;生物验证过程中的各种不确定性,造成来来回回的退回和返工——而这一切都让AI制药,绝不像它听上去那么省钱。


最重要的是,大部分AI制药公司目前并没有清晰的发展主线,商业化通路处于观望状态,往往会在“既要又要”的“尝试”中损耗精力。曹翎提到,自己的老东家,就因为一些预算以外的投入,导致产出的虎头蛇尾。“在做药之前,公司必须把周边的东西搞齐或摸排清楚,其中包括不同的生物技术路线,包括产业链上下游的东西,要保证企业又能卖产品,又有自己做药的能力。这部分成本是非常大的。”


AI制药同样面临着生物医药领域同质化竞争的问题。简单来说,AI的学习资料是人类已经创造的实验数据,对于那些冷门的靶点信息,AI无法无中生有“AI制药公司用的数据库都差不多,算法技术也没有太大的技术壁垒,无非是针对场景慢慢进行优化。说到最后,还是拼靶点。”上述AI制药企业员工说。


一切似乎都回到了AI制药出现之前的原点,逻辑和难点都没有改变。


2023年,随着ChatGPT的大火,不少AI制药企业就像杀入18C的晶泰科技一样,意图再度抬头。成都先导,皓元医药、药石科技、泓博医药等医药上市公司先后披露布局AI制药赛道相关情况。“投资人们最关心的就是,ChatGPT这种生成式AI能不能给制药行业带来什么新的东西。”上述投资机构人员说。


AI制药不能和ChatGPT比较,因为训练后者的,是强大的互联网工业和二十年左右的语言模型发展。相对而言,AI制药实在是太年轻了。”这名投资机构人员继续说道,“甚至可以说,对于AI制药公司而言,最难的时刻还没有到来。因为大批的产品还没有进入到临床阶段,真正的大考还没有到来。”


-02-

ChatGPT给的机会在哪里


在这一轮热度之前,AI制药还只是生物医药行业的一个影子,无法摆脱跟随式发展的限制。而ChatGPT这一剂强心针,不仅打在了二级市场的心坎上,还让不少投资机构给出观点:ChatGPT给了AI制药一个从辅助性向创造性迁移的机会。


“ChatGPT是一个数据与经验结合的大模型,而药物研发比较重要的是靶点的发现,本来也是对基因、蛋白组学的数据进行分析,建立关联,所以比较容易被大模型所替代。短期来看,GPT可以取代初级和中级的药物专家。”上述AI制药领域专家说。


一方面,GPT架构的排序训练方式,在理论上可以融合所有药物研发的模态数据,支持通用的药物研发模型;另一方面,它可以成为一个整合核心,通过API的方式调用各个子模块,而子模块返回的结果可以通过核心GPT进行整合报告,从而实现更加专业的预测。


简单来说,GPT有一个大底座,可以承载更多的生物信息(小分子结构,蛋白质序列,化学反应,小分子与蛋白质对接,过滤规则等),也可以在不同步骤进行及时反馈,趋近准确。


这其实解决的是AI制药曾经出现过的两个问题:第一,是模态不全,不同维度的生物信息之间无法协同导出综合判断;第二,是运算压力造成的算力问题,经常会导致预测结果不够准确。


可以说,如果AI制药是一把枪的话,那么ChatGPT的确让它弹夹更大、弹道更直了;然而,如今AI制药最头疼的数据问题——即:子弹该如何被完美地上膛后射出,却始终没有得到清晰的答案。


水木未来CEO郭春龙曾表示过,给数据做标签,这是 ChatGPT 能够突飞猛进发展的一个前提条件,而AI制药在这方面还没有准备好。“你给一段话加上个标签,成本最多1分钟甚至几秒钟的事。但是你要希望给一个蛋白质的序列加上标签,往往需要大量的实验,包括电镜的收数据、解数据,它的成本要高很多。”


比起贴标签的成本,更严峻的是数据来源问题ChatGPT依托在互联网这一共享平台上,而在可见的未来,制药行业的数据壁垒无法被打破。


除去有限的公共数据库外,AI制药公司只能通过与药企合作、自有实验平台、委托CRO等形式获取用以训练系统的信息;同时,因为不同实验室或公司数据标准化程度都不一样,前期输入的标准化转译也必须投入大量人力、财力。


“从数据来看,只有蛋白结构这个事情是可以解决的,其他环节的一些定量的、定性的实验数据因为标准化问题,80%实际上都是不可靠的。”曹翎说。


另一个GPT能做到、而目前AI制药无法做到的事情同样和数据相关。GPT的特点之一在于对信息的理解和筛选,其中涉及到强度和权重的赋值,可以理解为:人工智能可以决定在海量信息中重点看什么,不去看什么。而目前,生物类数据还没有找到一种有效的方式,可以表现突出关系或信息的重要性层级。


“目前大家希望可以通过蛋白序列和基因序列的手段去解决这个问题。但这些序列在发生功能的时候,已经是一个结构化的东西了。相当于我们用一维的手段,去研究四维状态的现象背后的规律,然后再去映射它的功能,说实话挺难的。”曹翎说。


-03-

对AI制药有期待,错了么?


不管是科学界还是产业界,如今越来越多的人正在认定:多特异性药物,将引发现代制药工业的第四次革命性浪潮;那么,似乎没有什么理由可以指摘人们对AI制药的高度期待了。


面向未来的药物形态,将拥有多重治疗机制和丰富的合成结构,其核心就是“以复杂对抗复杂”,其中便给了AI分析和设计的广阔空间。


但同时,“复杂”也给了AI制药一种无的放矢、无处着力的困境。一名AI制药企业管理人员总结道:“做药是个非常复杂的系统工程,AI在其中一个环节的加速,可能会被另一个环节所稀释。因此,AI制药必须要找准最关键的杠杆点。如果在一个点上能有千倍以上的提升,就会有一个从量变到质变的过程。”


简单点说,AI制药企业未来的定位,应该是像狙击枪一样。“大药企就像是霰弹枪,打击范围大,总有那么一两发是中的。”曹翎说。不管是AI制药初创,还是传统药企,研发都是一个几率问题。大药企能承担巨额的试错成本;相对而言,AI制药不能走量,只能在一些细分方向或步骤上做出四两拨千斤的效果。


换句话说,如果我们所期待的,是AI在复杂问题中提供全面而完美的解决方案,那么失望是在所难免的;但如果AI可以在复杂环境中,做撬开问题的一个杠杆,那我们将很可能获得一个全新的视角


一名AI制药初创的研发人员发现,AI给人的感觉就像一个孩子一样——经常出错,但也能带来惊喜。“最近我们跟一个临床的合作方在做一个类似于自免罕见病的项目。对方问:如果给你患者的血液样本,你能不能分析它特定负极的bcr组库,然后去反向找自免抗原?理论上,因为人体内的蛋白是已知的,如果用高通量的结构和亲和力模型去做的话,是有机会的。我们就用AI试了试,最后给他推荐了4个。结果昨天他告诉我,其中一个挺有希望的。”


长期和AI打交道的经验告诉这名研发人员,任何时候都不能高兴得太早。但只要有耐心,AI就能不断在错误中爬起来、成长起来。


“之前我们用全人源的小鼠筛了一个相对复杂的靶点,是非特异性结合。我们就用AI去优化了一下,明显发现它在od450的层面的比值下降了很多,相当于我获得了一个推荐结合的靶点。但后来测试的时候,才发现它没有blocking function。”她回忆道,“后来我们大概又迭代了两轮,这样就把分子拿到了,就最终结果而言还是好的。“


在这名研发人员看来,目前AI制药最受诟病的一点,就是没法一步到位地实现目标,这背后涉及的是对其商业效率的焦虑。“在没有找到正确路径之前,一切都有可能发生,甚至有可能会出现迭代以后数据准确性下降的问题。而生物验证那边的反馈又很慢,效果好不好需要做上15天的实验才能知道结果。”


在AI制药方兴未艾、势单力薄的当下,大部分企业在面对药企客户时并不具有议价权。业内人士称,和AI制药初创合作的药企,大部分也都是抱着“玩票”的心态,“象征性地”给一些合作款项。


总体而言,AI制药的服务报价低、周期长,作为一款提供灵感的玩具而言,它显得实在太奢侈了;而它什么时候能升级为一款成熟的工具,还得依靠“玩”出来的思路和可能性——这也正是AI制药行业目前感到矛盾的地方。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/156193
 
250 次点击