社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

不止AlphaFold,「药界ChatGPT」横空出世!华人女投资人深度揭秘

新智元 • 3 月前 • 239 次点击  



  新智元报道  

编辑:KingHZ
【新智元导读】还在质疑AI生物制药「纸上谈兵」?Chai-2已经把抗体设计成功率从0.1%提升到16%,而且还是零样本!不仅是技术奇迹,这更是范式革命:下一代药神,可能不是生物学博士,而是提示词工程师。

AI药神来了?

不仅可以零样本生成新抗体,还将成功率提升百倍——达到16%!

最近,AI初创Chai Discovery宣布:

分子设计模型Chai-2正在重构药物设计逻辑。


如果说结构预测是生物界的ImageNet,那么Chai-2就是生物界的Midjourney。

在关注AI投资的博客节目「No Priors」(零先验)中,Chai Discovery的联合创始人Josh Meier和Jack Dent分享了AI+生物医药的趋势。

主持人是华人郭睿( Sarah Guo)。她专注于对卓越科技初创企业进行早期风险投资。

他们认为这不仅是一次效率革命,更是一次科学方法的范式转变——从实验室试错到AI主导生成,全新的生物科技时代正加速到来。

生物学的生成提示时代,或许正在逼近:以后,「动动嘴」就能造生物医药💊!

10年后,哈佛室友再携手

从大学时代,联创Josh Meier(下图左)和Jack Dent(下图右)就是好朋友。

在哈佛时,他们既是室友也是同学,大学都攻读计算机科学,而Josh还兼修了化学。

毕业后,他们虽然各奔前程,但始终保持着联系:每三到六个月,他们就会交流一次,Josh就和Jack分享他的研究。

毕业后,Jack Dent一直从事软件开发。创业前,Jack做到了美国在线支付公司Stripe的核心工程与产品负责人。

那是什么让Jack Dent选择转战抗体设计?

一切缘于Josh的深度交流,Jack终于明白他们不是在做「玩具」,而是在改写整个行业。

一旦知道未来人类能「以原子级精度」设计分子,就再也无法忽视这种机会。

Jack说:「相比之下,其他项目都显得不那么重要。」

为何要啃药物设计这个「硬骨头」?

过去十年,AI药物设计始终停留在研究层面,鲜有药物真正上市。

为什么他们决定投身AI药物设计?

Josh表示,这是经过深思熟虑的「押注」:

过去,我们也心动过,但当时技术离产品化还太远,不是创业的好时机。

但你不能等技术成熟再创业,那时机会窗口可能早没了。

最佳时机就那么一到两年,机不可失,时不待我。

首先,他们押注结构预测、蛋白质折叠的技术会大幅进步

2022年,谷歌带来了突破性模型——AlphaFold 2。

这基本上解决了蛋白质折叠问题。

论文地址:https://pmc.ncbi.nlm.nih.gov/articles/PMC8371605/

开源地址:https://github.com/google-deepmind/alphafold

但AlphaFold仍局限于预测蛋白质结构,无法处理分子间复杂的相互作用,而这正是药物设计的关键。

其次,他们押注在扩散模型和LLM的突破,能把结构预测推进到新的高度。

基本上,上一代的结构预测模型只能预测蛋白质的一种构象,也就是蛋白质的一种「视图」。这有点像早期的图像模型,还没有扩散模型,它们无法生成多样化的结果。

他们认为,生成能力也将影响药物发现和蛋白质折叠领域。

更重要的是,他们的理念不是实验室模型,而是打造可移植、通用的AI平台。

Chai的愿景是让生物从「科学」变为「工程」,而强大的通用平台是关键。

抗体设计模型Chai-2=分子版Midjourney?

那模型到底是怎么工作的?

AI药物设计的第一块拼图是结构预测

一开始,他们就打造了自己的预测引擎Chai-1,并开源给了全行业。

它就像原子级的显微镜,让大家看到蛋白质在三维空间中每一个原子的排布。

论文链接:https://www.biorxiv.org/content/10.1101/2024.10.10.615955v2

项目链接:https://github.com/chaidiscovery/chai-lab

下一步是去移动这些原子,改变序列,然后观察这些改变的影响。

从高层次上看,抗体设计模型是这样的:

向它提供一些信息,比如抗体的目标靶点;

然后,为了满足约束条件,模型会尝试将原子放置在三维空间中不同位置。

研究人员可以直接告诉模型:「这是目标蛋白,我想要你生成可以与之结合的分子。」随后,Chai-2模型既能生成蛋白质序列,同时也能生成它的3D结构,而且能与该靶点结合。

论文链接:https://chaiassets.com/chai-2/paper/technical_report.pdf

直觉地说,结构预测好比图像领域的ImageNet。

在结构预测中,模型要从蛋白质序列预测其三维结构,这有点像分类任务。

而分子设计,则更像是生成式任务,好比Midjourney用于图像生成;基于已有的原子布局,生成与之互补的新原子排列。

好比是「锁与钥匙」:蛋白质靶点是一把锁,而你要用生成模型设计出适配的钥匙分子。

而且,在整体结构误差上,AI预测结构的误差经常小于一个原子。这就是Chai-1被称为原子级显微镜的原因。因为如果你无法看清锁的形状,又如何去设计钥匙呢?

行业革命:真正的「零样本」

类似大语言模型,Chai-2也涌现了类似「词汇」之类的概念性结构。

也许,蛋白质之间的相互作用规律,早已嵌在数据中。而Chai-2能够将这些规律泛化到全新的领域。

也就是说,模型不是「域内泛化」:Chai-2没有见过测试靶点和对应的结合配体。

在论文的补充材料中,研究团队展示了一张图,进一步验证了这一点。

在测试中,Chai团队专门排除了训练集里可能见过的序列。在抗体结构数据库SAbDab中,研究者把训练集中相似度超过70%的序列一律剔除。

抗体结构数据库SAbDab每周更新数据。所有结构均标注多项属性,包括:实验细节、抗体命名(如重链-轻链配对信息)等

最终得到一批对模型来说「全新」的任务。而模型的成功率几乎没有下降,表现稳定。

这说明模型并不在乎传统生物学上的分类方式。这就是团队对模型所学内容为何如此激动的原因之一。

这是真正的「零样本」,让抗体设计成功率从0.1%飙升到20%。

几个月前,人们无法想象AI能一步到位生成可用抗体。但现在它做到了。

类似这样革命性的突破,上一次是在20世纪70年代,当时一系列新技术改变了行业。

通过这种方法,团队真正说服了自己,也说服整个科研界:Chai-2确实有效。

在未来5到10年内,他们认为这能够发现一整类全新的分子,解锁全新的靶点,打开全新的市场,为患者带来前所未有的治疗手段,真正治疗那些此前无药可治的疾病。

总体来看,AI社区的反馈也非常积极。在发布后的几小时内,早期接入申请就涌入了数百人请求。因为团队规模很小,他们目前只好优先安排合适的早期合作对象。

他们认为:「单靠一家公司,绝不可能覆盖所有靶点和疾病。」

目前,AI设计的抗体已足够惊艳,但还需大量实验验证,包括毒性、药代动力学、制造成本等等。

所以,为了建立真正的商业「护城河」,他们正在扩大团队,实现两大目标:

第一,把AI输出的「抗体初稿」转化为真正的「候选药物」。

第二,直接「零样本」生成完整药物候选分子。

旧范式被颠覆
「动动嘴」就能设计新药物?

Chai团队的一个重要判断是:未来最强的抗体工程师,很可能不再是传统生物学博士,而是「分子提示词工程师」。

Josh解释说:「Chai-2不只是一个模型,而是潜力巨大的工具。 但是要释放潜力,需要精心设计提示词(prompting)。」

一年之内,他们将抗体设计的成功率从不足0.1%提高到了接近20%。

所以如果放眼未来25年,那么为什么不能在来年里把它提高到50%,甚至接近100%呢?

比如最近在迷你蛋白(mini-protein)方面的成果,在五个不同的靶点上的测试,所有靶点都成功了,70%的设计方案在实验中奏效,并具有极强的结合能力。

未来,甚至其他类型的分子也完全可能达到类似的成功率。

一旦拥有了这种能力,就真的进入了「分子计算机辅助设计」的时代——

就像机械工程有SolidWorks,创意设计有Photoshop一样,生物学也将拥有完整的软件工具套件

一旦能够在原子和分子的层面进行设计、编程和理解它们之间的相互作用,其影响之深远确实令人振奋。

AI如何真正改写生物医药?

在论文中,他们的提示词由程序自动生成,但未来真正应用在药物开发场景里,科学家需要精准定义目标。

这些情况会让提示词(prompt)变得更加复杂,也意味着需要真正合适的AI产品。

当开始在实验室进行这些实验时,我们希望模型能从结果中学习,然后参与下一轮设计,真正像助手那样参与整个流程。

这不仅是模型问题,更是流程革命。

那些从业30多年的抗体工程师,已经习惯用某种方式进行药物发现。

现在出现了全新的范式,这本身就是一个需要公司投入解决的问题。

这是AI药物设计的真正门槛:最大的阻力,不是技术,而是观念和流程的惯性

最兴奋的,往往就是这些抗体工程师和生物学家。

目前,他们的工作非常繁琐,而且回馈周期很长、问题又很难解决。他们非常渴望找到更好的方法。因为这意味着可以把更多时间用在系统设计、架构设计,或者打造更复杂的产品上。

现在,人们才刚刚开始真正思考这种工具能实现什么。

从科学到工程
从梦想到现实

AI正在让「药物设计」这件事,从靠运气、拼资源的科学探索,转向「可复制、可放大」的工程流程。

过去10年,AI在生物领域始终被质疑为「纸上谈兵」;但从今天开始,它或许真正进入临床、进入实验室,进入每一个生物工程师的工具栏。

生物,不再只是「发现」;它开始走向「制造」。

参考资料:
https://x.com/vitrupo/status/1940791836429504791 
https://www.youtube.com/watch?v=rFFi2Guv2nU 
https://open.spotify.com/episode/1pC5wDz5ta9OwpRgIRO6fe

图片


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/184262