Py学习  »  机器学习算法

《自然》子刊:推动精准抗癌药物的研发,哪些机器学习方法更好?

细胞与基因治疗领域 • 8 月前 • 219 次点击  
近期,上海科技大学信息科学与技术学院郑杰课题组与合作者在《自然·通讯》(Nature Communications)发表了题为“Benchmarking Machine Learning Methods for Synthetic Lethality Prediction in Cancer”的研究论文。文章通过设计多个场景系统性比较了12种最新的机器学习方法在合成致死(Synthetic Lethality, SL)抗癌药物靶点预测中的表现。该研究为科学家提供了详尽的指南,帮助他们选择最适合的SL预测工具,从而推动精准抗癌药物的研发。


合成致死(SL)是一种基因之间的遗传相互作用关系,即当两个基因同时发生突变或扰动时会导致细胞死亡,而单个基因被扰动并不会产生这一效果。这一特性使SL成为一种有潜力的癌症治疗策略,因为通过靶向癌症特异性突变基因的合成致死伙伴基因,可以杀死癌细胞而不影响健康细胞的生存。尽管SL现象已经被发现超过一个世纪,但其实际应用仍然面临挑战,尤其是在快速、精准地识别与癌症相关的SL基因对(SL gene pairs)方面。

为了加速实验筛选并降低其成本,近年来,越来越多的研究人员应用机器学习技术来预测SL基因对。这些方法通过使用大量生物学数据,快速筛选出潜在的SL相互作用关系,以缩小实验验证的范围。然而,尽管已经提出了多种机器学习模型和算法,它们在不同情境下的性能缺乏系统性评估,这给研究人员在实际应用中选择合适的人工智能工具带来了困扰。

为填补这一空白,信息学院郑杰团队与合作者系统性地评估了12种最新的机器学习方法,涵盖了从传统机器学习到深度学习的多种算法。研究人员首先收集并建立了一个基准测试数据集,设计了多个不同的实验场景,包括3种数据划分方式,4种正负样本比例和3种负样本采样方法,从而评估这些模型在多种场景组合下的分类和排序候选SL基因对的能力(图2)。通过对比各种模型,研究团队发现,数据质量的提升,比如负样本的优化,对所有方法的表现均有显著提升。
 
基准研究的数据集构建以及场景设计(图片来源:原始论文[1])

在所有评估的方法中,SLMGAE(SL prediction with Multi-view Graph Auto-Encoder)算法表现总体最佳。然而,当在面对更加复杂的实际应用时这些方法均存在一定的局限性。特别是在“冷启动”测试中——即当模型在从未见过的新数据集上进行测试时,所有方法的表现均有所下降。此外,对于特定癌症背景下(例如细胞系特异性的SL预测任务),模型的预测准确度和泛化能力也有待进一步提升。

这些基准测试的结果不仅为科学家提供了选择SL预测方法的实用指南,还揭示了当前机器学习方法在实际应用中的瓶颈和不足。这为未来研究开发更加精准、可靠的SL基因对预测工具提供了宝贵的参考,为合成致死抗癌药物领域的研究人员提供了重要的数字资源和见解,从而有助于加速癌症靶向治疗的发展。


上海科技大学信息学院与临港实验室联合培养的2022级博士研究生冯艺苗(郑杰课题组)为该论文第一作者,新加坡科学技术研究局生物信息学研究所助理研究员龙亚辉,上海科技大学信息学院研究员李权,信息学院两位硕士研究生王鹤、欧阳阳(李权课题组)参与了本课题的研究。上海科技大学信息学院研究生毛伟帆、岳臻、陶思宇和杨扬为本工作的完成提供了帮助。上海科技大学图信中心和宁夏西云算力科技有限公司为本工作提供了算力支持。该工作最初依托于CS286 (AI for Science & Engineering)的课程项目。新加坡科学技术研究局信息通讯研究所首席科学家吴敏和上海科技大学信息学院研究员郑杰为论文共同通讯作者。上海科技大学为第一完成单位。

E.N.D

往期文章推荐:

15亿美元!罗氏收购一家细胞与基因治疗公司

百万元一针的细胞治疗产品到底贵在哪

iPSC衍生CAR-T细胞治疗红斑狼疮Ⅰ期临床数据发布

南方医科大学附属珠江医院血液科总结的CART细胞疗法“珠江方案”,助力患者高质量治愈

合肥国资委再出手!这家聚焦NK细胞领域的创新免疫药企获新一轮融资

乔治·丘奇团队开发mRNA抗衰疗法,让皮肤“返老还童”

聚焦细胞与基因治疗领域,国内一研发与产业基地落成启用

一家AAV基因治疗公司被收购

石药集团启动系统性红斑狼疮CAR-T细胞疗法Ⅰ期临床试验

商务部:前瞻布局细胞和基因治疗等重点产业,支持苏州工业园区开展生物医药全产业链开放创新试点

突破实体瘤限制,最新《Nature》发布CAR-T攻克致命脑瘤临床试验结果

CDE发布《细胞治疗产品临床药理学研究技术指导原则(试行)》

全球已上市58款基因治疗药物,基因治疗即将步入高速发展期

广东一生物科技公司正式开业,聚焦细胞与基因治疗领域

荣泽集团完成数千万元战略融资,推进细胞与基因治疗等创新药开发

突破AAV载荷限制,《Science》发表关于StitchR™ RNA组装技术及治疗肌营养不良症应用的研究

全球首款获批Ⅰ期临床的体内CAR基因疗法完成首例患者给药

总投资约30亿元,建筑面积10万平米,国内一细胞治疗药物研发与生产基地正式开工

全球首款TIL细胞疗法半年营收6.4亿,预计全年超11亿

全球首个针对1型糖尿病的干细胞疗法迈进3期临床
收购价约1.87亿元,东北制药将正式收购国内一细胞治疗企业70%股权
官方发文!干细胞外泌体不作为医疗器械管理
世界首创!邦耀生物治疗红斑狼疮非病毒定点整合PD1-CAR-T疗法国内获批临床
聚焦CGT等细胞产业,国内一家细胞科技公司正式开业
上海发布三年行动方案,持续支持细胞与基因治疗、核酸药物、脑机接口等前沿领域创新研发(附政策解读)
广州发布新政,重点推进抗体药、疫苗、细胞与基因治疗、重组蛋白与多肽等产业化进程
CDE发布细胞与基因治疗领域慢病毒检测共性问题与技术要求
全球首个环状RNA药物获FDA新药临床试验许可
西湖生物全球首创红细胞免疫疗法取得突破性进展
石药集团首款基于mRNA-LNP的CAR-T细胞疗法(SYS6020)再获新适应症临床试验批准


声明:内容来源于复旦大学,本文旨在知识共享,所有内容仅供参考,不构成任何建议。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/176327
 
219 次点击