Adv Sci 封面论文丨伯晓晨/何松团队综述机器学习赋能药物毒性预测的前沿进展

药物研发过程中，毒性问题是难以逾越的障碍之一。数据显示，约30%的候选药物因毒性风险被迫终止，导致巨大研发成本浪费，也给患者安全带来隐患。传统毒性评估方法主要依赖动物实验，但由于成本高、耗时长，且动物与人类的生理差异可能导致结果不准确，这一方法存在诸多局限。人工智能（Artificial Intelligence，AI），特别是机器学习（Machine Learning，ML）技术，为毒性预测提供了全新的解决方案。

近日，军事医学研究院伯晓晨/何松团队在国际期刊 Advanced Science 发表了一篇题为Machine Learning-enabled Drug-induced Toxicity Prediction 的综述论文，系统总结、评价了ML技术在药物毒性预测领域的最新进展，展示了如何通过多模态数据整合与创新算法设计，重新定义药物毒性评估方法，并入选封面文章（Inside Front Cover）。这项研究是继毒理学综合数据库TOXRIC（Nucleic Acids Res 2023），变分图自编码器在药物毒性预测中的应用（Nature Machine Intelligence 2024）和基于主动学习的突变毒性预测（Commun Biol 2024）之后，也是在由伯晓晨研究员等发起的中国毒理学会人工智能毒理学专业委员会组建成立之际，团队在人工智能赋能药物毒性解析方面的又一新的成果。

ML模型能够从多种数据源中提取特征，将其转化为可用于毒性预测的数值信息。研究团队提出了一个综合框架，将毒性数据、化合物数据与多组学数据（基因组、蛋白质组、代谢组、单细胞测序等）整合，构建ML管道。从原始数据的预处理到模型拟合、超参数优化，再到标准化指标评估，每一步都经过严格设计，以确保预测结果的准确性和可解释性。相较于传统的毒性测试方法，这种数据驱动的ML策略极大减少了对体内实验的依赖，使毒性预测更高效、经济，并能在临床试验前识别潜在风险，加速药物开发。

研究团队深入分析了不同类型毒性的ML建模策略，将药物毒性分为四大类十个具体类别：急性与临床毒性、致癌性、器官特异性毒性（肝毒性、心脏毒性、肾毒性、呼吸毒性、神经毒性），以及细胞和分子毒性（血液毒性、线粒体毒性）。不同毒性类型的生物学机制各异，因此需采用不同的ML模型加以应对。例如，在急性毒性预测中，传统的随机森林（Random Forest, RF）模型表现优异，而在心脏毒性预测中，图卷积网络（Graph Convolutional Networks, GCN）因能有效处理复杂蛋白质交互网络数据，在评估药物对心脏电活动的影响时展现出更强的适用性。值得注意的是，ML不仅是一个强大的预测工具，还能通过可解释性算法揭示毒性机制。研究团队分析了SHAP（Shapley Additive Explanations）、LIME（Local Interpretable Model-agnostic Explanations）等技术，量化分子特征对毒性预测结果的贡献，从而帮助科学家识别导致毒性发生的关键因素，为药物研发提供更深入的机制洞察。

ML的成功离不开高质量数据库的支持。近年来，多个毒性数据库的构建为研究人员提供了宝贵的数据资源。研究团队总结了55个数据库和12个分析工具，并根据功能将数据库分为四大类：毒性数据库、化合物数据库、组学数据库和基准数据库。其中，Tox21和ToxCast数据库涵盖了数万种化学物质的毒性数据，为ML模型的训练提供了丰富的数据支持；PubChem和ChEMBL等数据库则专注于化学分子结构和生物活性信息，对药物建模至关重要。在工具方面，研究团队开发的TOXRIC数据库（Nucleic Acids Res 2023）已得到广泛认可，其包含多种毒性类别的数据，并提供直观的可视化分析功能。此外，ProTox-II、ToxIBTL、ADMETlab等在线工具降低了ML毒性预测的技术门槛，使非AI背景的科研人员也能便捷地开展毒性分析。

尽管机器学习（ML）在毒性预测中展现出巨大潜力，但仍面临四大核心挑战：毒性数据稀缺、数据质量不高、不同毒性类型所需模型的差异性以及可解释性不足。为了解决这些问题，研究团队提出了一系列前瞻性解决方案：

首先，毒性数据的稀缺是当前的主要瓶颈，尤其是在神经毒性、线粒体毒性等领域，影响模型训练效果。整合多组学数据、数据增强（如SMILES变换、图数据增强）、预训练模型、主动学习优化数据采样、元学习提升小样本适应能力，以及联邦学习（Federated Learning，FL）实现跨机构数据共享等方法可提高数据量，增强模型的泛化能力和预测准确性。

其次，高质量数据的稀缺和整合多源数据集的挑战限制了 ML 的应用。采用数据清理、质量控制、全球数据格式的标准化、FL、多模态ML、迁移学习（Transfer Learning，TL）、零样本学习（Zero-shot Learning，ZSL）和集合方法等关键策略，可以有效提升数据质量和整合多源数据的能力，进一步提高预测的准确性和可靠性。

第三，不同毒性类型的机制各异，例如急性毒性与器官特异性毒性，需针对不同类型定制特定的ML模型。深度学习（Deep learning，DL）技术，如图神经网络（Graph Neural Networks，GNN）和Transformer，可捕获更复杂的非线性关系，同时建立标准化基准数据库（如TOXRIC、TDC、MoleculeNet）能够进一步提升模型可比性。

最后，ML模型的“黑箱”特性使其决策过程难以完全理解，影响其在临床和监管层面的应用。可解释性算法的引入，如SHAP和LIME等，以及知识图谱等新兴技术，能有效提升ML模型的透明度，使其更易被临床和监管机构接受。

从预测药物毒性到揭示其机制，ML正重塑药物研发的未来。尽管仍有挑战，但这项技术的前景广阔。随着数据、算法和工具的不断优化，ML有望助力更安全、更高效的药物开发，推动精准医学和个性化治疗的发展。天津大学博士生白长森、武连莲为本文共同第一作者，军事医学研究院伯晓晨研究员、何松副研究员、曹洋副研究员为共同通讯作者，李睿江博士也为本研究做出了重要贡献。

原文链接：http://doi.org/10.1002/advs.202413405

伯晓晨研究员/何松副研究员课题组一直致力于利用生物医学大数据与人工智能的多种计算模型研究癌症等复杂疾病的致病机理和药物治疗方案，在Nature、Nature Biotechnology、Nature Microbiology、Molecular Cell、Nature Machine Intelligence、Nucleic Acids Research、Genome Biology和Advanced Science等杂志发表多篇论文。

课题组长期招收硕士、博士研究生及博士后，欢迎感兴趣的同学加入或来函咨询。

简历投递（有意者请将个人简历等材料发至）：

https://jinshuju.net/f/ZqXwZt或扫描二维码投递简历