社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

SARS-Cov-2变异病毒预测正确率100%!华人学者用深度学习预测冠状病毒大流行|Infect Dis Poverty

科研圈 • 3 年前 • 507 次点击  

本文来自“BMC科研永不止步”,文章仅代表作者观点,与“科研圈”无关。


动物源冠状病毒大流行风险的早期预测对于疾病防控具有重要意义。近日,广州大学计算科技研究院寇铮课题组联合厦门大学计算机学院刘向荣课题组在 Infectious Diseases of Poverty 上发表研究论文 Prediction of pandemic risk for animal-origin coronavirus using a deep learning method (DOI: 10.1186/s40249-021-00912-6)。该研究将深度学习模型应用于动物源冠状病毒大流行风险预测,以卷积网络和循环神经网络提取病毒基因组特征并计算远程关联,评测结果显示该方法具有良好的预测效果。

冠状病毒现状

截至2021年10月20日,全球已报道COVID-19确诊病例约2.4亿,死亡人数接近500万。目前已报道七种可感染人的冠状病毒:人冠状病毒 (HCoV) 229E、 OC43、NL63 和HKU1;严重急性呼吸综合征冠状病毒(SARS-CoV和SARS-CoV-2);中东呼吸综合征冠状病毒(MERS-CoV)。冠状病毒可以从蝙蝠、果子狸、穿山甲、骆驼和禽类等动物样品中分离得到。作为动物源病原体,冠状病毒可以跨越种属屏障感染人,从而导致人际间大流行。

模型构建与性能评测

基于公共数据库中的3257条冠状病毒全基因组序列,作者采用一维卷积网络串联门控循环神经网络的深度学习模型预测大流行早期风险。为了提高预测精度,将预训练表示向量和预测向量注意力机制也加入到模型中。该预测模型可将病毒基因组序列作为整体输入使用,分析流程包括五个主要步骤:病毒基因组分割、字符串序列内嵌向量的生成、一维卷积特征提取、循环神经网络和注意力机制。


研究结果显示,六类病毒类群的特定模型取得了非常好的预测结果(AUROC为1.00,AUPR为1.00),但病毒类群之间的泛化能力较差,不具有迁移能力。作者进一步构建联合预测模型,解决了泛化能力差的问题(AUROC为1.00,AUPR为1.00)。作者进而对模型构建方法作了比较,如果去除预测模型中的预训练表示向量或者注意力机制,预测评价指标会有明显下降,幅度在5%-25%之间,说明预训练向量和注意力机制对于预测性能非常重要。该研究也测试了联合模型的迁移预测能力,结果表明联合模型对六个病毒类群有很好的迁移学习能力(平均值,AUROC为0.968,AUPR为0.942),可用于潜在新型病毒的预测。该研究同时构建人工阴性数据,以强化病毒刺突蛋白的预测权重,预测结果达到了100%的正确率。最后,作者基于Python编程语言构建可大规模使用的预测软件,开源属性方便该模型的广泛使用。


结论与展望

该研究使用预训练表示向量和注意力机制,构建了一种动物源冠状病毒大流行风险预测模型。作者用创建的预测方法,分析2020-2021年持续报道的SARS-Cov-2变异病毒,可达到100%的预测正确率,显示该方法对于变异病毒的稳健性。虽然该预测方法简便,但作者也提到预测结果的可解释性需要进一步研究和关注,利于冠状病毒跨种感染分子机制的理解。

 Infectious Diseases of Poverty

doi:10.1186/s40249-021-00912-6

Infectious Diseases of Poverty

Infectious Diseases of Poverty《贫困所致传染病(英文)》致力于发表贫困所致传染病、新发/再现传染病等相关跨学科高水平论文,为卫生政策制定提供科学依据,为创新理论和技术研究提供交流平台。该刊入选中国科技期刊卓越行动计划,在《2020年中国科学院文献情报中心期刊分区表》中位列全球医学大类一区期刊(TOP 5%),被评为2020年中国最具有国际影响力学术期刊。


Citation Impact

4.52 - 2-year IF
4.307 - 5-year IF

Usage

1,226,313 Downloads

935 Altmetric Mentions

Speed

18 days to first decision for all manuscripts

107 days from submission to acceptance

22 days from acceptance to publication

点击“阅读原文”阅读论文原文

Prediction of pandemic risk for animal-origin coronavirus using a deep learning method

BMC是施普林格∙自然旗下机构。作为开放获取出版先锋,BMC不断推出一系列高质量的同行评议期刊,包括BMC Biology 、BMC Medicine等涵盖范围较广的期刊,以及Malaria Journal、MicrobiomeBMC系列期刊等专门刊物。BMC以“科研永不止步”为信条,致力于不断创新,以更好地满足作者群体的需要,确保所发表论文的完整性,并积极推广开放研究。


备注:本文来自“BMC科研永不止步”,凡本公众号转载、引用的文章、图片、音频、视频文件等资料的版权归版权所有人所有,如因此产生相关后果,将由版权所有人、原始发布者和内容提供者承担,如有侵权请尽快联系删除。


点个“在看”,下次更新不错过⇣⇣

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/122861
 
507 次点击