社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

江南大学陈坚团队刘龙组Adv Sci|基于多组学与机器学习的枯草芽孢杆菌全基因组代谢模型优化基因表达与细胞生长预测

遇见生物合成 • 10 月前 • 582 次点击  

01


遇见/摘要

近日,Advanced Science 在线发表了江南大学未来食品科学中心和生物工程学院陈坚院士团队刘龙教授课题组的研究成果“A multi-omics, machine learning-aware, genome-wide metabolic model of Bacillus subtilis refines the gene expression and cell growth prediction” (Bi et al., Advanced Science. 2024. 2408705)。江南大学2020级博士生毕心宇为论文第一作者,刘龙教授为论文通讯作者。 

02


遇见/内容

微生物的系统研究涉及从低通量的原位测序到高通量的质谱分析,而实验操作、样本来源和生物变异性会导致数据的差异性。机器学习为多组学数据的分析和预测提供了重要工具,特别在基因组规模代谢网络模型的构建中发挥了重要作用。然而,许多机器学习模型忽视了生物背景,限制了模型的可信度和解释性。

针对上述问题,该研究标准化建立了枯草芽孢杆菌高质量综合数据库,并搭建了枯草芽孢杆菌多组学综合代谢网络模型,设计了34个机器学习模型,将机器学习模型与多组学综合代谢网络模型相结合,实现了基因表达与细胞生长的精准预测。首先,手动收集了多个数据库和大量文献中的枯草芽孢杆菌组学数据,并建立了数据标准化策略,以消除实验条件和分析方法的系统性偏差,从而搭建了一个包括基因表达、转录调控、信号转导、蛋白翻译和细胞生长的标准化数据库(1图2)。其次,基于此构建了iBsu1209-ME模型,该模型涵盖了细胞所有主要代谢途径、基因转录、蛋白翻译、大分子修饰和转运反应,模型准确预测细胞生长速率和代谢途径的基因表达水平(图3)。随后,为完善iBsu1209-ME模型数据,选择五种超参数优化算法和四种机器学习框架,建立了34个机器学习模型,通过与湿实验数据对比,BOLSTM模型和ACOCNN模型分别实现了基因转录数据和蛋白翻译数据的精准预测(图4)。与此同时,提出了 HDMPPK特征工程框架,相比传统算法,HDMPPK框架在精简数据库的同时提取了原数据库的全部特征(5)



枯草芽孢杆菌多组学数据库的构建与分析



基因调控数据集的可视化和置信度分析



iBsu1209-ME的构建与分析



多组学机器学习模型的构建和分析



特征工程提取数据集的功能分析


为全面理解基因表达对细胞生长的影响,在上述研究基础上构建了基因转录和蛋白翻译的集成回归模型。通过该模型成功预测了BsuMAC表达数据集中496个基因表达谱下的细胞生长速率,并优化iBsu1209-ME模型的转录和翻译模块,重建了EM_iBsu1209-ME。对比688个细胞生长相关基因的预测水平,EM_iBsu1209-ME的预测准确率达到87.9%,比iBsu1209-ME提高了46.7% 。此外,在12种不同培养条件下,EM_iBsu1209-ME的细胞生长速率预测值与实验数据高度相关(PCC=0.77)(图6)


6 EM_iBsu1209-ME集成模型构建及优化


总之,该研究为全面探索枯草芽孢杆菌的基因型-表型关系、指导细胞定向进化、探索未知的细胞过程提供了宝贵的数据支持。同时,这项工作为其他微生物的数据挖掘和模型开发提供了技术解决方案。

上述研究工作得到了国家重点研发计划(2020YFA0908300)、国家自然科学基金(3207008532021005)等项目的资助。

03


遇见/致谢

感谢刘龙教授课题组对本号的支持,感谢该课题组提供本文稿件支持!

往期精选▼

1. 江南大学陈坚团队刘龙组Nat Comm|可编程多功能无膜细胞器的从头设计与应用

2. 江南大学陈坚团队刘龙组NAR | 基于dCas12a的双功能多靶向碱基编辑器的设计创制及其介导的基因组多重原位诱变

3. 江南大学刘龙团队Trends in Microbio│基于基因线路的代谢流优化

4. 江南大学陈坚团队刘龙组Adv Sci | 利用DBTL框架重塑磷酸酶底物偏好性以实现N-乙酰氨基葡萄糖高效生物合成

5. 江南大学刘龙组Nat ChemBio|CRISPR/dCas12a级联基因回路介导的多途径组合优化

遇见生物合成

合成生物学/天然产物生物合成

姊妹号“生物合成文献速递”

谢谢支持,我们需要您的一个“在看”

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/174475
 
582 次点击