社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

Trends in Plant Science | 中国农业大学王向峰:机器学习技术加速植物精准设计育种

植物科学最前沿 • 2 年前 • 671 次点击  





















种子被誉为农业的“芯片育种科技创新是推动农业发展的核心动力。未来植物育种的新范式基因组学、基因编辑、合成生物学等生物技术(BT)与数据科学、机器学习人工智能等信息技术 (IT)的多元化融合。农业农村部“十四五”规划将“智慧种业”列在“智慧农业”领域七大攻关任务之首。任务中明确提出:构建数字化育种平台,探索基因型到表型的“智能育种技术体系”,加快经验育种精确育种转变的攻关目标

近日,Cell旗下的植物科学领域顶级综述类期刊Trends in Plant Science(影响因子23.1)在线发表了中国农业大学分子设计育种前沿科学中心、国家玉米改良中心王向峰教授与闫军副教授共同撰写的特邀综述:“Machine learning bridges omics sciences and plant breeding该综述准确定义了“精准育种”的含义,并将“精准设计育种(Precision-designed breeding)”划分为“知识驱动的分子设计育种(Molecular design breeding)”与“数据驱动的基因组设计育种(Genomic design breeding)”。论文重点阐述了机器学习技术如何将“知识”与“数据”转化成为育种服务的驱动力,以及如何为基础研究与育种实践之间建立桥梁,加速实现植物领域的精准设计育种。

最近几十年,植物生物学基础研究产生了大量新的知识和数据,这些知识与数据最终将为植物育种与性状改良而服务。然而,实现植物精准设计育种的终极目标,还需要解决当前植物基础研究与育种实践脱节的问题。作为人工智能的一个分支,机器学习技术因其在整合复杂多变的生物学知识和组学大数据方面的卓越能力而得到广泛应用。

图1. “知识”与“数据”驱动的精准设计育种。

机器学习主要可以通过两种途径在基础研究和育种实践中建立桥梁图1。一种途径是从植物生物学的基础研究中认识基因功能和调控机制,从而实现知识驱动的分子设计育种。在明确性状调控基因的功能后,通过分子标记辅助选择、有利等位基因的多基因聚合基因编辑与合成生物学等技术,对植物品种进行定向改良图1A。另一种途径是直接将机器学习技术应用于商业育种管线,构建各种预测模型和决策算法,从而实现数据驱动的基因组设计育种图1B

这两种途径在现代商业化育种管线中相互结合并发挥着重要作用。现代育种管线的选择取决于与性状相关的基因或位点的数量:对于主要由遗传背景决定的数量性状,如产量、生物量环境适应性等性状,通常采用数据驱动模型来推断表型与全基因组标记之间的相关性;对于由遗传前景决定的多基因性状,如抗病、品质等性状,必须首先明确性状调控基因的分子 功能及作用途径才能多个基因的优良等位变异精准聚合;对于单基因性状而言,应用基因编辑是人工制造突变,则是性状改良的最佳快捷方式。事实上,只要在植物生物学和育种方面积累了足够的知识数据,机器学习技术便可以发挥功效以推动植物精确设计育种目标的实现。

图2. 各类机器学习算法在植物多组学研究中的应用

论文首先介绍了现代机器学习技术的主要类型(包括监督式学习、半监督式学习、非监督学习、深度学习等)与最新进展;其次,综述了如何将现代机器学习算法应用于高维多组学数据降维、基因调控网络推断、多组学数据关联分析与基因挖掘,以及候选基因的优先级决策等植物学基础研究中;再次,介绍了基于半监督学习框架的深度学习算法在植物表型组学中的应用进展;最后,介绍了机器学习技术基因组选择辅助育种、基因型到表型预测,以及基因型与环境互作建模中的应用进展(图2)。在论文的结论与展望部分,讨论了目前机器学习和人工智能技术在植物研究中面临的挑战和潜在解决方案。

此外,本综述还提供了一个应用非监督学习案例,即:如何利用NMF非负矩阵分解算法提高玉米多组学数据关联分析的效率与基因挖掘的精度(图3)

图3. 案例:应用NMF降维算法提高基因挖掘的效率

论文通讯作者为中国农业大学分子设计育种前沿科学中心、国家玉米改良中心王向峰教授,第一作者为中国农业大学闫军副教授。王向峰教授智能育种技术相关研究得到了国家自然基金委面上项目“应用机器学习策略预测玉米杂种优势”、海南崖州湾种子实验室揭榜挂帅项目“建立玉米智能设计育种技术体系”,以及教育部分子设计育种前沿科学中心基本科研业务费的资助。

文章链接:

https://doi.org/10.1016/j.tplants.2022.08.018

作者简介

王向峰教授主要应用人工智能与机器学习技术开发玉米全基因组选择辅助育种模型、基因组优化设计育种模型、基因型与环境互作模型;开发玉米田间数据统计分析与育种信息管理系统,以及各种大数据驱动的育种智能决策软件;开发玉米多组学数据关联分析算法、大规模种质资源基因挖掘工具,以及各类生物信息软件与数据库。研究方向主要利用组学大数据从事玉米杂交育种理论、玉米杂种优势遗传互作机制、玉米基因组驯化、玉米适应性演化机制等方面的工作。曾在Genome Biology, Science Bulletin, Briefings in Bioinformatics, Plant Cell, PNAS, Trends in Plant Science, Plant Journal, Molecular Plant等国际知名期刊发表论文60余篇。实验室主页网址: https://ibreeding.org/

闫军副教授主要从事生物信息学交叉学科研究。近年来,主要围绕植物系统生物学中的若干问题,通过机器学习、人工智能和多组学数据分析等手段开展大规模作物种质资源挖掘、全基因组选择模型和多组学数据分析方法和工具的研究。在Trends in Plant Science, Genome Biology, Molecular Plant, Plant Journal, Bioinformatics, GPB等国际知名期刊发表论文10余篇。

科研服务(合作招商)


专利申请 | 转基因植株快速检测 | 组织培养 | 酵母双杂交 | 植物抗体 | 

植物科学最前沿,专注于植物科学前沿进展、资讯、招聘信息的发布及方法软件共享等投稿及招聘请后台回复“投稿”,均为无偿;商务合作请联系微信ID:zwkxqy ;



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/147569
 
671 次点击