Py学习  »  机器学习算法

PBJ 前沿综述 | 从植物表型高通量鉴定到基因型挖掘-机器学习(深度学习)将为作物育种带来一场巨大变革

植物生物技术Pbj • 3 年前 • 249 次点击  


随着人口数量的增加以及全球气候的剧变,农业生产正面临着巨大的挑战。大多数农作物的种植均需要特定的环境条件,不断育成适应复杂多变环境的作物品种对育种家而言显然难度极大。因此,开发新方法以加速选育高性能弹性作物品种的需求则显得尤为迫切。从分子标记的应用,到作物遗传修饰,再到近年来的基因编辑技术,作物育种方法在近几十年里发生了巨大的变革。然而,即使通过新的基因组测序和表型学技术产生了海量的数据,由于缺乏对复杂性状基因组的了解,这些方法的运用常常受到限制。


深度学习代表一系列机器学习方法,这于我们而言并不算陌生,近几年里机器人技术、智能汽车、智能家居和农业均采用深度学习而取得了重大进展。深度学习的突破并不是因为深度学习方法的巨大进步,而是由大标记训练数据可用性的不断增加以及计算硬件(尤其是图形处理器)的进步推动的。随着农艺表型和基因型数据的持续增加,未来有机会通过应用深度学习来加速作物育种和提高农业生产力。在图片识别领域,深度学习方法目前是最先进的,例如开发卷积神经网络来统计小麦穗和小穗,准确度高达95.91%和99.66%。在田间,通过使用空中无人机拍摄图像来准确统计莴苣数量并预测产量,而成本仅为人工计数的一小部分。另一个例子是SeedGerm,这种育种平台将经济高效的定制硬件实现与图形用户界面相结合,并将该图形用户界面使用三种不同的机器学习方法在生长室中自动对商业种子进行表型化。


除了图片识别外,很少有将深度学习应用到作物当中的例子。目前从基因型到表型的预测已被越来越多地运用到作物育种,由于数据交互的复杂性,对育种家而言仍具有相当大的挑战性。例如,DeepGS是一种卷积神经网络方法,从小麦基因库中取了2403份伊朗小麦地方品种进行训练,数据库中每个个体含有33709个DArT标记,每个单株用8种重要农艺性状进行表型评估,如籽粒硬度和株高。在使用DArT标记对这8种表型进行预测的过程中,DeepGS的预测准确性比最新的RR-BLUP方法提高了1%至65%。最近一篇报道在6个植物数据库中使用了类似于DeepGS的卷积神经网络方法,并结合了许多其他最新的机器学习方法,这些数据库囊括了391个玉米个体的332178个标记、5014个大豆个体的4420个标记,并包括每个物种的诸多表型,分别是株高、开花时间、产量、谷物水分、R8发育阶段所需时间、木材密度和站立性。6种线性和非线性方法,包括人工神经网络和卷积神经网络,用来测试其在表型预测上的准确性,但这些方法并没有一贯优于其他方法,这也就支持了在大批量工作中,机器学习专家需要考虑和评估多种不同的方法。同时,这些结果表明机器学习方法不仅不会取代熟练的植物育种者,相反,这些方法将支持其工作,使其更加准确和可靠。


农业深度学习发展的主要限制因素是合适的高质量标签数据的可用性。如上所述,深度学习方法需要数以万计的数据点,才能进行高度准确的预测。深度学习在某种程度上也容易受到看不见的条件的影响,因此需要尽可能多的在不同条件下的数据。尽管每年都会产生大量的基因组和表型数据,但主要都在数据孤岛中维护,并且缺少训练标签或没有整理标签。剩余的未标记数据可以由专家手动标记,也可以使用训练有素的机器学习解决方案来估算标签,但如果我们想要加速作物育种,则需要尽可能的不断地捕获、标记并联系大量数据,来训练机器学习方法并将其应用到作物育种中。这就要求植物育种公司,大学和其他研究机构以商定的格式共享来自其自身数据孤岛的大量清楚且带有标签的数据,以及用来整合这些孤岛数据所需的知识和技能。


来自不同孤岛和背景的数据产生的模型具有高度概括性,这比仅基于一个来源的数据训练模型要好得多。只有整合这些数据孤岛,农业才会发生一场深度学习革命。鉴于使用更大的数据库提高了预测的准确性,我们预计在未来几年内,公司和学术界将越来越多地汇集他们的训练数据并分享他们的经验,这比在孤岛中维护其数据和技能的团队具有更显著的优势。


                                             



植物生物技术Pbj 交流群


为了能更有效地帮助广大的科研工作者获取相关信息,植物生物技术Pbj特建立微信群,Plant Biotechnology Journal投稿以及文献相关问题、公众号发布内容及公众号投稿问题都会集中在群内进行解答,同时鼓励在群内交流学术、碰撞思维。为了保证群内良好的讨论环境,请先添加小编微信,扫描二维码添加,之后我们会及时邀请您进群。小提示:添加小编微信时及进群后请务必备注学校或单位+姓名,PI在结尾注明,我们会邀请您进入PI群


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/99607
 
249 次点击