社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

Food Chem|深度学习根据成分声明准确预测食品类别和营养成分

DrugAI • 2 年前 • 271 次点击  

作者:王雪洁

编辑:肖冉

介绍


今天介绍一篇由Peihua Ma等人于2022年5月发表在Food Chemistry上的文章。本文作者提出了一种基于深度学习的通用技术来预测食物种类和营养成分。


开发了一种食品配料语句嵌入方法,包括配料数据解析、数据采样、数据编码和配料语句张量表示,该方法也可应用于其他与食品语言数据处理相关的任务。随后,应用了四种最先进的深度学习模型,包括多层感知器(MLP)、递归神经网络(RNN)、卷积神经网络(CNN)和图形神经网络(GNN)。

摘要


确定诸如食品分类、创建分类法和食品营养成分等属性可能是一项具有挑战性和资源密集型的任务,尽管对于更好地了解食品很重要。在这项研究中,从 USDA 品牌食品数据库中收集了一个新的数据集 134 k BFPD,并对其进行了修改,并用三种食品分类和营养值进行了标记,并成为了一个人工智能 (AI) 数据集,涵盖了迄今为止最大的食品类型。总体而言,多层感知器 (MLP)-TF-SE 方法在使用 AI 的食品自然语言处理任务中获得了最高的学习效率,其对食品分类的准确率高达 99%,对钙的估计达到 0.98 R2(0.93 ∼ 0.97 for卡路里、蛋白质、钠、总碳水化合物、总脂质等)。深度学习方法具有巨大的潜力,可以嵌入到其他食品分类和回归任务中,并作为食品和营养领域其他应用的扩展。

图1. 食物深度学习

(a)输入数据-成分列表和营养信息从BFPD获得。(b1)使用自然语言处理(b2)数据编码对成分列表进行单词解析,将成分、类别和营养信息字符串转换为机器可以学习的矩阵。(c) 数据采样包括两个步骤,数据重新平衡和拆分,并转换为数据张量。(d) 深入学习。标记张量用于训练深度学习模型以实现目标。(e) 深度学习模型可以在食品领域实现不同的应用,如食品营销分析、新颖的食品设计和个性化的饮食建议。


结果


图2显示了不同分类法的分类准确性。四种传统的机器学习模型(即K-means、Adaboost、线性SVM和贝叶斯)的准确率在0.3%到43.2%之间,表明无法根据成分声明预测类别。然而,与使用传统机器学习方法获得的结果形成鲜明对比的是,所有深度学习模型(即MLP、ResNet(残差网络,CNN)、LSTM(长-短期记忆,RNN)和IDGL(迭代深度图学习,GNN))的准确率均在83.3%到85.9%之间。

图2. 具有不同修改的不同机器学习模型之间类别预测的准确性。TF组-通过术语频率逆文档频率方法进行数据编码。SE组-通过最近邻法编辑的合成少数过采样技术重新平衡数据。


为了证明该策略的可移植性,选择了卡路里和五种有代表性的营养成分,包括三种基本营养成分,即蛋白质、总碳水化合物和总脂质,以及两种矿物质,即钠和钙。图3a显示预测营养价值的五个评估指标,包括准确性、R2、随机样本一致性斜率(RANSAC)回归、皮尔逊相关系数和斯皮尔曼相关系数四种深度学习模型(即MLP、LSTM(RNN)、ResNet(CNN)和IDGL(GNN))。图3b和图3c显示了卡路里和钠的真实值和预测值之间的关系。每个图中的绿线表示一个RANSAC,图中的椭圆表示95%的置信度。

图3. (a) 不同深度学习模型对六种代表性营养素的预测结果。轴的范围为精度[0.5,1.0],R2[0.8,1.0],RANSAC[0.8,1.0],Pearson [0.9,1.0],Spearman [0.9,1.0],颜色表示四种深度学习模型,红色表示MLP,橙色表示ResNet,蓝色表示LSTM,绿色表示IDGL;(b) 标记的卡路里值与预测的卡路里值之间的关系;(c) 标记的钠值与预测的钠值之间的关系。

结论


基于美国农业部134 k BFPD食品成分声明的深度学习方法实现了高达99%的食品分类准确度和0.98的R2营养素估计。该策略包含四个部分,即高频成分分析,TF-IDF成分编码,SMOTEENN数据集再平衡以及应用于四种最先进的深度学习模型的预处理生成的数据张量。四种模型分别为多层感知器(MLP)、RNN(LSTM)、CNN(ResNet)和GNN(IDGL)进行比较。此外,为了证明系统的可移植性,实施了各种分类任务(例如BFPD、IRI和WWEIA分类)和各种营养素(例如卡路里、蛋白质、总碳水化合物、总脂质、钠、钙),以在实践中达到可接受的准确度。深度学习方法通常比传统的机器学习方法提高估计精度100%以上。

参考文献:Ma P, Zhang Z, Li Y, et al. Deep learning accurately predicts food categories and nutrients based on ingredient statements [published online ahead of print, 2022 May 19]. Food Chem. 2022;391:133243. doi:10.1016/j.foodchem.2022.133243

长按关注我们

微信号|FoodAI

合作/投稿|jiedong@csu.edu.cn

yunyonghuan@hainanu.edu.cn


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/137196
 
271 次点击