图2显示了不同分类法的分类准确性。四种传统的机器学习模型(即K-means、Adaboost、线性SVM和贝叶斯)的准确率在0.3%到43.2%之间,表明无法根据成分声明预测类别。然而,与使用传统机器学习方法获得的结果形成鲜明对比的是,所有深度学习模型(即MLP、ResNet(残差网络,CNN)、LSTM(长-短期记忆,RNN)和IDGL(迭代深度图学习,GNN))的准确率均在83.3%到85.9%之间。
图2. 具有不同修改的不同机器学习模型之间类别预测的准确性。TF组-通过术语频率逆文档频率方法进行数据编码。SE组-通过最近邻法编辑的合成少数过采样技术重新平衡数据。
为了证明该策略的可移植性,选择了卡路里和五种有代表性的营养成分,包括三种基本营养成分,即蛋白质、总碳水化合物和总脂质,以及两种矿物质,即钠和钙。图3a显示预测营养价值的五个评估指标,包括准确性、R2、随机样本一致性斜率(RANSAC)回归、皮尔逊相关系数和斯皮尔曼相关系数四种深度学习模型(即MLP、LSTM(RNN)、ResNet(CNN)和IDGL(GNN))。图3b和图3c显示了卡路里和钠的真实值和预测值之间的关系。每个图中的绿线表示一个RANSAC,图中的椭圆表示95%的置信度。
图3. (a) 不同深度学习模型对六种代表性营养素的预测结果。轴的范围为精度[0.5,1.0],R2[0.8,1.0],RANSAC[0.8,1.0],Pearson [0.9,1.0],Spearman [0.9,1.0],颜色表示四种深度学习模型,红色表示MLP,橙色表示ResNet,蓝色表示LSTM,绿色表示IDGL;(b) 标记的卡路里值与预测的卡路里值之间的关系;(c) 标记的钠值与预测的钠值之间的关系。