Nat. Commun. | 通过机器学习预测和改善啤酒风味

今天为大家介绍的是来自Kevin J. Verstrepen团队的一篇论文。食物风味的感知依赖于许多相互作用的化学化合物和外部因素，因此理解和预测它们颇具挑战性。在这项研究中，作者结合了对250种不同啤酒的广泛化学和感官分析，训练机器学习模型，以预测啤酒的风味和消费者的喜好。

传统的多变量统计学和机器学习方法已被用来预测特定化合物的风味，例如，通过将化合物的结构特性与其潜在的生物活性联系起来，或将特定化合物的浓度与感官特性联系起来。大多数以前的研究集中在预测单个化合物的感官特性（通常基于它们的化学结构），因此忽略了这些化合物存在于食物或饮料的复杂基质中，并排除了化合物之间的复杂相互作用。此外，感官科学中常用的传统统计学需要大样本量和足够的预测因子变异性来创建准确的模型。它们不适合研究数百种相互作用的风味化合物的广泛集合，因为它们对异常值敏感，有很高的过拟合倾向。在这项研究中，作者结合了对不同商业啤酒的广泛化学分析和感官数据，以及机器学习方法，开发了能够从化合物浓度预测味道、气味、口感和欣赏度的模型。啤酒特别适合模拟化学、风味和欣赏程度之间的关系。首先，啤酒是一种复杂的产品，由成千上万的风味化合物组成，这些化合物参与复杂的感官互动。这种化学多样性源于原料和酿造过程中的生化转化。其次，互联网的出现使啤酒消费者开始使用在线评价平台，如RateBeer和BeerAdvocate。这样，啤酒社区提供了大量的啤酒风味和欣赏分数的数据集，为感官评价小组的分析提供了极其庞大的感官数据库。具体来说，作者对250种商业啤酒的200多种化学属性进行了特征描述，这些啤酒涵盖了22种啤酒风格，并将这些与16人内部训练的品鉴小组的描述性感官分析数据和来自180,000多个公开消费者评价的数据联系起来。这些独特而广泛的数据集能够训练一系列机器学习模型，从啤酒的化学特性预测风味和欣赏度。对性能最佳模型的解剖使作者能够准确指出作为啤酒风味和欣赏潜在驱动因素的特定化合物。

啤酒数据分析

图 1

对每种啤酒，作者测量了226种不同的化学性质，包括常见的酿造参数，如酒精含量、异α酸、pH值、糖浓度，以及200多种风味化合物。其中相当大的一部分（37.2%）是来自啤酒花的萜类化合物，负责草本和果味。第二大类是酵母代谢产物，如酯和醇，产生果味和溶剂味。其他测量的化合物主要来自麦芽，或其他微生物，如非酿酒酵母和细菌。来自香料或陈化的化合物归类为“其他”。五个属性（热量值、总酸和总酯、啤酒花香气和硫化合物）是由多个单独测量的化合物计算得出的。作为识别化学性质之间关系的第一步，作者确定了化合物浓度之间的相关性（图1）。相同来源的化合物通常显示出正相关。例如，啤酒花香气化合物香茅醇和α-萜品醇彼此之间显示出中等相关性，但与苦味啤酒花成分异α酸没有相关性。这说明酿酒师可以通过选择啤酒花品种和投放时间独立调整啤酒花香气和苦味。如果啤酒花在沸腾阶段早期添加，化学转化增加苦味而香气挥发；相反，啤酒花的晚期添加保留了香气但限制了苦味。同样，由啤酒花衍生的异α酸与乳酸和醋酸显示出强烈的负相关性，这可能反映了乳酸和醋酸细菌的生长抑制，或酸啤酒风格对这些细菌独特风味的依赖，导致使用较少的啤酒花。最后，酵母衍生的酯（乙酸乙酯、癸酸乙酯、己酸乙酯、辛酸乙酯）和醇（乙醇、异戊醇、异丁醇和甘油）较为相关，表明这些次级代谢物与酵母的遗传背景和/或发酵参数相关。

机器学习模型预测

研究收集的丰富的化学分析、品鉴小组评估和公众评论数据集提供了可以开发出将化学数据与感官特征相连的预测模型的机会。鉴于啤酒风味的复杂性，基本的统计工具，如相关性或线性回归，可能并不总是最适合进行准确预测的。相反，作者应用了不同的机器学习模型，这些模型能够建模简单的线性和复杂的交互式关系。具体来说，作者构建了一套回归模型来预测（a）训练有素的评审小组对啤酒风味和品质的评分以及（b）从啤酒化学特征预测公众评论的欣赏分数。作者训练和测试了10种不同的模型，3种基于线性回归的模型（简单线性回归与一阶交互作用（LR），套索回归与一阶交互作用（Lasso），偏最小二乘回归（PLSR）），5种决策树模型（AdaBoost回归器（ABR），额外树（ET），梯度提升回归器（GBR），随机森林（RF）和XGBoost回归器（XGBR）），1种支持向量回归（SVR），和1个人工神经网络（ANN）模型。

表 1

为了比较机器学习模型的性能，数据集被随机分成了训练集和测试集，按啤酒风格进行分层。在训练集上训练模型后，其性能根据其预测测试数据集的能力来评估。此外，按描述符对单个属性模型进行排序，并计算平均排名。不同模型的性能有所不同（表1）。值得注意的是，所有模型在预测RateBeer结果上的表现都比预测人类的品鉴小组的结果要好。一个原因可能是感官数据本质上是变化的，而这种变化在RateBeer的大量公共评论中被平均化了。此外，所有基于树的模型在预测味道上的表现都比预测香气要好。线性模型（LR）的表现特别差，R2值为负，这是由于严重的过拟合造成的。过拟合是线性模型在参数众多且样本有限时的常见问题。L1正则化（Lasso）成功克服了这种过拟合，竞争力超过了多个基于树的模型在RateBeer数据集上的表现。同样，PLSR的降维避免了过拟合并在一定程度上提高了性能。尽管如此，基于树的模型（ABR、ET、GBR、RF和XGBR）显示出最好的性能，超过了常用于感官科学的线性模型（LR、Lasso、PLSR）。

图 2

接下来，作者利用模型来推断对感官感知和消费者欣赏的重要贡献者。消费者偏好是一个关键的感官方面，因为表现出低消费者欣赏分数的产品往往在商业上不会成功。此外，需要大量代表性评价者的要求使得消费者试验成为产品开发中一个成本较高且耗时的过程。因此，一个用于预测总体欣赏的化学驱动因素的模型将是食品开发和优化可用工具箱中的一个补充。由于在RateBeer数据集上的GBR模型表现出最佳的整体性能，作者专注于这些模型。具体来说，作者采用了两种方法来识别重要的贡献者。首先，基于不纯度的特征重要性（即不纯度的平均减少）获得了GBR模型中每个感官特征最重要预测因子的排名。在第二种方法中，作者使用SHAP来确定哪些参数对于模型预测消费者欣赏最有贡献。这两种方法都识别出乙酸乙酯作为啤酒欣赏的最有预测力的参数（图2）。乙酸乙酯是啤酒中最丰富的酯，具有典型的“果味”、“溶剂味”和“酒精味”，但通常被认为不如其他如异戊酸乙酯等酯类那么重要。SHAP识别的第二个最重要的参数是乙醇，它是除水外啤酒中最丰富的化合物。除了直接贡献于啤酒的风味和口感，乙醇还极大地影响啤酒的物理性质，决定了挥发性化合物逃逸啤酒基质以贡献于啤酒香气的易程度。重要的是，还应注意到由于无酒精啤酒的欣赏得分非常低，乙醇对欣赏度的重要性可能被过高估计。尽管蛋白质水平通常不被认为是啤酒欣赏的驱动因素，但在这两种方法中也排名很高，可能是由于其对口感和酒体的影响。乳酸，为酸啤酒贡献酸味的成分，被SHAP识别为第四个最重要的参数，可能是因为数据集中酸啤酒普遍受到较高的欣赏。

编译 | 曾全晨

审稿 | 王建民

参考资料

Schreurs, M., Piampongsant, S., Roncoroni, M. et al. Predicting and improving complex beer flavor through machine learning. Nat Commun 15, 2368 (2024).

https://doi.org/10.1038/s41467-024-46346-0