18万+条评价!250款啤酒到底有啥不同?
摘要
食品风味的感知与喜好受多种化合物互作及外部因素调控,难以解析和预测。本研究对250款啤酒开展全面化学检测与感官分析,训练机器学习模型以预测风味特征与消费者喜好。针对每款啤酒,检测200余项化学指标,由专业品鉴组完成定量描述性感官分析,并整合18万余条消费者评价,训练10种机器学习模型。表现最优的梯度提升算法模型显著优于传统统计预测方法,可通过化学图谱精准预测啤酒复杂风味与消费者喜好。模型解析筛选出调控啤酒风味与喜好的特异性、非预期化合物,外源添加这些化合物可显著提升市售含酒精/无酒精啤酒的消费者接受度。本研究揭示了大数据与机器学习可挖掘食品化学、风味与消费者感知间的复杂关联,为开发风味更优的定制化食品提供理论基础。
kevin.verstrepen@kuleuven.be
#机器学习 #啤酒风味 #感官预测 #消费者喜好 #化学组学 #风味改良
结果
化学参数间的关联分析
图1选定化学参数(右上)与品鉴组感官描述词(左下)的相关性
展示斯皮尔曼秩相关系数;描述词按化合物来源(麦芽:蓝色,酒花:绿色,酵母:红色,野生菌群:黄色,其他:黑色)与感官维度(香气、滋味、口感、整体喜好)分组;为清晰展示,仅呈现关键化合物的相关性。
特定风味的品鉴评价与化学成分相关
图2化学数据与专业品鉴组感官数据的成对斯皮尔曼秩相关
热图颜色代表斯皮尔曼相关系数;坐标轴按感官类别(香气、滋味、口感、整体)、化学类别与化合物来源分组。
消费者评价补充专业品鉴数据
图3在线消费者评价与专业品鉴组评分的相关性
展示斯皮尔曼相关系数,*代表显著相关(p<0.05,双侧检验);除酯香、酯味、香蕉酯香、香菜、双乙酰外,其余p值均<0.001。
基于化学数据预测啤酒感官图谱
表1各模型预测专业品鉴组描述词与RateBeer评价的性能
性能指标为测试集预测决定系数(R²),基于多输出模型计算;平均排名为各描述词单属性模型排名的均值,数值越低代表模型越优;各指标最高值加粗显示;部分模型R²为负值,表明均值预测效果优于模型。
模型解析锁定影响消费者喜好的关键化合物
图4影响消费者喜好的核心化学参数
A 基于梯度提升回归(GBR)模型的不纯度特征重要性(MDI),展示排名前15的化学参数;
B GBR模型前15大贡献参数的SHAP汇总图,每个点代表1个样本,颜色代表参数浓度(蓝色=低浓度,红色=高浓度),横轴绝对值越大对预测影响越大;
C 前15大关键化学参数与消费者整体喜好的斯皮尔曼相关性,数值为相关系数与排名。
模型验证:风味改良实验
图5基于核心预测化合物外源添加的模型验证
A 将金色艾尔、无醇/低醇啤酒的核心化合物添加至风格内95%分位乙醇归一化浓度,列出对照组与添加组的化合物浓度;
B 感官测试结果,品鉴者判定风味强度更高的样本并选择偏好样本,柱上数值为双侧2项检验p值(α=0.05),证实添加组风味与喜好度显著提升。
数据和代码
Zenodo平台,登录号10653704
详细总结
思维导图
10种模型预测性能对比(决定系数R²)
参考
Nat Commun. 2024 Mar 26;15(1):2368. doi: 10.1038/s41467-024-46346-0.
Predicting and improving complex beer flavor through machine learning
240326beer.pdf
注:AI辅助创作,如有错误欢迎指出。内容仅供参考,不构成任何建议。
