低盐酱油(LSS)顺应健康饮食趋势,但其风味常逊于高盐酱油(HSS)和浓口酱油(KSS)。本研究构建了一个整合感官-挥发性物质-微生物组三组学数据的XGBoost-SHAP-MMVec模型,旨在指导LSS的风味增强。研究通过感官分析、气味活性化合物筛选及微生物溯源,揭示了关键风味贡献者及其微生物来源,并最终通过发酵试验验证了模型指导下的优化策略,成功提升了LSS的风味品质。
研究背景
酱油是一种全球广泛使用的传统发酵调味品。低盐酱油(LSS)作为更健康的选择,符合世界卫生组织的低钠指南,但其风味常因盐分不足而存在缺陷,例如缺乏标志性的烟熏酚类和焦糖味呋喃类物质。传统的菌株筛选方法通常依赖经验,且难以解析微生物-代谢物-感官之间的复杂关系链。可解释机器学习(ML)为风味导向的菌株筛选和预测提供了新策略,能够整合多维数据并捕捉非线性关系。本研究旨在建立一个可解释的ML模型,以精确指导LSS的风味增强。
研究亮点
构建了感官-挥发性物质-微生物组三组学数据集,并应用XGBoost-SHAP模型准确预测了感官属性与关键气味活性化合物之间的关联。
通过重组/缺失实验验证了模型识别的关键风味驱动化合物,证实了XGBoost-SHAP在解释风味贡献上的优越性。
利用MMVec神经网络模型揭示了关键挥发性物质与核心微生物群之间的关联,实现了风味物质的微生物溯源。
筛选并验证了一个由五属菌株组成的核心功能菌群组合,该组合能够复现三种酱油的风味特征。
基于模型指导的优化策略,成功生产出风味增强的低盐酱油,其兼具LSS、HSS和KSS的典型风味特征。
方法与关键
结果研究首先通过定量描述性分析(QDA)和香气提取物稀释分析(AEDA)确定了6个感官术语和29种气味活性挥发物。利用XGBoost模型(准确率>0.90)结合SHAP分析,揭示了各感官属性的关键贡献化合物:酱香(呋喃酮类)、酸败味(直链脂肪醛)、果香(短链乙酯和乙酸酯)、烘烤香(3-甲基吡嗪衍生物)、花香(降异戊二烯类)和谷物香(Ehrlich途径醛类)。这些关联通过重组/缺失实验得到确认。微生物组分析识别出12个具有丰度和共现网络连接优势的核心微生物,并用于训练MMVec模型以揭示挥发物-微生物关联。发酵试验证实了一个由五属(植物乳杆菌、肉葡萄球菌、枯草芽孢杆菌、鲁氏接合酵母、米曲霉)组成的菌群组合能够捕获三种酱油的风味特征。最终,模型指导的优化生产出了风味增强的LSS,其在保留原有谷物和花香的同时,融入了类似HSS的酱香以及类似KSS的烘烤和果香特征。
研究结论
本研究成功开发并验证了一个整合XGBoost-SHAP和MMVec的可解释机器学习框架,用于解析和优化低盐酱油的风味。该框架不仅精确识别了驱动特定感官属性的关键化合物,还追溯了这些化合物的潜在微生物来源。方法学上,该研究展示了可解释ML在整合多组学数据、超越传统线性模型方面的优势。应用层面,通过筛选和组合功能菌株,实现了对LSS风味的靶向增强,证明了该策略在指导发酵食品风味工程方面的可行性与潜力,为同类产品的品质提升提供了新思路。
图文赏析

图1 三种酱油风格的定量描述性分析(QDA)图谱。
图2 最优模型(XGBoost-SHAP)性能及挥发物特征对感官术语的贡献。

图3 通过重组/缺失验证感官-挥发物关联预测结果。

图4 酱油酿造微生物群的共现特征。

图5 微生物-代谢物向量(MMVec)神经网络模型预测的挥发物-微生物关系及相关性排序。

图6 基于发酵实验验证微生物-代谢物向量(MMVec)神经网络结果。

图7 机器学习(ML)指导的干预在实际LSS生产中的效果评估。
原文链接Zhou X, Guo T, Li T, et al. Interpretable machine learning integrates flavor classification with source attribution for low-salt soy sauce optimization. J Agric Food Chem. 2026;74(4):3892-3903.
来源:公众号-FoodAI
原文链接:https://mp.weixin.qq.com/s/ZGysgWODCmA7L1vxsCIelQ

