01实验超参数设置
模型中的基本超参数沿用文献的模型,强度注意力模块和强度句法树融合模块的超参数取自超参数实验的最优结果,具体设置如表5所示。

02评估标准
为了验证本文所提模型的提升效果,采用文本挖掘领域常见的精确率、召回率和F1值来评估模型性能。为减小实现过程中的随机性,对于每组实验,选取3次实验平均值作为最终实验结果。
实验结果对比
本文主要进行了3组实验,其中第1组以文献提出的模型作为基线,旨在验证FGSAM-0I模型在感官词提取方面的效果。第2组是针对强度注意力模块与强度句法树融合模块进行的消融实验,以验证FGSAM-0I模型对强度词和感官词整体提取效果。此外,还基于不同的注意力头数和注意力权重以及不同的GCN层数进行了超参数实验,以探究在针对食品感官分析领域强度注意力机制和强度句法树能够发挥出更好性能的参数设置。
01对比实验
表6的实验结果是3次随机实验的平均值,结果证明了FGSAM-OI的总体有效性。其性能优于未考虑句法信息的基线模型Mensah和IAN模,同时对比性能较好的模型PWCN-DEP在召回率和F1值上也取得了一定的提高。这表明FGSAM-OI能够尽可能捕捉到所有与特定方面相关的感官词,以确保分析的全面性和综合性。同时可以看出基于依赖权重和依存矩阵等句法信息的模型往往能够更充分地捕获感官词,从而能在感官分析任务中表现出更好的效果。不过,PWCN-DEP在精确率方面表现出了更好的效果,这可能是因为FGSAM-OI通过引入注意力机制以关注句子中的强度信息,但由于注意力分配比较集中,从而忽略了部分感官词等其它句子成分,进而略微影响了模型的精确率。

02消融实验
从表7的实验结果可以看出,强度注意力模块和强度句法树模块分别使模型的精确率提升了3.73、5.1个百分点,均对模型的预测效果产生了积极影响,验证了这两个模块的有效性。同时可以观察到,强度句法树对于模型性能的提升更为明显,这表明在进行感官词及其强度标注过程中,增强的依存关系表示往往能够提供更丰富的语义分析。

03超参数分析
在FGSAM-OI中,强度词的注意力权重与注意力头数表征了多头注意力的处理程度,GCNs的层数则表征了对于强度句法树的学习粒度。为此,针对这3个超参数进行了实验分析,以探究最佳的超参数组合。
图4展示了注意力模块相关参数的实验结果,由于多头注意力机制中需要确保特征维度可以被注意力头数整除,且注意力头数一般不宜过大,所以选取了1~25的所有可能的注意力头数进行了实验。可以看到对于所有的注意力权重值,精确率和F1值表现出相似的变化趋势。具体来说精确率在注意力头数为5时表现出最好的效果,F1值则在注意力头数为4时效果最好。因此在后续进行模型调优时可以优先考虑将注意力头数设置为4或5。而通过图5的依赖树相关超参数实验,GCNs的层数设置为3时精确率和F1值均取得峰值,这也符合现有的大多数GCNs应用实践说明层数过少可能会导致表示能力不足、信息传播受限,过高的层数则会导致梯度消失和梯度爆炸以及计算复杂度的增加,只有适中的GCNs层数才能更好地利用强度句法树,从而更好地融合输入文本中的句法结构信息。


04案例分析
为更直观地展示FGSAM-OI模型的作用原理及应用方法、参考文献的方法,结合食品感官分析任务,分别基于单条品评文本和整体数据集进行案例分析。
首先,以一款饮料的品评文本“这款饮料味道有点苦,但是口感非常清新。"为例,结合模型的数据处理过程进行案例说明。经过分词和原始依存句法树分析后,该品评文本对应的原始依存矩阵如图6a所示。通过观察句子结构不难看出,“有点”和“苦”以及“非常”和“清新”之间的关系对于提取感官强度非常重要。因此所有感官强度词参与的依存边都会获得更高的权重,从而更好地提取强度信息。模型中为了更好地在GCNs中传播信息,每个节点还添加了自循环,从而得到了最终的强度依存矩阵(图6b)。针对测试数据集中的品评文本,提取出感官词及感官强度后对结果进行统计与汇总,可得到饮料最终的感官分析轮状图,如图7所示。

结论
本文提出了一种细粒度的方面级感官评价分析模型FGSAM-OI。基于注意力机制和句法树的感官强度捕获,该模型能够较为有效分析食品品评评论中的感官词及相应的感官强度,以更准确描述消费者对食品的感官体验。实验结果表明,模型相较于其他的意见提取模型能够在食品品评数据集上表现出更好效果。
