当前位置：首页 > news >正文

融合感官信息的序列推荐系统ASEGR框架解析

news 2026/6/15 7:58:49

1. 序列推荐系统与感官信息融合的背景与价值

在电商和内容平台快速发展的今天，推荐系统已经成为连接用户与商品/内容的核心纽带。传统序列推荐系统主要基于用户的历史交互数据（如点击、购买、评分等）来建模用户兴趣的时序变化，这种方法虽然有效，但存在明显的局限性——它无法捕捉用户决策过程中那些"难以量化但至关重要"的感官因素。

想象一下你最近一次网购香水的经历：促使你下单的关键因素可能不是品牌或价格，而是评论中描述的"前调是清新的柑橘香，中调转为淡雅的白茶"这类感官细节。这正是我们提出的ASEGR框架要解决的核心问题——如何将人类的多维感官体验转化为推荐系统可理解、可利用的信号。

感官信息的独特价值体现在三个维度：

决策解释性：超过70%的消费者表示，产品评论中关于颜色、质地、气味等描述直接影响购买决策
兴趣连续性：用户在美妆、食品等领域的偏好往往表现出强烈的感官一致性（如持续选择"花香调"护肤品）
冷启动缓解：对新商品而言，感官特征比行为数据更早可用，能有效解决数据稀疏问题

2. ASEGR框架的技术架构解析

2.1 整体设计思路

ASEGR框架的创新性在于构建了一个"大语言模型理解感官-轻量模型服务推荐"的两阶段管道，其核心思想是将LLM的语义理解能力蒸馏到可高效部署的学生模型中。具体流程如下：

离线处理阶段：
- 使用GPT-5 Mini作为教师模型，从海量评论中提取结构化感官属性
- 设计精细的prompt工程确保提取质量（后文详述）
- 构建包含视觉/触觉/嗅觉等多模态的感官嵌入空间
在线服务阶段：
- 轻量级学生模型实时计算商品在感官空间的向量表示
- 与传统的协同过滤、序列建模信号进行早期融合
- 生成可解释的推荐结果（如"推荐此沐浴露因为它与您喜欢的栀子花香型一致"）

关键设计选择：之所以采用早期融合而非后期融合，是因为实验发现感官特征与行为序列特征在低维空间就表现出强相关性，早期融合能让模型更充分地学习跨模态关联。

2.2 感官信息提取的技术实现

2.2.1 基于LLM的属性抽取

我们设计了一套严格的感官属性提取规范，确保不同品类商品的特征可比性：

{ "attribute": "scent", // 限定18种基础感官类型 "value": "vanilla", // 开放式取值但限制长度 "evidence": "contains pure vanilla extract", // 原文证据 "polarity": "positive", // 情感倾向 "negated": false, // 是否否定描述 "confidence": 0.93 // 模型置信度 }

在prompt工程上的关键创新点：

属性类型约束：将开放词汇映射到18种标准感官维度（如将"aroma"统一为"scent"）
证据锚定：要求每个属性必须关联评论原文片段，避免幻觉
否定感知：特殊处理"unscented"等否定表达，将其转化为明确的信号

2.2.2 教师-学生知识蒸馏

为解决LLM推理延迟高的问题，我们训练Qwen模型模仿GPT-5 Mini的提取行为，关键训练策略包括：

多粒度对齐损失：
- 表层匹配：精确匹配属性-值对（F1=0.4278）
- 语义匹配：基于sentence-embedding的余弦相似度（F1=0.6286@0.6阈值）
- 分类匹配：粗粒度感官类型一致性（F1=0.7050）
课程学习策略：
- 先学习高频简单样本（如明确描述的"red color"）
- 逐步过渡到复杂表达（如隐喻性的"sunset-like hue"）
对抗训练：添加判别器模块区分真实评论与生成属性，增强鲁棒性

3. 感官嵌入空间的构建与融合

3.1 多模态嵌入表示

将提取的感官属性转化为向量空间是关键挑战。我们采用分层编码架构：

原子特征层：每个属性-值对独立编码
- 使用轻量级BERT模型生成128维向量
- 添加属性类型嵌入（如视觉/嗅觉等）作为位置编码
商品聚合层：
- 通过注意力机制加权聚合所有属性向量
- 权重由属性置信度和情感极性共同决定
- 输出256维的感官特征向量
领域适配层：
- 美妆品类侧重嗅觉/触觉维度
- 玩具品类强化视觉/听觉特征
- 通过领域适配器动态调整特征重要性

3.2 与序列模型的融合

在Beauty品类上的实验表明，早期融合效果最佳。具体实现方式：

class EarlyFusion(nn.Module): def __init__(self, sensory_dim=256, seq_dim=128): super().__init__() self.fusion_gate = nn.Linear(sensory_dim + seq_dim, 1) def forward(self, sensory_emb, seq_emb): gate = torch.sigmoid(self.fusion_gate(torch.cat([sensory_emb, seq_emb], dim=-1))) return gate * sensory_emb + (1-gate) * seq_emb

这种自适应门控机制的优势在于：

对感官信息丰富的商品（如香水）自动增大感官权重
对感官描述少的商品（如USB线）回归传统序列特征
在Sports品类表现波动的问题正是由于这种自适应未完全适配该领域特性

4. 实现细节与调优经验

4.1 数据准备要点

评论数据清洗：
- 过滤短于20字符的无效评论
- 识别并排除模板化评价（如"商品很好"）
- 对同一商品的评论按长度加权采样，避免长评论主导
负采样策略：
- 除随机负采样外，增加"感官混淆项"作为困难样本
- 例如：给喜欢"果香"的用户采样"花香"商品作为负例
领域适配技巧：
- 美妆类：重点清洗重复出现的营销术语（如"24小时持妆"）
- 玩具类：需要特殊处理儿童口语化表达（如"摸起来毛毛的"）

4.2 模型训练技巧

温度调度：
- 初始高温（τ=2.0）促进探索不同感官维度关联
- 逐步降温至τ=0.5强化判别性特征学习
多任务优化：
- 主任务：下一项预测
- 辅助任务：
  - 感官属性预测（提升特征质量）
  - 对比学习（拉近同类商品距离）
正则化策略：
- 对感官嵌入施加正交约束，避免维度冗余
- 使用DropPath防止特定感官维度过拟合

5. 实战问题排查指南

5.1 典型问题与解决方案

问题现象	可能原因	解决方案
感官推荐准确但解释不相关	证据span提取偏移	增加证据边界检测loss
冷启动商品排名异常高	学生模型过拟合头部商品	添加商品流行度偏差校正
同一用户收到矛盾推荐	多感官维度冲突	实施感官偏好消歧模块