UniShare框架:社交分享场景下的联合推荐技术解析
1. UniShare框架解析:社交分享场景下的联合推荐新范式
在短视频平台的内容生态中,社交分享行为构成了用户增长和内容分发的核心驱动力。传统工业解决方案通常将这一复杂的三元交互(分享者-视频-接收者)拆解为两个独立任务:视频推荐(预测分享概率)和接收者推荐(预测分享对象)。这种解耦建模方式存在三个根本性缺陷:首先,视频推荐模型缺乏细粒度的接收者侧信号,而接收者推荐模型往往无法充分利用特定视频内容的深层语义信息;其次,丰富的多模态信号和复杂社交动态未被充分挖掘;最后,分享行为相比其他应用内行为(如点击、观看)具有天然的稀疏性,导致独立模型难以学习有效表征。
UniShare的创新价值在于其统一框架设计。通过联合建模分享概率,该框架实现了两个子任务的协同优化:视频推荐任务从接收者侧信号中获益,而接收者推荐任务则利用视频建模组件提供的更丰富内容理解。这种双向增强机制在快手平台的线上AB测试中取得了显著效果——分享量提升1.95%,接收者回复率增加0.482%,验证了联合建模在真实业务场景中的实践价值。
1.1 核心架构设计原理
UniShare的框架设计围绕两个核心目标展开:双边满意度优化和数据稀疏性缓解。如图2所示,系统采用分层架构设计:
表征增强层包含三个关键组件:
- 双边兴趣建模模块通过目标注意力机制,动态计算内容与双方兴趣的匹配度。对于分享者u,其兴趣表征计算为历史交互嵌入的加权和,权重由视频i与各历史项的注意力得分决定。数学表达为:
\tilde{u} = \sum_{j=1}^L \alpha_j \cdot h_j^u, \quad \alpha_j = \frac{\exp(\text{score}(i, h_j^u))}{\sum_{k=1}^L \exp(\text{score}(i, h_k^u))} - 多模态语义增强模块引入预训练的视频多模态嵌入$e_{mm}(i)$和用户多模态兴趣嵌入$e_{mm}(u)$,通过计算匹配分数$s_{match} = e_{mm}(v) \cdot e_{mm}(i)$缓解ID特征的稀疏性问题
- 关系-内容对齐模块整合LLM语义匹配和预训练GNN嵌入,评估内容与社交关系的适配性(如喜剧视频适合分享给朋友,教育内容更适合父母)
联合训练层采用独特的参数共享策略:
- 嵌入层和特征变换网络在任务间共享
- 视频任务使用完整的u-i交互特征
- 接收者任务在反向传播时冻结u-i参数保持稳定性
- 损失函数采用加权组合:$\mathcal{L}{total} = \mathcal{L}{video} + \alpha\mathcal{L}_{receiver}$
实践洞察:在快手线上部署时发现,GNN嵌入的更新频率需要控制在每周1-2次。过于频繁的更新会导致推荐结果波动,而低频更新又难以捕捉社交关系的变化。最佳实践是采用异步更新策略——GNN模型离线训练完成后,通过影子模式验证稳定性再上线。
2. 双边满意度建模的技术实现
2.1 动态兴趣匹配机制
UniShare的双边兴趣建模超越了传统的协同过滤方法,实现了三重动态匹配:
时序敏感的兴趣提取:用户历史行为序列采用时间衰减加权,最近30天的行为权重是早期行为的3.2倍(通过网格搜索确定)。实验表明,这种处理使Recall@10提升0.7%
跨模态注意力计算:视频的视觉、文本、音频特征通过跨模态Transformer编码后,与用户兴趣向量进行多维注意力计算。具体实现时,使用4头注意力机制比单头结构带来0.3%的AUC提升
社交关系门控:接收者的社会角色(如家人/同事)通过门控机制调节兴趣权重。例如,给家人分享时,娱乐内容的权重系数为0.8,而知识类内容系数为1.2
表1对比了不同匹配策略的效果:
| 匹配策略 | 视频AUC | 接收者AUC | 计算耗时 |
|---|---|---|---|
| 纯ID匹配 | 0.7421 | 0.9023 | 12ms |
| 静态多模态 | 0.7498 | 0.9176 | 18ms |
| 动态双边(UniShare) | 0.7588 | 0.9307 | 23ms |
2.2 关系-内容对齐的工程实践
关系适配性判断面临两个主要挑战:1) 用户间关系标签的稀疏性(仅30%用户显式标注关系);2) 内容与关系类型的复杂对应规则。UniShare采用三级处理流程:
关系预测层:基于GNN的社交图谱嵌入,结合用户交互频率、聊天文本情感分析(使用BERT-base模型)预测潜在关系类型。在测试集上达到82.3%的准确率
内容理解层:视频通过多模态模型提取语义标签,包括:
- 视觉内容(ResNet-152)
- ASR文本(RoBERTa)
- 封面图像情感(ViT)
- 音频氛围(CNN+LSTM)
规则引擎层:配置可解释的匹配规则,例如:
if 关系类型 == "长辈" and 内容类别 == "健康": return 适配系数 * 1.5 elif "恶搞" in 视频标签 and 关系亲密程度 < 0.6: return 适配系数 * 0.3
踩坑记录:初期直接使用LLM生成适配分数导致线上延迟超标(平均380ms)。优化方案包括:1) 预生成常见组合的匹配分数缓存;2) 对长尾请求降级到规则引擎。最终将P99延迟控制在85ms以内。
3. 数据稀疏性解决方案
3.1 层次化负采样策略
分享行为的正样本稀疏度是点赞行为的1/23,传统随机负采样会导致模型难以收敛。UniShare设计了两阶段采样方案:
硬负样本:
- 历史接收过分享但当前未选的用户
- 相同社交圈内活跃但未被分享过的用户
- 采样比例根据用户活跃度动态调整(活跃用户硬负样本占70%)
易负样本:
- 随机社交连接(保证模型能学习决策边界)
- 跨圈层用户(扩大负样本多样性)
- 添加5%的"对抗样本"——高活跃但兴趣差异大的用户
实验数据表明,该策略使模型在验证集上的AUC提升2.1%,特别是对低频用户(月分享<5次)效果显著。
3.2 多任务协同训练
联合训练面临的核心矛盾是:视频任务需要海量曝光样本,而接收者任务仅有少量分享行为样本。UniShare的创新解决方案包括:
梯度隔离机制:接收者任务的梯度不反向传播到视频特征提取层,避免小样本任务破坏主任务表征
动态损失权重:根据在线指标自动调整α系数。当分享按钮CTR下降时,增加$\mathcal{L}{video}$权重;当面板点击率下降时,提升$\mathcal{L}{receiver}$权重
课程学习策略:
- 阶段1(前3轮):侧重视频任务,学习基础表征
- 阶段2(4-6轮):引入硬负样本,强化双边匹配
- 阶段3(7轮后):加入对抗样本,提升模型鲁棒性
表2展示了不同训练策略的效果对比:
| 训练模式 | 视频GAUC | 接收者GAUC | 线上分享量提升 |
|---|---|---|---|
| 独立训练 | 0.6919 | 0.9140 | +0.82% |
| 简单联合 | 0.6943 | 0.9217 | +1.23% |
| UniShare策略 | 0.6976 | 0.9282 | +1.95% |
4. 线上部署优化实践
4.1 计算效率优化
联合推荐面临的核心工程挑战是计算复杂度从O(|I| + |V|)升至O(|I|×|V|)。UniShare采用三级优化方案:
候选集裁剪:
- 视频侧:先通过轻量级模型(参数量1/10)筛选Top200候选
- 接收者侧:LRU缓存保留最近8个分享对象
- 动态剪枝:对低质量候选提前终止计算
异步打分管道:
graph LR A[用户请求] --> B{是否分享高概率} B -->|是| C[同步计算接收者分数] B -->|否| D[异步队列处理] D --> E[离线特征更新]混合精度推理:
- 特征提取层:FP16精度(速度提升40%)
- 匹配计算层:FP32精度(保证AUC不降)
- 通过TensorRT加速,使单次推理耗时从45ms降至28ms
4.2 冷启动处理方案
对于新用户/新视频的冷启动问题,系统实现以下策略:
用户冷启动:
- 社交关系扩展:基于设备、位置、WiFi等弱信号构建临时图谱
- 兴趣迁移:通过手机型号、安装应用等推断潜在兴趣
- 安全兜底:限制每天最多3次分享,防止垃圾传播
视频冷启动:
- 内容基因提取:视觉特征聚类到已知类别(准确率92%)
- 创作者协同:使用作者历史分享模式作为先验
- 热度补偿:新视频获得初始分享概率加成(首小时+15%)
性能数据:冷启动用户的首周分享留存提升19%,新视频的首次分享耗时缩短35%。关键是在推荐准确性和探索性之间取得平衡——系统保留5%的流量专门用于冷启动测试。
5. 效果评估与业务洞察
5.1 离线实验分析
在K-Share数据集上的消融实验揭示各模块贡献度:
- 完整模型:视频AUC 0.7588,接收者AUC 0.9307
- 移除关系-内容对齐:视频AUC下降0.29%,接收者AUC降0.27%
- 移除双边兴趣建模:视频AUC降0.40%,接收者AUC降0.37%
- 移除层次负采样:接收者AUC显著降0.74%
特别值得注意的是,模型对不同类型的用户表现出差异化提升:
表3:用户分群效果对比
| 用户类型 | 分享量提升 | 回复率提升 |
|---|---|---|
| 高频分享者 | +1.2% | +0.3% |
| 低频用户 | +3.8% | +1.1% |
| 新用户 | +5.2% | +2.4% |
5.2 在线业务影响
UniShare上线后带来三个层面的业务价值:
用户体验提升:
- 分享失败率下降18%(用户更少遇到"无人可分享"的情况)
- 接收者观看完成率提升7.3%
- 分享后的二次互动(评论/点赞)增加12%
内容生态优化:
- 长尾视频的分享量占比从15%升至22%
- 垂直品类(如教育、手工)的分享转化率提升尤为显著
- 垃圾内容分享率下降29%(关系匹配机制过滤低质传播)
商业价值体现:
- 分享引导的每日活跃用户(DAU)增加0.8%
- 通过分享回流用户的7日留存提升4.2%
- 社交电商场景的转化率提升2.1%
6. 扩展应用与未来方向
当前框架已展现出超越分享场景的泛化能力。在快手的三个延伸应用中取得初步成效:
- 社交电商场景:将"视频"替换为"商品",AUC保持0.75+水平
- 本地生活推荐:联合推荐POI和同行伙伴,点击率提升2.3%
- 直播连麦匹配:整合主播-内容-观众三方信号,互动时长增加15%
未来的技术演进方向包括:
- 基于扩散模型的生成式推荐,直接合成潜在分享组合
- 跨平台联合建模,整合微信等外部社交图谱
- 实时意图识别,捕捉用户的瞬时分享动机
在实际业务中,我们发现分享行为存在明显的"时段效应"——晚间娱乐内容分享量是日间的2.1倍,而知识类内容则在通勤时段更活跃。这提示我们可以进一步引入时间动态建模,使推荐系统具备更精细的时序感知能力。
