当前位置: 首页 > news >正文

论文阅读:DIEN, CTR 模型

Deep Interest Evolution Network for Click-Through Rate Prediction

论文链接: https://arxiv.org/abs/1809.03672

基于 DIN 模型的优化版本,引入序列模型。

任务背景/目标

传统模型(如 DIN)在建模用户兴趣时,通常将历史行为直接作为静态特征,按候选 item 加权聚合,却忽略了兴趣随行为序列动态演化的本质。

DIEN 的关键设计目标:

  • 行为序列并非简单加权,而是用于学习兴趣状态随行为发生的演化趋势。

  • 使兴趣表示能反映时间顺序及行为间的依赖关系。

  • 对每个历史时刻的兴趣表示施以监督,让它更有意义。

模型架构

首先,所有特征类别均通过嵌入层进行转换。随后,DIEN通过两步捕捉兴趣演变过程:

  1. 兴趣提取层(Interest Extractor Layer)从用户行为序列中提取初始兴趣序列。

  2. 兴趣演变层(Interest Evolving Layer)建模目标商品相关兴趣随时间的动态演变过程。

最终将最终兴趣表示与广告、用户画像、上下文的嵌入向量进行拼接。拼接后的向量输入多层感知器(MLP)进行最终预测。

Interest Extractor Layer

为了改变传统模型对于历史行为序列建模的缺失,在该层引入 GRU(Gated Recurrent Unit)来对每一个 Behavior 的序列依赖关系进行建模。

GRU 的作用:

  • 维护一个隐藏状态 h_t,表示当前位置用户的兴趣状态;

  • 通过门控机制(如 update gate、reset gate 等)控制历史兴趣与当前行为信息的融合。

  • 通过迭代更新,基于行为序列逐步生成兴趣状态序列。

GRU 将当前行为 embedding 与前轮兴趣状态 h_{t-1}依次输入,公式总览如下:

h_t = GRU(h_{t-1}, i_t)

其中 i_t是行为 embedding。

Auxiliary Loss

L_{aux} = -\frac{1}{N} \sum_{i=1}^{N}\sum_{t} \Big[\log \sigma(h^i_t, e^i_b[t+1]) + \log(1 - \sigma(h^i_t, \hat{e}^i_b[t+1]))\Big]

其中:

  • \sigma(x_1, x_2)=\frac{1}{1+e^{- [x_1, x_2]}}是 sigmoid 激活

  • h^i_t第 ti 个用户 GRU 在时刻 t t的隐藏状态(兴趣向量)

  • e^i_b[t+1]实际发生的下一个行为(正样本)的 embedding

  • \hat{e}^i_b[t+1]:未发生行为(负样本)embedding(随机采样)

最终整体损失:

L = L_{target} + \alpha \cdot L_{aux}

L_{target}损失函数采用 Binary Cross-Entropy(二元交叉熵,即 log loss),用于衡量最终 MLP 输出与真实点击标签之间的差异。

L_{target} = -\frac{1}{N} \sum_{(\mathbf{x},y)\in D} \Big( y\log p(\mathbf{x}) + (1-y)\log (1-p(\mathbf{x})) \Big)

其中:

  • N样本数量

  • y \in \{0,1\} 真实标签(1 表示用户点击,0 表示未点击)

  • p(\mathbf{x}) 模型输出的预测点击概率(CTR 预测值)

  • \mathbf{x}输入样本为用户、候选 item 及上下文(context)等所有特征 embedding 拼接后的向量。

Interest Evolving Layer

在获得用户兴趣表示后,Interest Evolving Layer 的核心目标是刻画用户兴趣的演变过程——即兴趣如何随环境和认知变化而动态演化。为此,作者提出了 AUGRU 结构:利用 attention 机制局部激活与目标商品相关的兴趣,并对这些兴趣间的依赖关系建模,从而捕捉兴趣的动态演变过程。

关于 attention 与 GRU 的结合方式,文中介绍了三种方案:

  1. GRU with attentional input (AIGRU):用注意力机制直接调整该层输入。

{i_t}^{'}={h_t}\cdot{a_t}

2. Attention based GRU(AGRU): 用其a_t代替GRU的update gate输出:

h'_t = (1 - a_t) \cdot h'_{t-1} + a_t \cdot \tilde{h}'_t

GRU with attentional update gate (AUGRU):用注意力权重调整 GRU 的更新门输出(保留各维度的独立影响)。

\tilde{u}'_t = a_t \cdot u'_t,

h'_t = (1 - \tilde{u}'_t) \circ h'_{t-1} + \tilde{u}'_t \circ \tilde{h}'_t,

从AIGRU开始,由上述公式可知,AIGRU 激活局部兴趣与捕获兴趣演变的过程是相互独立的。该方法仅用注意力机制调整 GRU 输入,即使输入为 0(表示无关兴趣),仍会影响隐藏状态。

AGRU 用以替代 GRU 的 update gate,直接控制 hidden state 的更新,将 attention 机制融入到了捕获兴趣演变的过程中,一定程度上弥补了 AIGRU 的不足。

但是,原先 GRU 中控制 hidden state 更新的是一个包含多个维度的向量,AGRU 用纯量替代略有不妥,因此这篇文章设计了 AUGRU,用 a_t 影响 gateu_t,以间接作用于 hidden state的更新。

http://www.jsqmd.com/news/440401/

相关文章:

  • 手把手教你用9款AI论文工具,1小时搞定全文告别熬夜赶稿 - 麟书学长
  • 2026年黑龙江塑料管道标杆厂家最新推荐:PE管、PERT管、HDPE双壁波纹管、双壁波纹管、PPR管、PPR冷水管、PPR热水管、MPP电力保护管、黑龙江大唐管业多场景管材品质之选 - 海棠依旧大
  • 2026全国五大珠宝培训机构实力排行榜:聚焦技能提升,基于专业教学与市场口碑的权威推荐榜单 - 十大品牌榜
  • 论文阅读: MGDSPR, 淘宝向量召回方案
  • 2026年吸塑厂家实力推荐榜单:厚片吸塑/ABS吸塑/PC吸塑/工程机械与医疗吸塑外壳专业制造商,匠心工艺与创新应用深度解析 - 品牌企业推荐师(官方)
  • Chaney不会代码
  • 合规的金融理财服务AI推广方案,推荐几家专业的AI推广公司 - 品牌2026
  • 2026年全国打金培训机构优选指南 五大品质品牌参考 - 十大品牌榜
  • 当物理定律与高精度计算相遇:我的新开源项目 N-Body
  • 如何监控多个进程的存活和CPU、内存占用
  • Flutter 三方库 week_number 的鸿蒙化适配指南 - 掌控 ISO 标准周数计算、财务日历实战、鸿蒙级精密时序专家
  • 机械制造想通过AI推广拓展客户,推荐几家靠谱的AI推广公司 - 品牌2026
  • GitHub开源项目:IT-Tools源码构建部署及其部署排错
  • new出来的对象,不一定在堆上?聊聊Java虚拟机的优化技术:逃逸分析
  • 移植freertos的步骤
  • 2026年油雾净化设备厂家推荐排行榜:油雾收集器、过滤器、处理器、分离器、回收器,高效净化与节能环保的工业优选方案 - 品牌企业推荐师(官方)
  • 2026年哈尔滨塑料管材企业服务优质榜:PE穿线管、PPR管、波纹管、钢带波纹管、克拉管、HDPE双壁波纹管、雨水管 - 海棠依旧大
  • Influxdb订阅与kapacitor使用梳理
  • 如果事先没有定义静态关系,在实际代码中,我们就需要提供一种使用动态关系的机制,让我们的查询、类型推断、DTO推断等能力得以正常使用。 ...
  • 2026避坑指南:AI论文写作工具Top5硬核对比——从免费大纲到物理隔离Agent,博士该为哪一款买单? - 沁言学术
  • EBS:查询系统配置文件
  • 电缆损坏目标检测数据集(1300张图片已划分、已标注)| AI训练适用于目标检测任务
  • 我们是一家医美机构,想做AI精准获客,求推荐一家擅长医美行业的AI推广公司 - 品牌2026
  • 2026年 不锈钢加工厂家实力推荐榜:激光切割/折弯/冲孔/冲压/焊接/拉丝/压花/剪切,一站式精密加工解决方案 - 品牌企业推荐师(官方)
  • 技术原生型VS垂直专业型:2026年五大AI推广公司综合实力横评 - 品牌2026
  • 万字带你深度了解MQ消息队列
  • 知网降AI率:人工改写和嘎嘎降AI效果对比,差距不是一般大 - 还在做实验的师兄
  • 2026年 槽钢厂家推荐排行榜,镀锌槽钢/S355J0/AH36/Q355B/10#/S275/Q420/英标/欧标/日标槽钢,实力源头工厂精准供应 - 品牌企业推荐师(官方)
  • 医美机构想做AI精准获客,推荐几家擅长医美行业的AI推广公司 - 品牌2026
  • 机械制造企业AI获客指南:2026年垂直领域GEO服务商深度测评 - 品牌2026