当前位置: 首页 > news >正文

基于时间序列预测的流行趋势推荐模型

搜索与信息检索

确保客户不错过热门产品

时间序列预测能够实现实时趋势识别,同时一种新颖的两步训练过程提高了预测准确性。

作者:Hao Ding, Yifei Ma
2023年9月26日
4分钟阅读


推荐系统自然倾向于推荐那些在一段时间内已被证明受欢迎的产品——无论是在普通用户中,还是在具有特定口味偏好的用户群体中。但是,基于流行度的推荐可能会错过正在流行起来的产品,或者那些虽然尚未达到高购买量但人气正在迅速上升的产品。今天执行查询的客户,如果错过了两三天后将成为产品领域颠覆性新品的产品,很可能会感到不满。

我们设想,当客户进行产品查询时,他们不仅能收到基于历史数据的匹配列表,还能收到一个热门匹配列表,以便在做出购买决策时拥有尽可能多的信息。为了在趋势发生时就捕捉到它,而不是等到事后在数据中显现出来,我们使用时间序列预测来预测哪些产品将在不久的将来流行起来。

我们在今年ACM推荐系统会议(RecSys)上发表的论文中描述了我们的方法。首先,我们根据速度(每个时间步长内客户与产品页面的交互次数)和加速度(速度随时间步长的变化率)严格定义了趋势。然后,我们提出了一种新颖的机器学习方案:先在下一项推荐任务上预训练模型,使其学习与交互模式相关的产品特征。预训练后,模型在预测趋势(加速度率)的任务上进行微调。

为了评估我们的模型——TrendRec——我们将其与三个基线进行了比较:一个是简单的马尔可夫模型,它假设交易量从一个时间步长到下一个时间步长的增长率恒定(恒定加速度);一个是指数移动平均模型,它基于过去八个时间步长的加速度的加权和来预测下一个时间步长的加速度;还有一个是在加速度率时间序列上训练的神经网络。

我们在五个数据集上使用两种不同的指标测试了所有四个模型。我们发现,我们的模型凭借其对产品特征与销售模式之间相关性的额外了解,在所有数据集上均优于基线神经网络模型——在一个数据集上分别提升了15%和16%。两个神经模型都显著优于启发式基线,这表明加速度率的变化遵循数据中可辨别的非线性模式。

表示学习

我们预训练过程的目标是让模型学会生成对趋势预测任务有用的产品表示。其假设是,与同一客户子群交互的产品会随时间呈现出相似的流行度趋势。如果模型学会了将产品特征与特定子群关联起来,它就能学会将相同的特征与特定的趋势模式关联起来。

相应地,预训练任务是基于给定客户的交互历史,预测该客户接下来会与哪个产品互动。模型接收客户的交互历史作为输入,并学习生成两种向量表示(嵌入):一种是客户口味嵌入,一种是产品特征嵌入。

预训练后,模型在根据过去的加速度率预测未来加速度率的任务上进行微调。产品特征嵌入仍然被使用,但客户口味嵌入不再被使用。其假设是,由于客户口味嵌入与产品嵌入是一起训练的,它已经影响了产品嵌入。

时间间隔

我们训练过程中一个重要的考虑因素是评估模型性能的时间间隔。我们希望训练模型来预测加速度率——但是,加速度率对应的是哪个时间跨度?一小时?一天?一周?

我们推测,预测加速度的时间间隔与学习预测模型的可行性之间存在一种关系。如果间隔太短,数据噪声太大:例如,即使预测期的后三个小时加速度率非常高,前15分钟的加速度率可能恰好是平的,甚至是负的。相反,如果时间间隔太长,到间隔结束时,流行度的激增可能已经消退,使得整体的加速度率看起来人为地偏低。

在训练趋势预测模型时,我们的目标是找到一个介于过短和过长之间的最佳时间间隔——这个数值在不同数据集上可能有很大差异。然而,在我们的实验中,我们发现最简单的启发式基线——假设加速度恒定的模型——为可行性-时间间隔曲线的形状提供了足够好的估计,从而能够进行时间间隔选择。并且由于该启发式方法非常简单,其估计值可以高效地计算出来。

在我们的实验设置中,TrendRec和所有三个基线模型都预测了在预测时间间隔内加速度率最高的十个产品,该加速度率是使用恒定加速度启发式方法计算得出的。我们使用两个指标评估结果:按最小-最大缩放归一化的前10个结果的累积加速度,以及趋势性归一化折现累积增益(TNDCG),后者评估前10个结果的排序,对排名靠前的结果赋予更大的权重。

两种神经模型都显著优于启发式基线,但TrendRec在所有评估中取得了最佳结果。FINISHED
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

http://www.jsqmd.com/news/546903/

相关文章:

  • PP实战指南:ECN工程变更在物料计划中的关键应用与系统操作解析
  • 别再死磕主机了!我用VMware虚拟机+USB2.0模式,半天搞定Nvidia AGX Xavier刷Jetpack5.0.2
  • 2026年泄爆墙应用白皮书工业领域深度剖析:折叠门/泄压门/泄爆墙/泄爆窗/泄爆门/电磁屏蔽门/监狱门/钢制平开门/选择指南 - 优质品牌商家
  • 售前客户需求深度挖掘:从表面诉求到核心痛点的五步法
  • 从华大九天到芯华章:国产EDA厂商的崛起之路与技术突破
  • 华为交换机流量统计配置全攻略:从ACL到流策略的保姆级教程
  • 2026年必看:专业婚恋软件推荐,找到真爱不迷路
  • 北京GEO服务商推荐:5家优质机构怎么选?
  • 汽车域控制器电源设计避坑:用NXP VR5510实现ASIL-D安全等级的实战配置指南
  • 【数据洞察】2025年中国地铁网络:从客流强度到智慧运营的深度解析
  • NeurIPS2024论文趋势前瞻:从接收列表看AI研究新动向【附历年论文分析】
  • 逆向某鱼x-sign算法时,我踩过的那些坑:从内存Trace到参数拼接的避坑指南
  • 职场效率提升利器:printPDF电子发票批量打印工具使用教程
  • 别在死磕百度文库、原创力找方案了!这个免费下载方案神器藏不住了
  • 欧拉22.03+Nginx性能优化全攻略:从编译参数到系统调优
  • jcifs-ng:企业级Java SMB客户端库的现代化演进与实战应用
  • MySQL 数据迁移小工具使用指南:轻松搞定跨库数据迁移
  • 终极Dark Reader配置指南:轻松实现全网深色模式
  • 手把手教你将Arduino传感器库移植到STM32F103C8T6(蓝桥杯/电赛板卡适用)
  • 别再让AI瞎写了!用Kiro Spec四步法,在Cursor里搭建你的专属AI开发流水线
  • Halcon图像处理:get_grayval和set_grayval的逐行操作实战(附完整代码)
  • OpenClaw重磅重构!插件换血+安全加固,这波才是真王炸
  • 红楼映霞,山海相依 —— 信号山解锁青岛老城浪漫
  • UI 设计中的动效原则:让交互更有意义
  • OmenSuperHub:让惠普游戏本重获新生的轻量级系统管理工具
  • DjangoBlog项目介绍
  • 【Zynq开发避坑指南】PetaLinux核心配置与 Vivado DMA 地址分配深度解析
  • 告别引擎壁垒:Unity资源迁移工具让Godot开发效率提升300%
  • 大模型入门必看:小白程序员如何高效转行?附收藏指南
  • 2026年专业深度测评:服饰鞋包淘宝代运营公司排名前五权威榜单 - 电商资讯