当前位置: 首页 > news >正文

超图技术提升产品检索性能

使用超图改进产品检索

通过用描述产品-产品关系的超图增强查询-产品图,召回率得分提高了 48% 以上。

在 WSDM 2023 会议上发表的一篇论文中,研究人员解决了信息检索中的一个核心问题。像帮助客户在商店中找到产品的检索引擎,通常依赖于将查询映射到产品的二部图。这些图基于客户行为构建:如果有足够多的客户执行相同查询后点击或购买了某产品,图中就会在查询和产品之间建立一条边。然后,**图神经网络(GNN)**可以处理该图,并预测对应于新查询的边。

这种方法存在两个缺点。一是商店中的大多数产品属于长尾商品,即很少被搜索,这意味着没有足够的相关数据来保证 GNN 训练的可靠性。相反,在处理长尾查询时,GNN 倾向于将它们与流行但可能无关的产品匹配,仅仅因为这些产品总体上具有高点击率和购买率。这种现象被称为非齐次混合

超图:捕捉产品间关系

为了解决这两个问题,研究人员通过添加关于客户在同一在线购物会话中倾向于查看哪些产品的信息,来增强二部图。其核心思想是:了解哪些类型的产品相互关联,可以帮助 GNN 从高频查询泛化到低频查询。

为了捕捉产品关系的信息,该研究使用了超图,它是图结构的一种泛化形式。在普通图中,一条边恰好连接两个节点,而超图中的一条边(称为超边)可以连接多个节点。虽然其他信息检索方法也使用过产品相似性来提升性能,但使用超图对产品相似性进行建模,使得研究人员能够利用 GNN 进行预测,从而充分利用图表示中可用的附加结构。

在测试中,研究人员将提出的方法与仅在二部图上使用 GNN 的方法进行了比较,结果发现,加入超图后,结果的平均倒数排名提升了近 25%,召回率(衡量检索到的正确结果百分比)提升了超过 48%。

双通道架构

GNN 生成单个图节点的向量表示,或称嵌入,这些嵌入捕捉了其邻居节点的信息。这个过程是迭代的:第一次嵌入只捕捉与节点关联的对象(本例中是产品描述或查询语义)的信息。第二次嵌入将第一次嵌入与节点直接邻居的嵌入相结合。第三次嵌入将节点的邻域再向外扩展一跳,以此类推。大多数应用使用一跳或两跳嵌入。

超图的嵌入略微修改了这个过程。第一次迭代(如标准情况)单独嵌入每个项目节点。第二次迭代为每个超边的整体创建一个嵌入。然后,第三次迭代为每个节点生成一个嵌入,该嵌入综合考虑了节点自身的内容级嵌入以及其触及的所有超边的嵌入。

该模型的架构有两个通道:一个用于查询-项目二部图,另一个用于项目-项目超图。每个通道都输入到其自己的 GNN(一个图卷积网络)中,从而为每个节点生成一个嵌入。

在训练期间,一个注意力机制会学习每个通道产生的嵌入应获得多少权重。例如,一个具有少数几个流行关联产品的常见查询,可能由二部图的标准 GNN 嵌入很好地表示。相反,一个与几个不同查询关联的罕见购买产品,可能会从超图嵌入的更高权重中受益。

预训练提升性能

为了最大化模型预测的质量,研究人员还试验了两种不同的无监督预训练方法

一种是对比学习方法,向 GNN 提供成对的训练样本。一些是正样本对,它们的嵌入应尽可能相似;一些是负样本对,它们的嵌入应尽可能不同。按照现有做法,研究人员通过随机删除源图的边或节点来生成正样本对,使生成的图相似但不完全相同。负样本对将源图与另一个随机图配对。研究人员将此过程扩展到超图,并确保两个通道的训练数据保持一致。例如,从一个通道输入中删除的节点也将从另一个通道的输入中删除。

研究人员还试验了DropEdge过程。在连续的训练周期中,使用同一张图略微不同的版本,随机丢弃少量边。这可以防止过拟合和过平滑,因为它鼓励 GNN 学习其输入的更抽象表示。

预训练显著提高了双通道模型和基线 GNN 的质量。但也增加了两者之间的差异。也就是说,该方法本身有时仅比基线模型有适度的改进。但经过预训练后,该方法比同样经过预训练的基线模型表现更出色,优势更大。

研究领域

搜索与信息检索

标签

图神经网络 (GNN) | WSDMFINISHED
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

http://www.jsqmd.com/news/384360/

相关文章:

  • 2026年比较好的洛阳无人机表演培训/洛阳无人机执照培训哪家便宜源头直供参考(真实参考) - 品牌宣传支持者
  • 2026年热门的低温除湿机/除湿机厂家推荐与选择指南 - 品牌宣传支持者
  • 支付宝消费券回收流程详解及专业平台优势解析 - 京顺回收
  • 真心不骗你 10个AI论文工具测评:本科生毕业论文写作必备指南
  • 2026年质量好的钢化玻璃/艺术玻璃厂家信誉综合参考 - 品牌宣传支持者
  • 深度测评 8个AI论文网站:本科生毕业论文写作全攻略
  • 2026年2月云南新能源车出租公司测评,节能省钱租赁平台优选 - 品牌鉴赏师
  • 读《控制论与科学方法论》
  • 2026年口碑好的高杆灯球场路灯/扬州景观路灯厂家口碑推荐汇总 - 品牌宣传支持者
  • [英语]-介词和动词
  • 2026年靠谱的单悬臂标志杆/扬州道路交通标志杆厂家最新推荐 - 品牌宣传支持者
  • 2026年评价高的兰州石笼网/兰州石笼网箱高评价厂家推荐 - 品牌宣传支持者
  • 扫描仪校准周期多久?优秀售后表现的三维扫描仪品牌推荐 - 匠言榜单
  • 2月热门!2026年检测试剂盒品牌哪家好引关注,细胞因子检测试剂盒/鱼试剂盒/大鼠试剂盒,检测试剂盒厂家有哪些 - 品牌推荐师
  • 2026年可靠的护栏网/兰州小区围墙护栏网厂家质量参考评选 - 品牌宣传支持者
  • 2026年比较好的常熟印花水刺无纺布/常熟染色水刺无纺布厂家推荐与采购指南 - 品牌宣传支持者
  • 2026年口碑好的大连艺术留学公司/大连艺术留学作品集辅导最新推荐公司 - 品牌宣传支持者
  • 基于深度学习的水表读数识别系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
  • 2026年质量好的部队心理设备/智慧心理设备热门品牌厂家推荐 - 品牌宣传支持者
  • APUE笔记:Process Relationships(九) - Invinc
  • 关于幽灵(长篇黑泥)
  • 【战略】战略蓝图
  • 2026年质量好的佛山精密RV减速机/行星减速机人气实力厂商推荐 - 品牌宣传支持者
  • 2026年K系列减速机工厂实力大比拼,摆线减速机 /自锁减速机/粮机用减速机,K系列减速机销售厂家怎么选购 - 品牌推荐师
  • 2026年热门的微间隙蜗轮蜗杆/环面蜗轮蜗杆厂家采购参考指南 - 品牌宣传支持者
  • Lychee-Rerank新手教程:从安装到实战的完整流程
  • 2026年热门的响水铸钢轴承座/响水抗振轴承座厂家推荐与选择指南 - 品牌宣传支持者
  • Qwen3-ASR-0.6B新手教程:轻松搭建语音转文字服务
  • 2026年汽车增压器市场观察:风骏5配套厂商技术解析,潍柴国五天然气增压器依维柯增压器,汽车增压器供应商选哪家 - 品牌推荐师
  • 零代码!用AnimateDiff搭建个人短视频生成工具