当前位置: 首页 > news >正文

可解释集成模型如何提升商品搜索效果

可解释集成模型改进商品检索

机器学习领域正飞速发展,新模型层出不穷,均承诺超越前代。然而,为特定用例评估新模型是一个耗时且消耗资源的过程。这对于像某中心的商店这样承诺为客户提供最先进技术、同时又全天候高负载运营的在线服务而言,构成了一个难题。

在今年的Web会议上发表的一篇论文中,我们提出了一个解决此难题的方案。我们建议不再使用单一模型——或一对模型(一个语言模型和一个图神经网络)——来处理客户查询,而是使用一个模型集成,其输出由梯度提升决策树进行聚合。

通过使用沙普利值来确定每个模型对GBDT最终决策的贡献程度,我们可以根据效用对模型进行排序。然后,根据可用的计算资源,我们仅保留那些在实际并行运行时最有用的模型。

一个尚未针对特定用例进行充分评估的新模型,可以在任何可用的数据上进行训练,然后添加到集成中,在那里它与现有模型一同接受检验。沙普利值分析可能会将其从集成中移除,也可能会确定新模型使某个现有模型过时。无论哪种方式,客户都能享受到当前最佳技术带来的益处。

我们使用内部的“购物查询数据集”测试了我们的方法,这是一个公开数据集。该数据集包含三种语言的数百万个查询-商品对,其中查询与商品之间的关系已按照ESCI方案(精确匹配、替代品、互补品或不相关)进行了标注。我们在数据集上训练了三个大语言模型和三个图神经网络,然后使用三个不同的指标(准确率、宏观F1和加权F1)将它们与采用基于GBDT方法的六模型集成进行比较。在所有指标上,集成模型的表现都优于单个模型,且优势通常非常显著。

ESCI分类

历史上,信息检索模型是根据其返回结果的相关性来评估的;内部开发的ESCI方案是一种更细粒度的替代方案。给定一个查询,一个商品可以被分类为:精确匹配(查询中指定的品牌和/或型号)、替代品(同一产品类别但来自不同制造商的产品)、互补品(互补产品,例如查询手机时的手机壳)或不相关(一个重要的分类,因为它适用于给定查询中的绝大多数产品)。

执行ESCI分类主要有两种方法:一种是微调语言模型,其输出完全基于产品描述和查询的文本;另一种是使用图神经网络,它可以考虑产品和查询之间已观察到的关系。

例如,在内部商店中,会构建图谱来捕获不同类别的产品倾向于一起购买、哪些产品在单个搜索会话中倾向于一起被查看、哪些产品最常与特定查询词相关联等信息。

GNNs以迭代过程将图谱信息映射到表示空间,首先嵌入每个节点的关联数据;然后创建结合节点、其邻居以及它们之间关系嵌入的新嵌入;依此类推,通常跨越一到四跳的距离。因此,在ESCI任务上微调的GNNs会考虑查询和产品描述语义内容之外的信息。

模型集成

研究发现,结合微调后的LLMs和GNNs的输出通常在ESCI任务上能获得最佳性能。在WebConf论文中,描述了一种扩展集成中模型数量的通用方法。

各独立模型的输出由GBDTs进行聚合。决策树是一种做出一系列二元决策的模型——通常是判断特定数据特征的值是否超过某个阈值。树的叶节点与特定的数据分类相关联。

为了计算集成中每个模型对最终输出的贡献度,使用了基于博弈论中沙普利值概念的沙普利加性解释方法。通过沙普利值,可以系统地改变GBDT模型的输入,并跟踪每次变化如何通过决策树传播;沙普利值形式化提供了一种利用该数据来估算所有可能输入下聚合效应的方法。

这反过来又允许计算集成中每个模型对GBDT模型输出的贡献程度。在此基础上,可以选择仅将最有用的模型纳入集成——数量上限取决于我们认为计算上可行的阈值。

当然,运行一个模型集成比运行单个模型(或一对模型,一个语言模型和一个GNN)在计算上更昂贵。但在论文中,描述了几种提高集成模型效率的技术,例如缓存先前见过的查询-商品对的标签以供后续重用,以及为频繁检索商品周围的邻居预计算GNN嵌入。实验表明,集成模型对于实时部署应该是可行的。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

http://www.jsqmd.com/news/258576/

相关文章:

  • Java版LeetCode热题100之二叉树的直径:从深度计算到路径优化的全面解析
  • 2025-2026年徐州高品质住宅评选与推荐报告:于深度调整期中寻找价值确定性 - 2026年企业推荐榜
  • 杭州市英语雅思培训辅导机构推荐,2026权威出国雅思课程排行榜 - 苏木2025
  • 2026年金亿重工高臂钻机市场口碑推荐,浙江地区用户评价分析 - 工业品牌热点
  • 泉州市英语雅思培训辅导机构推荐;2026权威出国雅思课程排行榜 - 苏木2025
  • Java版LeetCode热题100之二叉树的层序遍历:从BFS到多维拓展的全面解析
  • 逆向 讀墨Readmoo iOS客户端:Readium LCP加密
  • ACPI!ACPIBuildProcessRunMethodPhaseCheckSta函数对节点BAT1方法_STA的处理在异步线程ACPI!ACPIWorker
  • 学霸同款8个AI论文写作软件,MBA论文高效搞定!
  • 2026年工业滤芯厂家权威推荐榜单:除杂滤芯/活性炭滤芯/精密滤芯/吸气滤芯/聚结分离滤芯源头厂家精选 - 品牌推荐官
  • 2026必备!专科生毕业论文必备的9款AI论文工具深度测评
  • 户外广告投放平台哪家合适?通广传媒多场景服务超给力 - 工业品牌热点
  • 互联网大厂Java面试实战:Spring Boot、微服务与AI技术综合解析
  • 南京市英语雅思培训辅导机构推荐,2026权威出国雅思课程排行榜 - 苏木2025
  • 泉州市英语雅思培训辅导机构推荐,2026权威出国雅思课程排行榜 - 苏木2025
  • 2026年石墨烯涂料设计怎么找,石墨烯涂料/无溶剂环氧涂料/环氧玻璃钢/环氧酚醛,石墨烯涂料生产厂家怎么选择 - 品牌推荐师
  • 学长亲荐2026研究生必用TOP10一键生成论文工具测评
  • 企业运维实战:Linux系统远程连接完整指南
  • 基于NSGA-II算法的电动汽车充电负荷优化研究 - MATLAB代码实现
  • 厦门市英语雅思培训辅导机构推荐;2026权威出国雅思课程排行榜 - 苏木2025
  • 福州市英语雅思培训辅导机构推荐,2026权威出国雅思课程排行榜 - 苏木2025
  • 2026年新型换热器抽芯机厂家推荐榜:山东恒力建设工程有限公司,液压/遥控/管束/换热器/液压遥控抽芯机全系供应 - 品牌推荐官
  • 福州市英语雅思培训辅导机构推荐;2026权威出国雅思课程排行榜 - 苏木2025
  • 南京市英语雅思培训辅导机构推荐;2026权威出国雅思课程排行榜 - 苏木2025
  • 基于Java的医院急诊系统毕业论文+PPT(附源代码+演示视频)
  • 数组旋转的魔法
  • AI 流量增长新引擎:上海智推时代官方合作通道 - 速递信息
  • 容器镜像的工程化思维——最小化、分层与可复现构建的取舍
  • 共赢 GEO 生态机遇:上海智推时代合作对接指南 - 速递信息
  • 手把手教你学Simulink--基础微电网场景实例:基于Simulink的微电网储能SOC均衡控制仿真