当前位置: 首页 > news >正文

商业世界模型与因果推断:京东智能定价实践|奇点智能技术大会实录

"对于商业世界模型来说,真正的关键不是预测'未来会怎样',而是仿真'采取不同经营动作后,结果会相差多少'。"

演讲嘉宾 | 邓金秋 责编 | 红月

出品 | CSDN(ID:CSDNnews)

当 AI 从辅助工具逐步演进为独立决策者,如何让 AI 在极其复杂、试错成本极高的真实电商环境中独立操盘?

传统的机器学习预测为何会带来由系统性偏差导致的商业误判?

京东又是如何利用前沿的“商业世界模型”与“因果推断”技术,驯服海量商品的定价难题?

在 4 月刚刚落幕的 2026 奇点智能技术大会上,京东定价算法负责人邓金秋带来了一场干货满满的分享,其分享的主题《Agentic Commerce:商业世界模型中的因果建模实践》为行业带来了极具参考价值的破局思路。

邓金秋,现任京东零售算法总监,负责供应链管理策略优化、定价算法优化、价格策略制定及价格生态治理等。

以下是邓金秋在本场大会上的演讲核心精华与实录整理,带你窥见 AI 电商的最新实践:

  • AI 电商演进方向:Agentic Commerce 正从零散的“买方导购”与“卖方辅助”,走向“买卖双边 Agent 协同决策与自治”的新阶段;

  • 商业需要“世界模型”:真实的商业环境试错成本极高。AI 必须拥有一个“商业世界模型(仿真器)”,在行动前先“想一遍”,低成本推演不同策略的结果;

  • 预测 ≠ 决策:单纯的机器学习只能拟合历史,无法区分因果(如误认为大促期间“价格越低销量无限高”)。经营决策的核心不是“拟合误差”,而是基于因果推断计算干预动作带来的“增量收益”。

Agentic Commerce:从“人找商品”到“AI 完成交易”

Agentic Commerce 正从一个概念快速演变为产业趋势。目前,行业内涌现出了两大类典型的 Agent 演进方向:

  • Buy-side Agent: 站在消费者一侧。比如 ChatGPT Shopping重构了购物入口,用户只需提出“买一个 100 刀以内的搬家礼物”,AI 就能完成搜索、比价和购买建议,再比如 Amazon Rufus(平台内闭环型代理),嵌入在电商站内完成复杂的购物决策辅助。

  • Sell-side Agent:站在商家一侧。以微软的 Microsoft Store Operations Agent 为例,它作为企业级运营代理,将门店管理、退换货等流程纳入统一系统,更激进的是 Anthropic 内部测试的“AI 自动售货机”,这是一个完全由 AI 托管的自主经营实验,AI 自己决定选品、向供应商下单、定价并响应客户。

    截图自邓金秋演讲 PPT

未来的趋势是什么? 是买卖双方 Agent 的协同编排。不仅是 AI 辅助交易,更是当 Sell-side Agent 开始承担真实的经营决策(如自主定价、补货)时,我们必须回答一个问题:“AI 做了这个动作之后,会带来什么结果?”

这就是我们需要“商业世界模型”的原因。

商业世界模型:为 Agent 决策提供低成本仿真环境

什么是世界模型?为什么要给 Agent 配备世界模型?

我们可以回想一下 AlphaGo。它之所以能超越人类,不仅仅是因为算力,更因为它的内部有一个“Go Simulator(围棋仿真器)”。在遇到李世石的“神之一手”后,AlphaGo 可以在虚拟棋盘中自我对弈几万次来修复策略。

在自动驾驶和机器人领域,世界模型同样被用来“先预演、再行动”,从而避免现实中车毁人亡的代价。

电商经营也是一样。降价、促销、囤货,这些都是高成本、长反馈的真实试错。 如果 AI 每次都在真实环境里乱试,商家早就破产了。

截图自邓金秋演讲 PPT

因此,商业世界模型就是要把价格、促销、库存、履约等经营动作,放进一个统一的推演环境中。

让 Agent 在内部仿真“如果采取某套价格组合,用户的需求会怎么响应?竞争对手会怎么反应?库存周转能不能跟上?”,经过低成本的在线闭环优化后,再输出最优策略到真实的商业世界中执行。

从预测到决策:为什么一定要用“因果推断”?

构建商业世界模型,最忌讳的就是把“预测”等同于“决策”。

传统的机器学习预测可以很好地拟合历史结果,但经营决策真正关心的是“干预”:这个动作值得做吗?能带来多少增量?

举个经典的反面例子:电商“大促(如618)”时,价格低且销量极高。如果直接用机器学习拟合,模型可能把大促流量带来的销量增长误归因于降价动作,从而高估降价的真实增量效果。

但实际上,销量暴涨的真正原因(混淆因子)是大促带来的极高流量。如果不剥离这个混淆因子,AI 就会做出错误的定价决策。

正如图灵奖得主 Judea Pearl 所言,我们需要跨越“观察”,进入“干预”和“反事实推断”。

截图自邓金秋演讲 PPT

我们将这一过程分为四步:

  • 构建因果图: 结合行业知识,清晰定义动作、结果、混淆因子和中介变量;

  • 数据准备与消偏:利用随机实验或倾向性评分等方法,消除历史数据的决策偏差,为效果学习提供可信样本;

  • 因果建模: 估计不同动作在给定状态下的“增量收益”,而不是仅仅拟合历史;

  • 效果评估: 摒弃单纯的预测误差指标,转而关注 Uplift、Policy Value、ROI 与在线实验,验证它是否真的提升了策略选择质量。

京东落地实践:海量商品下的定价决策仿真

在京东,自营商品规模极其庞大,背后是超万亿的零售收入。这里的定价,绝不是人工拍脑袋或者写几条规则就能搞定的。

京东的定价决策不仅影响销售,还要联动全国 1600+ 自营仓、2000+ 云仓的库存与履约效率。定价不是单点预测问题,而是一个典型的高频“动作改变未来结果”的策略决策问题。

真实世界中,价格往往不是一个数字,而是一套极度复杂的组合策略(基础价+周五打折+满减+优惠券)。为了在如此复杂的策略空间中推演销量,我们构建了一个面向定价决策仿真的“动态因果响应模型”。

在架构上,我们将:

  • 商品状态塔引入 VLM 处理图像,文本处理品牌、属性;

  • 历史时序塔引入历史价格、销量序列、流量与活动序列;

  • 未来策略塔,将复杂促销规则转化为 LLM 能理解的序列表示进行深度融合。

更关键的是,我们为模型引入了极为严苛的三维评估与约束框架:

  • 销量预估准确率: 预估曲线必须贴合实际;

  • 因果幅度一致性约束: 降价带来的销量起伏幅度,必须与历史上真实的因果效应对齐;

  • 因果逻辑合理性约束: 强行向模型注入经济学常识。如果模型预测出“降价反而导致销量暴跌”这种反常识结果,会在训练时受到惩罚,保证局部扰动下的单调性合理。

实践证明,引入因果约束后的模型,不仅预估更准,而且能极其敏锐地识别出不同价格策略带来的真实收益差异,有效支撑了京东自动化定价的高效流转。

未来,商业世界模型将进一步从单一的价格决策,走向价格、促销、广告、库存的全面协同优化,支撑更好水平的自治经营。

现场精彩问答实录 (Q&A)

Q:物流行业 ToB 的报价(如整车调度)极其复杂,这种场景如何利用因果模型制定价格?

邓金秋: ToB 物流定价通常分三步走:

第一是守住“成本底线”,必须精准计算油费、人力等刚性成本;

第二是看清“竞争环境”,对齐市场水位;

第三才是因果推断发挥作用的地方——寻找历史数据的差异空间。

我们可以通过模型测算,在特定的路线或节点上,降价到底能不能带来真实的单量增长(价格弹性),从而在成本底线与竞争红线之间,找到利润最大化的最优报价。

Q:目前很多企业还在用 Excel 算报价,极度耗时,新技术能解决吗?

邓金秋:这正是 Agentic Commerce 最典型的落地场景!现在完全可以通过构建 Agent 工具,利用大语言模型强大的非结构化数据处理能力,自动解析客户发来的各种杂乱无章的询价文本或表格。

Agent 可以在后台自动调取运力限制和成本模型,一键生成结构化的最优报价单,这将极大释放前端业务人员的生产力。

Q:遇到长尾商品(销量极低、数据稀疏),因果模型失效了怎么办?

邓金秋: 这是一个非常经典的业界痛点。对付长尾/冷启动商品,有三个解法:

  • 借力打力:不能死盯单品数据,必须引入类目、品牌、图片文本等“泛化特征”,让模型学会举一反三;

  • 转变思路:既然销量预测不准,就把它降维成一个“二分类转化率”问题——不求算准能卖几件,只算降价后能不能破零;

  • 规则兜底:当模型置信度极低时,果断引入 Rule-based(基于规则)策略兜底,比如设定长尾死库存强制降价清仓的硬逻辑,确保系统整体的鲁棒性和经营安全。

本文基于 SITS 2026 大会邓金秋演讲实录整理发布,如需更多关于 2026 奇点智能技术大会演讲 PPT与分享实录,可添加微信小助手「csdn-01」领取。

推荐阅读:

人均奖金达610万?SK海力士回应;微信灰度测试转账「组合支付」;黄仁勋:应届生们别怕AI,当下是开启事业的最佳时机 | 极客头条

开源打破“AI黑箱”!集结全球大咖,GOSIM Paris 2026带你看懂Agent时代大变局

“今年还没亲手写过一行代码”,Claude Code之父自曝:CC诞生源于“偶然”,现主要在手机上干活

加入AMD AI 开发者计划与全球极客共筑开源

加入即领 50 小时免费云算力

进群抽显卡、AIPC,好运不停

活动与工作坊,早鸟名额优先锁定

AMD Al Academy 官方课程,加速

立即扫码加入⬇️⬇️

http://www.jsqmd.com/news/807831/

相关文章:

  • 深圳养发馆哪家生发评分高? - 中媒介
  • “35岁危机”的真相:是年龄歧视,还是能力停滞?—— 软件测试从业者的深度剖析
  • ElasticSearch 从入门到实战:全文检索服务全解析
  • 白帽江湖实战靶场SQL注入篇:SQL注入 - 报错注入(大小写过滤)
  • 矩阵视频融合:打破摄像机孤岛,实现厘米级跨镜无缝追踪
  • 开源本地记忆管理工具mimibox:打造私有第二大脑
  • MCP服务器精选指南:为AI编程助手赋能,提升开发效率
  • 内卷与躺平之间,技术人的第三条路是什么?
  • Ziatype印相提示词失效真相,深度解析化学显影逻辑映射到AI语义空间的5层转换断点
  • Windows驱动清理终极指南:DriverStore Explorer完全使用教程
  • 2026年5月长春优质驾驶员培训中心大揭秘
  • 从芯片型号XC7Z045-2FFG900I说起:手把手教你读懂Xilinx Zynq7000的完整命名规则
  • Linux CH341SER驱动终极指南:解决Arduino串口连接问题的完整方案
  • 从技能孤岛到价值网络:如何系统化构建可变现的复合型技能组合
  • 2026年成都进出口公司注册实战榜单,为你揭秘注册全流程! 成都公司注销/成都代理记账/成都资质代办 - 品牌推荐官方
  • 终极图形化方案:Applite如何让Mac软件管理变得简单快速
  • AI自动化科研工具链:从文献管理到知识图谱的实践指南
  • DP-1000协议分析仪:FPGA技术在多标准有线网络测试中的突破
  • 从零生成电影级短视频,不写代码不装显卡:ChatGPT智能分镜+Sora 2一键成片全流程,限时开放3个企业级Prompt库
  • 3个核心技术突破:深度解密游戏资源解析工具的实现奥秘
  • 北京古玩字画回收避坑指南,5家正规机构推荐 - 品牌排行榜单
  • 2026年知网AI检测翻车实录:手写论文竟被标红?这届学生太无奈! - 降AI实验室
  • Cheshire Cat AI:基于微服务与插件化的AI智能体框架实战指南
  • 猕猴桃即食技术专业哪家好? - 中媒介
  • Cursor使用统计工具:量化AI编程效率,优化开发者工作流
  • 国产替代之SI9424DY与VBA2216参数对比报告
  • 2026 济南黄金回收高价变现指南|靠谱门店盘点,拒绝隐形扣费 - 奢侈品回收测评
  • Springer文献PDF元数据丢失?用Perplexity反向溯源原始DOI的7种冷门方法(含Python自动化脚本)
  • AI角色塑造新范式:从情感母题到可执行技能树
  • 2026年成都AI搜索优化专业机构TOP6深度评测报告,为你揭秘! 成都GEO外包/成都GEO公司/成都GEO - 品牌推荐官方