当前位置: 首页 > news >正文

WWW 2026 利用知识图谱不但能够感知时间,还能“预判未来事件”?

01|研究背景:事件预测为什么需要“动态多模态”?

传统知识图谱通常关注结构化事实,例如:

主体 — 关系 — 客体
例如:Trump — LiveAt — White House

但现实世界中的事件并不是静止的。一个实体在不同时间会出现不同的事件、文本描述和图像信息。也就是说,知识图谱中的信息会随着时间不断变化。

作者指出,真实场景中的多模态时间知识不仅包含结构四元组:

subject,relation,object,timestamp

还包含随时间变化的辅助模态,例如文本描述和图像信息。

图1中通过 Trump 相关事件展示了结构、文本、图像如何随时间共同演化。

02|现有方法的核心不足

作者认为,已有研究主要存在两类问题:

● 问题一:动态知识获取不充分

不少方法只能建模单一结构空间,或者只能捕捉浅层关系。
但知识图谱中的结构并不只有一种几何形态:

  • 欧氏空间更适合表达链式关系;
  • 双曲空间更适合表达层次结构;
  • 复数空间更适合表达对称、反对称、逆关系和组合关系等逻辑模式。

因此,仅使用单一空间,很难完整表达多模态时间知识图谱中的复杂结构。

● 问题二:多模态融合过于静态

过去的多模态融合方法通常关注图像、文本、结构之间的静态交互。
但在事件预测任务中,不同模态在不同时间点的重要性并不相同。

例如,预测未来政治事件时,最近的结构关系可能比很久以前的图像信息更有用;而某些场景下,文本描述又可能比图像更关键。

作者因此提出:模型不仅要融合多模态,还要动态判断“哪个时间点、哪种模态更重要”。

03|DyMRL 是什么?

DyMRL 的全称是:

Dynamic Multispace Representation Learning

动态多空间表示学习模型

它的目标是:
从历史多模态时间知识图谱中学习结构、图像和文本的动态表示,并用于未来事件预测。

整体来看,DyMRL 由三个核心模块组成:

  1. 动态结构模态获取模块
  2. 动态辅助模态获取模块
  3. 双重融合—演化注意力模块

图2是整篇论文最重要的模型架构图,展示了 DyMRL 如何从结构、视觉、语言三类信息出发,经过融合与演化注意力,最终完成未来事件预测。

04|核心模块一:动态结构模态获取

作者将结构信息放入三个不同几何空间中建模:

① 欧氏空间:捕捉链式关联

欧氏消息用于建模局部邻居之间的直接关系。
它更像是在捕捉“谁与谁直接相关”的链式结构,体现一种类似人类联想记忆的能力。

② 双曲空间:捕捉高阶层次

双曲空间擅长表示层次结构。
作者利用双曲消息来捕捉事件之间更高阶、更抽象的层级关系,例如不同实体、事件群体之间的层次组织方式。

③ 复数空间:捕捉关系逻辑

复数空间用于表达知识图谱中的关系逻辑,例如:

  • 对称关系;
  • 反对称关系;
  • 逆关系;
  • 组合关系。

作者进一步将三类空间中的消息通过注意力机制融合,再使用多层图神经网络进行深层传播,从而获得更丰富的动态结构表示。

05|核心模块二:动态视觉与语言信息获取

除了结构信息,DyMRL 还引入了图像和文本。

● 视觉模态

作者使用预训练视觉模型提取实体在不同时间点对应的图像特征。
这些图像并不是静态附属信息,而是随时间变化的视觉线索。

● 语言模态

作者使用预训练语言模型提取时间敏感的文本描述。
例如某个实体在不同时间点的简介、新闻描述、事件说明,都可以为未来预测提供重要背景。

这两类辅助模态随后也会经过更新模块,形成动态视觉表示和动态语言表示。

06|核心模块三:双重融合—演化注意力

DyMRL 最关键的设计之一,是dual fusion-evolution attention

它分为两个层次:

第一层:Fusion Attention

这一层用于回答:

在同一个时间点,结构、图像、文本哪一种模态更重要?

也就是说,它负责在每个时间片内部进行多模态融合。

第二层:Evolution Attention

这一层用于回答:

在多个历史时间点中,哪些时间点的信息更重要?

也就是说,它进一步建模历史信息对未来事件的影响。

作者没有简单地让不同模态彼此互相分配注意力,而是引入初始化矩阵作为第三方注意力分配者,使模型能够更公平、更动态地学习不同模态与不同时间点的贡献。

07|实验设置:四个多模态时间知识图谱数据集

作者构建了四个多模态时间知识图谱数据集:

  • GDELT-IMG-TXT
  • ICE14-IMG-TXT
  • ICE0515-IMG-TXT
  • ICE18-IMG-TXT

这些数据集都包含结构、图像和文本三类信息,并按照时间顺序划分为历史集、当前集和未来集。

08|实验结果:DyMRL 明显领先

实验中,作者将 DyMRL 与两大类方法进行比较:

● 静态多模态方法

例如 TransAE、MoSE、OTKGE、IMF、DySarl 等。

● 动态单模态方法

例如 RE-GCN、TiRGN、CENET、RPC、ReTIN、LogCL、TempValid、CognTKE、ANEL 等。

结果显示,DyMRL 在四个数据集上都取得了最优表现。
例如在 MRR 指标上,DyMRL 分别达到:

  • GDELT-IMG-TXT:79.34
  • ICE14-IMG-TXT:62.84
  • ICE0515-IMG-TXT:75.83
  • ICE18-IMG-TXT:64.56

这说明 DyMRL 同时利用“动态结构建模”和“多模态动态融合”,确实比只使用静态多模态或动态单模态的方法更有效。

09|消融实验:哪些模块最关键?

作者进一步做了消融实验,验证每个模块的作用。

实验结果表明:

  • 去掉结构信息后,性能下降非常明显;
  • 去掉多层消息传播后,模型只能捕捉浅层结构,效果大幅降低;
  • 去掉注意力分配器后,模型退化为类似传统共注意力方法,性能明显变差;
  • 语言模态的贡献通常高于视觉模态;
  • 融合后的多模态表示优于单独使用某一种模态。

10|进一步分析:时间、模态和空间都很重要

作者还通过多组分析实验进一步解释 DyMRL 的优势。

● 不同时间点的贡献不同

越接近未来事件的历史时间点,通常预测价值越高。

● 多模态融合优于单模态

结构模态最重要,其次是语言模态,视觉模态也能提供补充信息。

11|总结:DyMRL 的主要价值

整体来看,作者提出的 DyMRL 有三点重要价值:

第一,它把多模态知识图谱从“静态融合”推进到“动态融合”

模型不再只是简单拼接结构、文本和图像,而是考虑这些信息如何随时间变化。

第二,它把结构学习从“单空间”扩展到“多空间”

欧氏空间、双曲空间和复数空间分别捕捉不同类型的结构特征,使模型能够更全面地理解知识图谱。

第三,它让事件预测更接近真实世界

真实世界中的事件发展依赖历史、文本、视觉和复杂关系。
DyMRL 正是试图把这些信息统一起来,从而更准确地预测未来事件。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

http://www.jsqmd.com/news/728624/

相关文章:

  • 如何让旧款iPhone和iPad重获新生:终极iOS设备恢复与降级指南
  • 别再只盯着防火墙了!用AIDE给你的CentOS 7服务器做个“文件指纹”体检(附自定义监控策略)
  • 3个关键步骤,让旧iPhone/iPad重获新生:系统降级与设备焕新指南
  • 电磁夹爪工况适配讲解:挑选正规电磁夹爪厂家技巧 - 品牌2026
  • 政策赋能校产融合 推动高校科技成果落地生根
  • VLC for Android:你的终极移动端万能媒体播放器解决方案
  • 别再让robosuite报EGL错误了!手把手教你用Panda机器人跑通第一个Lift任务(附完整代码)
  • Shinkansen
  • 无人机飞控开发避坑指南:从欧拉角到四元数,如何避免姿态解算中的万向节死锁
  • 环世界MOD管理器终极指南:3分钟解决加载顺序混乱,RimSort让MOD管理变得简单高效
  • 3大核心方案:彻底解决DouyinLiveRecorder中PandaTV录制失败的终极指南
  • 为 OpenClaw 配置 Taotoken 作为其大模型供应商的指南
  • 基于stm32ARM库函数的IIR二阶巴特沃斯低通滤波器--附完整代码
  • 终极指南:3步免费解锁你的Intel/AMD电脑100%性能潜力
  • 让每一辆车快速拥抱AI!东软开启座舱AI Agent平权时代
  • 国企领导:“现在都是 Agent自动开发了,你还在对话模式,太落后了!”我一点不慌:“这就去补,假期后见分晓!”领导露出满意的笑容。
  • MSP430 MCU从Flash到FRAM的存储技术演进与应用
  • Python突破验证码抓取贝壳二手房源数据
  • [具身智能-509]:全局混乱下的局部有序:不要用战术的勤奋掩盖战略的懒惰
  • AMD Ryzen处理器深度调试指南:使用SMUDebugTool实现精准性能调优
  • springboot+vue3的婚礼场景规划系统设计与实现
  • 【flutter for open harmony】第三方库Flutter 鸿蒙版 NFC功能 实战指南(适配 1.0.0)✨
  • 【Azure Container App】使用 yaml 部署 Container App 时遇见 400 Bad Request 错误
  • 决策框架:在技术选型、职业选择等关键节点如何不迷茫?
  • HPH内部构造大揭秘:三大系统配合节节通
  • 别再让模型‘偏科’了!PyTorch实战:用BCEWithLogitsLoss的weight和pos_weight搞定二分类数据不平衡
  • 时空动态热力图秒级渲染,R 4.5新geoviews引擎实操指南,错过再等两年
  • 【flutter for open harmony】第三方库Flutter 鸿蒙版 通知中心 实战指南(适配 1.0.0)✨
  • 内存带宽吃紧?GC风暴频发?R 4.5并行计算效率断崖式下降的5个反直觉元凶,今夜必须修复
  • 策略聚类技术:基于语义相似性的专业领域解决方案分类