当前位置: 首页 > news >正文

【论文学习】CVPR 2026 和 ICLR 2026论文

CVPR 2026| OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens

OmniLottie:基于参数化 Lottie 令牌的矢量动画生成

OmniLottie 是首个端到端多模态矢量动画生成框架,通过自研 Lottie 分词器实现 10 倍压缩,结合预训练视觉语言模型,支持文本、图像、视频输入生成小体积、高清无损、可编辑的 Lottie 矢量动画,同时开源了包含 200 万个动画的大规模 MMLottie-2M 数据集,解决了传统 AI 生成动画文件大、无法无限高清、不可编辑的痛点。

CVPR 2026| OpenDPR: Open-Vocabulary Change Detection via Vision-Centric Diffusion-Guided Prototype Retrieval for Remote Sensing Imagery

OpenDPR:面向遥感影像的、以视觉为中心的扩散引导原型检索实现开放词汇变化检测

OpenDPR 是首个基于扩散模型的零训练、开放词汇遥感变化检测框架,通过「扩散模型生成视觉原型 + DINOv2 提特征 + SAM 定位变化区域 + 视觉空间匹配」的 pipeline,实现了无需提前限定类别、几乎无需训练的遥感图像变化检测,还推出了弱监督升级版本 OpenDPR-W,仅用图像级标签即可完成优化。

ICLR 2026| PMDformer: Patch-Mean Decoupling Information Transformer for Long-term Forecasting

PMDformer:面向长期时序预测的 Patch 均值解耦信息 Transformer

PMDformer 是针对 Transformer 长时序预测中「数值尺度干扰注意力建模」问题提出的创新框架,通过Patch 均值解耦(PMD) 强制分离数据的水平偏移与形状相似性,让注意力只关注时序形状;同时搭配近邻变量注意力(PVA)和趋势恢复注意力(TRA),在不丢失全局趋势的前提下,大幅提升长时序预测的精度与效率。

ICLR 2026| Distributional Vision-Language Alignment by Cauchy-Schwarz Divergence

基于柯西 - 施瓦茨散度的分布型视觉 - 语言对齐

CS-Aligner 是针对 CLIP 等传统方法仅做样本对对齐、忽略全局分布差异的痛点提出的极简多模态对齐框架,通过柯西 - 施瓦茨(CS)散度强制对齐图像与文本的全局特征分布,同时用互信息保证细粒度语义匹配,实现了 “既管好每对图文、又管好整体分布” 的更紧致、精准的跨模态对齐,显著提升了文生图等下游任务效果。

http://www.jsqmd.com/news/609408/

相关文章:

  • 手把手教你解决i.MX6ULL双网卡频繁掉线:从时钟波形异常到引脚驱动能力调整
  • 第一篇博客:从新开始学习C语言
  • windows下如何生成ssl证书
  • ALAD-K1551T(P)精准赋能,打造高效医疗体检一体机
  • 从Labelme到Label-studio:图像与文本标注工具的全方位对比与应用指南
  • Uniapp + uCharts 实时图表不闪的秘密:关闭动画和设置update:true就够了?
  • 前端八股文面经大全:腾讯前端一面(2026-04-04)·深度解析
  • 【Blazor安全红线预警】:2026新CSRF防护机制源码级拆解,3类高危漏洞已在RC1中静默修复
  • 【YOLOv5】损失函数设计思想与工程实现剖析
  • 突破端侧极限!让 Gemma 4 在手机不仅能跑,还能“用中文张口说话” —— 安卓端侧大模型
  • 宗源智谱:用科技为家族立传,让每一段血脉都有迹可循。
  • 从IDE到Terminal:适合后端宝宝体质的Claude Code工作流
  • 网络安全系列【亲测有效】:openvas(gvm)官方安装教程--格林博恩社区集装箱(中文版) Greenbone Community Containers(英文版)
  • 终极模组管理器:XXMI启动器让多游戏模组管理变得简单高效 [特殊字符]
  • 二叉树层序遍历与高度计算详解
  • Mojo-Python混合调试实战:VS Code+GDB+Mojo Debugger三端联动排错(含2026最新符号表映射漏洞修复补丁)
  • 别再让用户输密码了!华为欧拉系统systemctl权限下放实战(附visudo安全操作指南)
  • 可测试性设计:让代码更容易被测试——软件测试从业者的专业指南
  • 【仅限首批200名工业自动化开发者】:C# OPC UA高可用集群方案白皮书(双活发布订阅+故障自动切换+毫秒级RTO实测数据)
  • 压电陶瓷震动传感器的特性与JFET放大电路设计
  • MIKEURBAN几种错误解决方法
  • GCN实战解析:从谱图卷积到半监督节点分类
  • 目标检测进阶—Cascade R-CNN 的多阶段优化策略解析
  • 《Signal, Image and Video Processing》投稿避坑指南:从LaTeX排版到审稿全流程解析
  • 揭秘MySQL索引分类仕
  • Windows 11终极优化指南:使用Win11Debloat实现系统性能提升的完整教程
  • 代码之外周刊(第期):当技术让一切趋同,我们还剩什么?簇
  • 6月PMP紧急预警:错过这次,下次难度让你哭!附60天极简通关计划
  • 队列—链式队列
  • 2026人生第一双高跟鞋选购指南:轻奢女鞋标杆名录 - 资讯焦点