当前位置: 首页 > news >正文

JVET-AI0084

一、ALF 的原有问题(ECM-13.0 中存在的问题)

1. APS-ALF 系数跨帧复用但缺乏自适应能力

在 ECM-13.0 中:

  • 非固定 APS-ALF 的滤波系数:

    • 由编码器针对某一帧优化
    • 可被后续多帧复用
  • 解码端对所有使用该 APS 的帧:

    • 以相同强度应用 ALF 校正

👉 问题在于:

不同帧在内容特性、QP、噪声水平上存在显著差异,而滤波强度保持不变


2. 滤波强度不匹配导致 RD 性能受限

具体表现为:

  • 对某些帧:

    • ALF 校正偏弱,去噪不足
  • 对另一些帧:

    • ALF 校正偏强,产生过平滑
  • 这种失配:

    • 无法通过 CTU 级 ALF on/off 完全解决
    • 影响整体 RD 性能

📌 本质问题:

ALF 只能“开或关”,但“强度不可调”


3. 重新估计 APS 系数代价高

  • 若为每帧重新生成 APS-ALF:

    • 增加编码复杂度
    • 增加 APS signaling 开销
  • ECM-13.0 中缺乏:

    • 轻量级的帧级强度调节机制

二、AI0084 提出的解决方法(ALF residuals scaling)

1. 核心思想:缩放 ALF 残差而非修改滤波器

AI0084 不改变:

  • ALF 滤波结构
  • APS-ALF 系数本身

而是对ALF 产生的校正残差引入缩放因子

rec′(s)=rec(s)+corr(s)⋅scale23 rec'(s) = rec(s) + \frac{corr(s) \cdot scale}{2^3}rec(s)=rec(s)+23corr(s)scale

其中:

  • (corr(s)):ALF 计算得到的校正残差
  • (scale):缩放因子

👉 实现“滤波强度可调”


2. 缩放因子的信令方式(轻量级)

(1)按 Slice 信令

  • 缩放因子在slice header中传输
  • 不引入 CTU 级额外信令

(2)Luma 支持按 class 分组缩放

  • luma 的 25 个 ALF class index:

    • 按组划分
    • 每组共享一个 scaling factor
  • 通过:

    • idxGroup决定组数
    • idxScale[n]指定每组缩放因子

📌 允许:

  • 不同纹理 / 活动度区域
  • 使用不同 ALF 强度

(3)Chroma 使用单一缩放因子

  • 每个 chroma 分量:

    • 仅信令一个 scaling factor
  • 控制复杂度和比特开销


3. 缩放因子查表实现,复杂度极低

  • 缩放因子值来自SPS 预定义表

  • 实现为:

    • 整数乘法 + 移位
  • 不引入额外浮点或复杂运算


4. 带来的效果

  • 不改变 APS-ALF 系数的前提下:

    • 适配不同帧特性
    • 改善 RD 性能
  • 实验结果表明:

    • RA / LDB / LDP 下均有稳定 BD-rate 降低
    • 编码与解码复杂度几乎不变

http://www.jsqmd.com/news/239405/

相关文章:

  • 小白也能玩转机器翻译:手把手教你用HY-MT1.5-1.8B
  • 从零构建Claude Agent:Skills、Projects与MCP的架构设计与实践(建议收藏)
  • 考虑过网费用分摊的多产消者点对点能源交易分布式优化系统说明
  • MediaPipe Pose实战:舞蹈动作识别系统部署
  • 小白也能玩转大模型:手把手教你用HY-MT1.5-1.8B搭建离线翻译服务
  • MediaPipe模型部署:AI人脸隐私卫士环境配置
  • 基于CAN总线的UDS NRC错误响应处理详解
  • MediaPipe姿态识别误检规避:背景复杂场景优化策略
  • RTX3060跑出180token/s:通义千问2.5-0.5B性能测试
  • es连接工具数据传输安全机制:图解说明
  • 灵活用工系统:打破传统边界的未来企业引擎
  • 一键部署IQuest-Coder:快速搭建个人编程AI助手
  • 2025年12月GESP真题及题解(C++八级): 宝石项链
  • 2026年GEO服务商评测:高客单价行业如何靠AI破局?深度对比三类玩家,揭秘原圈科技领跑之道
  • AI隐私保护在人力资源的应用:员工照片处理方案
  • Misra C++与CI/CD流水线集成:自动化检测方案设计
  • 实时系统中ISR编写的最佳实践与避坑指南
  • 手把手教你用Qwen2.5-0.5B-Instruct搭建智能编程助手
  • 绿色安全框提示功能解析:AI人脸卫士WebUI使用指南
  • ‌测试可访问性银行应用:面向软件测试从业者的专业实践指南
  • 新手如何从零到一落地实践接口自动化测试
  • JSON输出神器:通义千问2.5-0.5B结构化数据处理
  • libusb异步编程模型图解说明:状态机流转分析
  • 可访问性测试自动化挑战:技术深水区与破局之道
  • 新手必看:RS232串口通信常见问题与解决方法
  • Elasticsearch菜鸟教程:新手避坑指南(常见错误汇总)
  • AI手势识别与追踪车载系统:驾驶中免触控操作实现
  • 测试可访问性教育平台
  • 人体姿态估计进阶:MediaPipe Pose模型压缩技术
  • 从零开始学AI对话:Qwen2.5极速版手把手教学