当前位置: 首页 > news >正文

av1编码--编码块的预测约束条件

目录

3.3编码块的预测约束条

3.3编码块的预测约束条件

硬件解码器的核心计算单元通常是围绕超级块设计的。如果将超级块的大小从 64×64 增加到 128×128,核心计算单元所需的硅面积将增加约 3 倍。为了降低解码器的硬件设计复杂度,只有尺寸小于或等于 64×64 的像素区域才被允许使用帧内预测模式。另外,帧内预测模式虽然是以编码块为基本单元进行编码的,但是真正的帧内预测却不是以编码块为基本单元来进行的。正如即将在 3.4 节介绍的那样,为了捕捉预测残差的空域和频域特性,AV1 允许把编码块分割成多个变换块。当编码块被分割成多个变换块时,以编码块为基本单元进行帧内预测时,待预测像素与参考像素之间的距离有时会跨越多个变换块,从而导致帧内预测的准确性下降。为了提高帧内预测的准确性,AV1 的帧内预测是以变换块为基本单元进行的。所以,当编码块的尺寸是 128×128 时,该编码块会被强制划分为 4 个尺寸为 64×64 的变换块。

图 3-8 为 8×8 的编码块被分割成 4 个 4×4 的变换块在水平帧内预测模式下的参考像素示意图。如果帧内预测以编码块为单位进行,则待预测像素与参考像素之间跨越了一个变换块,如图 3-8a 所示。而在以变换块为单位的帧内预测中,预测像素使用的是与其直接相邻的左侧 / 上方变换块的重构像素值作为参考像素,所以预测像素与参考像素之间的距离更近,如图 3-8b 所示。因此基于变换块的帧内预测的准确性更高。在图 3-8b 中,预测像素将其左侧相邻变换块的重构像素作为参考像素。从中可见,相比于图 3-8a 中预测像素与参考像素之间的距离,图 3-8b 中预测像素与参考像素的距离更近。

图3-8包含4个变换块的8x8编码块在水平帧内预测模式下的参考像素示意图

在另一个的极端情况下,如文献 [1] 所述,使用 4×4 编码块会增加 YUV420 格式视频的最差编码延迟,这种情况发生在所有编码块都是 4×4 亮度像素并且使用帧内预测模式进行编码时。这是因为在 4×4 编码块的帧内预测中,每个 2×2 色度块都需要经过帧内预测和变换编码。由于帧内预测需要使用相邻块的重构像素作为参考像素,所以,对每个 2×2 色度块执行帧内预测会极大地增加色度分量的解码复杂度。为了降低色度分量的解码复杂度,AV1 采用一种基于编码块尺寸限制的色度块编码模式。

对于色度采样格式为 4:2:0 的视频,当编码块的尺寸是 4×H 或者 W×4 时,它所对应的色度块尺寸是 2×H/2 或者 W/2×2。在基于编码块尺寸限制的色度块编码模式下,尺寸为 2×H/2 或者 W/2×2 的色度块可以做帧间预测,但是不允许做帧内预测。为此,在编码过程中,AV1 把多个 2×H/2 或者 W/2×2 色度块合并成一个尺寸为 4×N 或者 N×4 的色度块,并且把这个尺寸为 4×N 或者 N×4 的色度块与其中一个亮度编码块绑定在一起进行编码。在这种情况下,只有与色度块绑定的编码块存在色度分量并且其色度分量块大小是 4×N 或者 N×4,而其余编码块是没有色度分量的。

在预测过程中,如果每一个 2×H/2 或者 W/2×2 色度块所对应的亮度块是采用帧间预测模式,则这个 4×N 或者 N×4 色度块将以 2×H/2 或者 W/2×2 色度块为基本单位进行帧间预测,每个 2×H/2 或者 W/2×2 色度块使用其对应亮度块的运动信息。否则,即有一个 2×H/2 或者 W/2×2 色度块所对应的亮度块采用帧内预测模式,这个 4×N 或者 N×4 色度块将使用与其绑定的亮度块的预测模式进行预测。在这种情况下,当与其绑定的亮度块是帧间预测时,这个 4×N 或者 N×4 色度块将使用该亮度块的运动信息,以 4×N 或者 N×4 为单位执行帧间预测。当与其绑定的亮度块是帧内预测时,这个 4×N 或者 N×4 色度块也将使用帧内预测模式,以 4×N 或者 N×4 为单位执行帧内预测。下面以一个被分割成 4×4 编码块的 8×8 块为例,来说明这种基于编码块尺寸限制的色度块编码模式的编码方法,如图 3-9 所示,其中黑色圆点表示亮度像素,灰色圆点表示色度像素。

图3-9基于编码快尺寸限制的色度块编码模式示意图

在这个示例中,AV1 将把 4 个 4×4 编码块所对应的 4 个 2×2 色度块合并成一个 4×4 的色度块(图 3-9b 黑色边框标记),并把该 4×4 色度块与图 3-9a 右下角的 4×4 编码块绑定在一起进行编码。所以,图 3-9a 中只有右下角的 4×4 编码块存在色度分量并且其色度分量块大小是 4×4,而其余 3 个 4×4 编码块是没有色度分量的。这个 4×4 的色度块预测方案可以描述如下:

  • 如果 4 个 4×4 编码块包含一个或多个帧内预测编码块,那么,该 4×4 色度块使用图 3-9a 右下角的 4×4 编码块的预测模式进行预测。
    • 当图 3-9a 右下角的 4×4 亮度编码块使用帧间预测模式时,这个 4×4 的色度块将使用图 3-9a 右下角的 4×4 亮度编码块的运动信息执行 4×4 块大小的帧间预测。
    • 当图 3-9a 右下角的 4×4 亮度编码块使用帧内预测模式时,这个 4×4 的色度块将执行 4×4 块大小的帧内预测。
  • 如果 4 个 4×4 编码块都是帧间预测块,则这个 4×4 色度块以 2×2 色度块(图 3-9b 黑色边框中的划分方式)为基本单位进行帧间预测,每个 2×2 色度块使用其对应的 4×4 块大小亮度块的运动信息。
http://www.jsqmd.com/news/891171/

相关文章:

  • 单图扩散模型实战:多尺度与提示学习实现精准图像编辑
  • 物理生物学研究报告【20260018】
  • Linux 环境变量详解:PATH、export、source 到底是什么?
  • CDR标准体系再添三件套:组网、业务、工程同步落地
  • 百度网盘下载加速终极指南:使用Python工具实现满速下载的完整教程
  • 如何利用组策略精准管控USB与可移动存储设备
  • 系统辨识选最小二乘还是最大似然?一个传感器噪声的例子讲明白
  • 从“飞起来”到“管得好”:2026工程进度低空管理系统供应商推荐 - 品牌2025
  • 3大智能特性重塑象棋辅助体验:视觉识别+实时分析+多平台适配
  • OpenCode + oh-my-openagent 实践全记录
  • 软件测试专栏(10/20):安全测试实战:OWASP Top 10漏洞检测与防护
  • 新鲜出炉!2026高级PDF编辑器推荐排行 专业实测榜单 - 极欧测评
  • 3分钟快速上手:NCBI基因组下载终极指南,让数据获取从未如此简单
  • 2026年5月欧米茄“非官方售后”陷阱深度起底报告 - 资讯纵览
  • 2026 年 5 月在线考试系统哪家靠谱?从功能题库实测推荐 - 讲清楚了
  • PaCE-RL:基于强化学习的ICU患者个性化血糖管理框架解析
  • acbDecrypter:游戏音频文件解密与转换的完整解决方案
  • KaTrain围棋AI训练平台:解锁你的围棋潜能,用AI提升棋力!
  • 【ACM出版、过往最快4.5个月检索】第二届人机交互与机器学习国际学术会议(HCIML 2026) - 每天学术做一点
  • BMEA-ViT:基于多头外部注意力的轻量级乳腺癌病理图像分类模型
  • 旺哥黄金回收(连锁品牌)|2026年5月绵阳黄金回收价格行情+连锁品牌优势+避坑指南+真实案例(涪城/游仙/高新/经开/科创园/安州通用) - 润富黄金珠宝行
  • 软硬件协同验证:从功能等价到需求驱动的两种形式化方法
  • 2026年南通短视频代运营与本地获客服务商深度横评指南 - 优质企业观察收录
  • 垃圾处理设备综合实力TOP榜发布:河南多瑙河机械深耕陈腐填埋垃圾治理成行业标杆 - 新闻快传
  • LFDP算法解析:局部特征判别投影的原理、实现与调优
  • 安徽省芜湖市寄快递省钱攻略|2026全网实测!小众靠谱寄件渠道,告别门店溢价 - 时讯资讯
  • 2026年5月冷制皂代工厂对比:基于重资产合规矩阵与品牌资产化的深度权威研报 - 资讯焦点
  • Python换行符深度解析:从\n、end到os.linesep的工程实践
  • 终极指南:如何快速解决Windows热键冲突的完整方案
  • 5步掌握U-Net图像分割:如何用Keras实现深度学习医学影像分析?