当前位置: 首页 > news >正文

带辅助轨道扩展的 MP4 (MP4-AT) 文件格式 0.9

MP4-AT文件格式支持在 ISOBMFF/MP4 结构中将有助于拍摄后编辑和合成的辅助轨道(例如深度图视频轨道)以及可播放的媒体数据一起存储。

此格式的目标是存储辅助轨道,以便将这些轨道隐藏起来,不向未实现此规范的客户端显示。这样可以防止客户端将辅助轨道解读为可播放的数据。

依赖项

以下是本规范所依据的规范性参考资料:

  • RFC 中用于指定要求级别的关键字
  • ISO/IEC 14496-12:2022 ISO Box 媒体文件格式 (ISOBMFF/MP4)
  • ISO/IEC 14496-10:2022 视听对象编码第 10 部分:高级视频编码 (AVC)
  • ISO/IEC 23008-2:2023 异构环境中的高效编码和媒体传送 第 2 部分:高效视频编码 (HEVC)
  • VP9 视频编解码器 (VP9)
  • AV1 比特流和解码流程规范 (AV1)
  • 动态深度 1.0 规范

简介

本文档按照 RFC2119 中定义的 IETF 标准使用“必须”“不得”“必需”“应”“不应”“建议”“可以”和“可选”字样。

MP4-AT 文件格式

MP4-AT文件格式由主要轨道和辅助轨道组成,可执行各种编辑操作。主轨道(例如,应用了虚化效果的视频轨道)会照常写入 MP4 文件中,而辅助轨道会写入辅助轨道 MP4中。辅助轨道 MP4是另一种符合 MP4 标准的容器,位于axte(辅助轨道扩展)框中。建议将axte盒子作为文件中的最后一个盒子,这样便于通过截断文件来移除辅助数据。

此格式向后兼容:不支持此格式其余部分的播放器在加载文件时会读取并播放主要视频轨道。

该文件包含一个带有mdta处理程序的moov.meta框,其中包含以下元数据。元数据可按任意顺序显示。

元数据键

类型指示器

auxiliary.tracks.offset

78(大端 64 位无符号整数)

axte框的文件偏移量(以字节为单位)

auxiliary.tracks.length

78(大端 64 位无符号整数)

axte框的长度(以字节为单位)

注意:大多数主流编辑器都支持元数据,因此即使 axte 框已被剥离,MP4 文件可能仍包含此残留元数据。因此,这些元数据不是确定性的,读者必须始终确认是否存在 axte 框。

辅助轨道扩展 (axte) 框

语法

axte盒使用 ISO/IEC 14496-12:2022: 4.2 中定义的盒的语义进行描述

aligned(8) class AuxiliaryTracksExtensionBox extends Box('axte') { bit(8) data[]; }

其中,data 字段包含辅助轨道 MP4

负载

axte框的载荷是辅助轨道 MP4辅助轨道 MP4采用常规的 MP4 结构。

辅助轨道 MP4包含所有辅助轨道的选段元数据。所有辅助轨道选段载荷都必须存储在辅助轨道 MP4mdat盒中,或外部 MP4 的mdat盒中(但不能同时存储在两个位置)。

在前一种情况下,auxiliary.tracks.interleaved必须设置为 0(请参阅下文中的“静态元数据”),并且axte.moov框中的采样偏移量相对于辅助轨道 MP4的开头。这使得辅助轨道 MP4是自包含的,这意味着辅助轨道 MP4可以独立读取,而无需引用外部 MP4。

在后一种情况下,auxiliary.tracks.interleaved必须设置为 1(请参阅下文中的“静态元数据”),axte.moov框中的采样偏移量相对于文件的开头,并且主要轨道和辅助轨道的采样载荷可以交错。在这种情况下,axte.mdat框可以不存在。

静态元数据

辅助轨道 MP4包含一个包含mdta处理程序的moov.meta框,其中包含以下元数据。元数据可按任意顺序显示。

元数据键

类型指示器

(可选)auxiliary.tracks.interleaved

75(8 位无符号整数)

0:表示采样点未交错,且位于axte.mdat框中

1:表示采样点交错地位于主视频轨道的mdat框中

所有其他值均已预订,不得使用。

如果没有此元数据,则默认值为 0。

auxiliary.tracks.map

0(预留)

二进制格式:

  • 1 字节版本 = 1
  • 1 字节曲目数 = n
  • n 个字节,表示以下集合中的轨道类型
    • 0 = 视频清晰
    • 1 = 深度视频(线性)
    • 2 = 深度视频(反向)
    • 3 = 时间深度元数据
    • 4 = 半透明视频
    • 5-127 = 预留以供日后使用
    • 128-255 = 自定义轨道类型

auxiliary.tracks.map中轨道类型的顺序表示这些轨道在辅助轨道 MP4载荷中的顺序。

辅助轨道类型

辅助轨道 MP4可能包含以下对编辑有用的视频和元数据轨道。

注意: 所有计时轨道的访问单元时间戳应保持一致。客户端可能不支持插值,因此如果时间戳不一致(例如,深度轨道和清晰视频轨道的帧速率不同),客户端可能会丢弃帧。

锐化视频轨道

未应用可编辑特效的完整分辨率视频。视频轨道的存储分辨率可能与主视频轨道不同。清晰视频轨道可以使用任何常见的视频编解码器,并且可以是标准动态范围或高动态范围。

深度视频轨道

深度视频轨道提供编码为标准灰度视频的深度信息。这样做是为了允许在没有任何深度专用解码或编码支持的设备上解码和编码深度轨道。深度视频轨道可以使用 H.264/AVC、H.265/HEVC、VP9、AV1 或任何其他常见的视频编解码器。深度视频轨道可以是 8 位或 10 位,并且采用线性或反向编码(请参阅动态深度 1.0 规范)。

时间戳深度元数据轨道

同步深度元数据轨道包含用于计算深度的归一化值,以及可用于计算散景效果的模糊半径的焦点表。

MIME 类型示例

application/x-depth-metadata

语法示例

二进制格式(所有整数均采用小端字节序):

  • 近距离(16 位浮点数)
  • 远距离(16 位浮点数)
  • 焦点表条目数(16 位整数)
  • 焦点表条目
    • 进入距离(16 位浮点数)
    • 条目半径(16 位浮点数)
半透明视频轨道

用于存储相应帧中每个像素的 Alpha 值(透明度)的视频轨道。最小值表示完全透明,而最大值表示完全不透明。介于两者之间的值表示线性刻度上的不同半透明度级别,而合成使用非预乘色值的正常混合模式。与深度视频轨道类似,此轨道也应编码为标准灰度视频。

用例示例

  • 在主要轨道中存储可播放的渲染的虚化视频,辅助视频轨道用于存储原始(模糊处理前)锐利的颜色数据和深度图,辅助同步元数据轨道包含反映每个帧焦点的深度元数据。然后,您可以在视频编辑器中使用辅助轨道来修改焦点正文并重新渲染高质量的虚化视频轨道。

  • 在主视频轨道中存储预渲染的半透明“贴纸”视频(例如,白色背景上的动画表情符号视频),辅助视频轨道包含 Alpha 映射。然后,合成器可以使用辅助轨道的半透明度信息将贴纸与背景混合。

http://www.jsqmd.com/news/500740/

相关文章:

  • GLM-4.7-Flash效果实测:代码生成、多轮对话,30B模型实力如何?
  • 山东微程科技:告诉你什么是 养 “龙虾” ?
  • 毕业设计实战:基于SpringBoot的停车场管理系统设计与实现全攻略
  • 别再手动写EasyExcel枚举转换了!复用@EnumView注解,一套代码搞定前后端导出
  • 丹青幻境效果展示:青衣倚楼听雨——Z-Image生成的12组惊艳水墨风作品
  • 计算机行业含金量超高的八大证书❗️❗️
  • 高端电流检测芯片FP135,增益可通过外部电阻自由调整,输出电压与负载检测电流成线性变化
  • 从修改源码到插件生成:STM32CubeIDE代码自动补全全流程解析
  • 实现链式存储结构的队列
  • JVM配置参数小记
  • 计算机毕业设计springboot社团活动管理系统 基于SpringBoot的高校社团数字化运营平台 SpringBoot框架下的学生社团协同管理系统
  • 电力电子新手必看:电压型与电流型逆变电路的区别与选型指南
  • 从管道工到网络专家:用生活案例讲透烽火ANM2000的SVLAN/CVLAN配置
  • Ostrakon-VL-8B效果展示:低照度夜市摊位图像中招牌文字92%还原准确率
  • QGIS搭配QuickOSM:免费获取全球矢量地理数据的实战指南(道路、水域、行政边界)
  • HDR图像处理中的‘遮蔽与燃烧‘技术:从150年摄影史到现代算法实现
  • 2026年期货量化软件代码可读性排名_维护成本对比
  • 给机器人看《资本论》:它组织首次罢工
  • AD9253高速ADC实战指南:SPI寄存器配置与数字采集系统搭建
  • 安装AndroidStuido
  • 2026年网易企业邮箱联系电话及最新报价一键获取 - 品牌2025
  • STM32F407+OV7670图像采集实战:从硬件连接到DCMI配置全流程解析
  • 深入解析VS中C#语言版本与.NET Core版本的查看与配置技巧
  • 霜儿-汉服-造相Z-Turbo多模态扩展初探:结合语音描述生成汉服形象
  • 《OpenClaw架构与源码解读》· 第 14 章 安全模型:把 AI 放在家里但不「放飞」它
  • 2026年陕西防静电地板选型指南:机房建设、净化车间、全钢/陶瓷/PVC地板,众鑫设备一站式服务解析 - 海棠依旧大
  • wvp-GB28181-pro多端口模式实战:如何用30000-30500端口实现高并发级联?
  • 陪跑300多家客户总结出的餐饮小红书账号起号逻辑 - Redbook_CD
  • 2026年好用的农产品礼盒包装推荐厂商,费用大概多少钱 - myqiye
  • PP-DocLayoutV3法律文书智能解析实战