当前位置：首页 > news >正文

别再混淆了！I420、NV12、NV21这些YUV格式到底怎么选？附FFmpeg实战代码

news 2026/5/23 12:34:29

别再混淆了！I420、NV12、NV21这些YUV格式到底怎么选？附FFmpeg实战代码

第一次接触YUV格式时，我盯着Android Camera2输出的NV21数据发呆了半小时——这些字节数组究竟该如何解析？为什么iOS的VideoToolbox偏偏要求NV12？当H.264编码器报出"不支持的像素格式"错误时，我才意识到：选错YUV格式会让整个视频流水线崩溃。本文将用真实项目踩坑经验，带你穿透I420、NV12、NV21的迷雾。

1. 解码YUV格式的本质差异

1.1 采样率：从444到420的妥协艺术

YUV格式的核心差异在于色度采样率。想象一张4x4像素的图片：

I444（4:4:4）：每个像素都有独立的YUV分量，共需16x3=48字节。这是Adobe Premiere等专业软件的首选，但你的手机摄像头绝不会用它——带宽消耗太大。
I422（4:2:2）：水平方向色度减半，垂直方向全采样。每行Y分量对应宽度/2个UV，内存占用降至16x2=32字节。广播电视级SDI接口常用此格式。
I420/NV12（4:2:0）：色度在水平和垂直方向都减半。4个Y共享1组UV，仅需16x1.5=24字节。这也是H.264/HEVC等编码器的"默认口粮"。

# 用ffprobe查看视频真实格式（你会惊讶于很多"RGB"视频实为YUV420） ffprobe -v error -select_streams v:0 -show_entries stream=pix_fmt -of csv=p=0 input.mp4

1.2 内存布局：Planar与Semi-Planar的玄机

I420（YUV420P）：典型的平面存储（Planar），三个独立数组存放Y/U/V。适合CPU端处理，但GPU渲染时需要合并纹理。

// FFmpeg中定义I420缓冲区 AVFrame *frame = av_frame_alloc(); frame->format = AV_PIX_FMT_YUV420P; frame->data[0] = y_plane; // Y分量 frame->data[1] = u_plane; // U分量 frame->data[2] = v_plane; // V分量

NV12/NV21：半平面存储（Semi-Planar），Y单独存放，UV交错排列。这种内存排布让移动端GPU狂喜——减少纹理绑定次数就能提升渲染效率。

格式	Y布局	UV布局	适用场景
I420	独立	U和V分别独立	CPU处理、跨平台编码
NV12	独立	UV交错（U在前）	iOS/Metal、Intel QSV
NV21	独立	VU交错（V在前）	Android Camera2输出

2. 平台战争：Android与iOS的格式偏好

2.1 Android的NV21"祖传代码"

在Camera2 API中，ImageFormat.NV21是默认输出格式。这源于历史兼容性考虑，但带来了两个现实问题：

编码器不支持：大多数硬件编码器（如OMX.qcom.video.encoder.avc）只接受NV12输入
渲染性能差：SurfaceTexture更偏好RGBA或NV12格式

// 典型Camera2配置片段（会得到NV21数据） ImageReader.newInstance( width, height, ImageFormat.YUV_420_888, // 实际可能是NV21 2 );

解决方案：通过RenderScript快速转换（比Java层快10倍以上）：

// 使用libyuv转换（Android NDK必备） #include <libyuv.h> libyuv::NV21ToNV12( src_y, src_stride_y, src_vu, src_stride_vu, // 注意VU顺序！ dst_y, dst_stride_y, dst_uv, dst_stride_uv, width, height );

2.2 iOS的Metal与NV12天作之合

VideoToolbox硬编码器明确要求输入为kCVPixelFormatType_420YpCbCr8BiPlanarFullRange（即NV12）。这是因为：

Metal纹理只需绑定Y和UV两个平面
A系列芯片的ISP（图像信号处理器）原生输出NV12

// 创建Metal兼容的NV12纹理 let textureDescriptor = MTLTextureDescriptor() textureDescriptor.pixelFormat = .r8Unorm // Y平面 textureDescriptor.width = Int(videoWidth) textureDescriptor.height = Int(videoHeight) let yTexture = device.makeTexture(descriptor: textureDescriptor) textureDescriptor.pixelFormat = .rg8Unorm // UV平面 textureDescriptor.width = Int(videoWidth / 2) textureDescriptor.height = Int(videoHeight / 2) let uvTexture = device.makeTexture(descriptor: textureDescriptor)

3. 编码器对决：H.264/H.265的格式要求

3.1 x264/x265的I420情结

开源编码器默认使用I420格式，因其平面结构便于CPU优化：

# x264编码命令示例（显式指定输入格式） ffmpeg -s 1920x1080 -pix_fmt yuv420p -i input.yuv -c:v libx264 output.mp4

但硬件编码器才是性能王者：

编码器类型	推荐输入格式	备注
Intel QSV	NV12	零拷贝直达GPU内存
NVIDIA NVENC	NV12	Windows需DX11 D3D11纹理
AMD AMF	NV12	建议使用Vulkan互操作

3.2 内存到显存的零拷贝技巧

通过FFmpeg实现GPU内存直传（以Intel QSV为例）：

AVBufferRef *hw_device_ctx = NULL; av_hwdevice_ctx_create(&hw_device_ctx, AV_HWDEVICE_TYPE_QSV, NULL, NULL, 0); AVFrame *hw_frame = av_frame_alloc(); hw_frame->format = AV_PIX_FMT_QSV; hw_frame->hw_frames_ctx = av_hwframe_ctx_alloc(hw_device_ctx); AVHWFramesContext *frames_ctx = (AVHWFramesContext*)hw_frame->hw_frames_ctx->data; frames_ctx->format = AV_PIX_FMT_QSV; frames_ctx->sw_format = AV_PIX_FMT_NV12; // 关键设置！ frames_ctx->width = width; frames_ctx->height = height; av_hwframe_ctx_init(hw_frame->hw_frames_ctx);

4. 实战：FFmpeg格式转换全攻略

4.1 软件转换的金科玉律

当需要高质量转换时，FFmpeg的sws_scale是首选：

SwsContext *sws_ctx = sws_getContext( src_width, src_height, src_pix_fmt, dst_width, dst_height, dst_pix_fmt, SWS_BILINEAR, NULL, NULL, NULL ); AVFrame *dst_frame = av_frame_alloc(); dst_frame->format = dst_pix_fmt; dst_frame->width = dst_width; dst_frame->height = dst_height; av_frame_get_buffer(dst_frame, 0); sws_scale( sws_ctx, src_frame->data, src_frame->linesize, 0, src_height, dst_frame->data, dst_frame->linesize );

性能提示：在树莓派等设备上，使用SWS_FAST_BILINEAR并限制线程数能提升吞吐量

4.2 硬件加速转换的黑科技

利用VAAPI实现超高速转换（Linux环境）：

# 创建NV12格式的VAAPI表面 ffmpeg -hwaccel vaapi -vaapi_device /dev/dri/renderD128 \ -f rawvideo -pix_fmt nv12 -s 1920x1080 -i input.nv12 \ -vf 'format=nv12,hwupload' -c:v h264_vaapi output.mp4

Windows下则可用D3D11：

ffmpeg -init_hw_device d3d11va=hw -filter_hw_device hw \ -f rawvideo -pix_fmt yuv420p -s 1920x1080 -i input.yuv \ -vf 'hwupload,format=nv12' -c:v h264_qsv output.mp4