当前位置：首页 > news >正文

不只是H.264！盘点FFmpeg图片转视频时，那些让你踩坑的编码器尺寸限制

news 2026/5/4 10:32:21

不只是H.264！盘点FFmpeg图片转视频时，那些让你踩坑的编码器尺寸限制

第一次用FFmpeg把图片转成视频时，看到width not divisible by 2的报错，我以为是H.264特有的怪癖。直到后来用libx265、VP9时接连翻车，才发现不同编码器对图像尺寸的要求简直是个隐藏的"雷区"。今天我们就来彻底拆解这个技术细节，让你一次性掌握所有主流编码器的尺寸限制规律。

1. 为什么编码器会对图像尺寸有要求？

视频编码的核心是分块处理。就像切蛋糕一样，编码器需要把图像划分成固定大小的块（通常是4x4到64x64不等），然后对每个块进行压缩。如果图像尺寸不能被块大小整除，边缘就会出现"零头"，导致编码器无法处理。

举个具体例子：H.264的宏块通常是16x16像素，但支持4x4的子块划分。所以它要求图像长宽至少能被2整除（因为16和4都是2的倍数）。而H.265的编码单元更灵活，支持到64x64，因此对尺寸的要求也更严格。

提示：现代编码器通常会在内部自动填充(padding)不符合尺寸要求的图像，但这会导致额外的计算开销，所以多数编码器会直接报错拒绝处理。

2. 主流编码器尺寸限制全解析

2.1 H.264家族 (libx264)

最小单位：4x4块
要求：宽度和高度必须能被2整除
典型报错：width/height not divisible by 2

解决方案：

ffmpeg -i input.jpg -vf "scale=trunc(iw/2)*2:trunc(ih/2)*2" -c:v libx264 output.mp4

2.2 H.265/HEVC (libx265)

最小单位：支持从4x4到64x64多种块划分
要求：多数实现要求能被8整除
特殊限制：某些版本要求色度分量满足更严格条件

调整命令：

ffmpeg -i input.jpg -vf "scale=trunc(iw/8)*8:trunc(ih/8)*8" -c:v libx265 output.mp4

2.3 VP9 (libvpx-vp9)

参数	要求	备注
基础分辨率	能被8整除	推荐配置
色度采样	需满足4:2:0对齐	常见问题源
超级块	支持64x64	高性能模式

# VP9推荐预处理命令 ffmpeg -i input.jpg -vf "scale=trunc(iw/8)*8:trunc(ih/8)*8:flags=lanczos" -c:v libvpx-vp9 output.webm

2.4 AV1 (libaom-av1)

AV1作为新一代编码器，其编码树单元(CTU)支持从4x4到128x128的灵活划分。但实践中：

基础要求：建议宽度和高度至少能被8整除
高级模式：使用--tile-columns参数时需要更严格的对齐
性能优化：64x64对齐可获得最佳编码速度

3. 编码器尺寸要求速查表

下表汇总了主流编码器的关键参数：

编码器	最小块	推荐对齐	典型报错提示
libx264	4x4	2	width not divisible by 2
libx265	8x8	8	height must be multiple of 8
libvpx-vp9	8x8	8	Invalid frame size
libaom-av1	4x4	8	Unsupported frame size
libsvtav1	4x4	8	Invalid dimensions

4. 万能预处理脚本解决方案

针对批量处理场景，我开发了这个智能调整脚本：

#!/bin/bash # 自动检测并调整图像尺寸以满足编码器要求 adjust_dimensions() { local encoder=$1 local width=$2 local height=$3 case $encoder in libx264) echo "$((width & ~1)) $((height & ~1))" ;; libx265|libvpx-vp9|libaom-av1) echo "$((width & ~7)) $((height & ~7))" ;; *) echo "$width $height" ;; esac } # 使用示例 new_size=$(adjust_dimensions "libx265" 497 373) ffmpeg -i input.jpg -vf "scale=${new_size% *}:${new_size#* }" -c:v libx265 output.mp4

这个脚本的特点是：

自动识别编码器类型
保持原始宽高比
总是向下取整到最近的有效值
支持主流编码器的特殊要求

5. 实际项目中的经验之谈

在商业视频处理系统中，我们最终采用了更鲁棒的方案：

def smart_resize(image_path, target_encoder): from PIL import Image img = Image.open(image_path) w, h = img.size if target_encoder == 'h264': new_w = w - (w % 2) new_h = h - (h % 2) elif target_encoder in ('hevc', 'vp9', 'av1'): new_w = w - (w % 8) new_h = h - (h % 8) else: return image_path # 不处理 if (w, h) != (new_w, new_h): print(f"Resizing from {w}x{h} to {new_w}x{new_h}") return img.resize((new_w, new_h), Image.LANCZOS) return img

几个关键优化点：