当前位置：首页 > news >正文

[特殊字符]摄像头模块(八)：编写 V4L2 初始化函数（深度解析）

news 2026/5/6 23:30:05

📘摄像头模块(八)：编写 V4L2 初始化函数（深度解析）

作者：你的名字
课程：韦东山视频课程 · 摄像头驱动与应用整合
前置：必须掌握 08.2 的 V4L2 六步初始化框架

文章目录

📘摄像头模块(八)：编写 V4L2 初始化函数（深度解析）
- 🎯 本节核心目标
- 📂 本节涉及的文件
- 🧱 V4L2 初始化函数 `V4l2InitDevice` 分步精讲
- - 步骤 0：全局支持的格式列表（复习）
  - 步骤 1：打开设备——`open`
  - 步骤 2：查询设备能力——`VIDIOC_QUERYCAP`
  - 步骤 3：枚举并选择像素格式——`VIDIOC_ENUM_FMT`
  - 步骤 4：设置图像格式——`VIDIOC_S_FMT`
  - 步骤 5：申请缓冲区——`VIDIOC_REQBUFS`
  - 步骤 6：查询并映射每个缓冲区——`VIDIOC_QUERYBUF` + `mmap`
  - 步骤 7：把缓冲区放入驱动队列——`VIDIOC_QBUF`（仅 streaming 模式）
  - 步骤 8：保存操作表指针
- ⚠️ 错误处理与 `goto` 详解
- 🧪 完整代码框架（带注释）
- 📊 流程图：V4L2 初始化决策与错误处理
- ❗ 初学者常见错误总结（包括我自己犯过的）
- ✅ 本节自测题（用来检查掌握程度）
- 💬 总结

🎯 本节核心目标

深入理解V4l2InitDevice中每一个ioctl的参数含义、错误处理、以及为什么必须按照这个顺序执行。
学完本节，你应该能回答：

为什么打开设备要用O_RDWR？
为什么查询能力后要检查V4L2_CAP_VIDEO_CAPTURE？
为什么每次ioctl前都要memset结构体？
如果摄像头不支持我们期望的格式或分辨率，程序会怎样？
缓冲区的mmap为什么用PROT_READ而不是PROT_WRITE？
MAP_SHARED和MAP_PRIVATE有什么区别？
QBUF和DQBUF的循环如何工作？
错误处理中goto的用法和潜在的内存泄漏问题。

📂 本节涉及的文件

video/v4l2.c—— 全部代码都在这里。
include/video_manager.h—— 结构体定义（08.1 已完成）

🧱 V4L2 初始化函数`V4l2InitDevice`分步精讲

我们会按照代码执行顺序，逐步解释每一步并指出初学者最容易犯的错误。

步骤 0：全局支持的格式列表（复习）

static int g_aiSupportedFormats[] = { V4L2_PIX_FMT_YUYV, V4L2_PIX_FMT_MJPEG, V4L2_PIX_FMT_RGB565 }; static int isSupportThisFormat(int iPixelFormat) { for (int i = 0; i < sizeof(g_aiSupportedFormats)/sizeof(g_aiSupportedFormats[0]); i++) if (g_aiSupportedFormats[i] == iPixelFormat) return 1; return 0; }

为什么用sizeof计算数组大小？
这样增加新格式（如V4L2_PIX_FMT_NV12）时，只需要在数组中添加一行，循环自动适配，避免手动修改数字3。

步骤 1：打开设备——`open`

iFd = open(strDevName, O_RDWR); if (iFd < 0) { DBG_PRINTF("can not open %s\n", strDevName); return -1; } ptVideoDevice->iFd = iFd;

❓ 为什么必须用O_RDWR而不是只读O_RDONLY？

原因 1：某些ioctl（如设置亮度、对比度等控制参数）需要写权限。
原因 2：即使只是读取视频数据，mmap在某些内核版本上要求文件以可写方式打开。
结论：统一用O_RDWR是最稳妥的做法，不会出错。

❓ 打开失败时，只打印信息就返回 -1，是否足够？
是的。上层调用VideoDeviceInit会收到 -1，然后尝试下一个摄像头操作模块（如果有）。打印信息也利于调试。
✅ 你的回答“要打印信息”是正确的。

步骤 2：查询设备能力——`VIDIOC_QUERYCAP`

struct v4l2_capability tV4l2Cap; memset(&tV4l2Cap, 0, sizeof(tV4l2Cap)); iError = ioctl(iFd, VIDIOC_QUERYCAP, &tV4l2Cap); if (iError) goto err_exit; if (!(tV4l2Cap.capabilities & V4L2_CAP_VIDEO_CAPTURE)) { DBG_PRINTF("%s is not a video capture device\n", strDevName); goto err_exit; }

❓V4L2_CAP_VIDEO_CAPTURE代表什么？
它表示设备支持视频捕获功能（从摄像头采集）。没有这个能力的设备（比如视频输出设备、VBI 设备）不能用于采集。
✅ 你的回答“没有就不能用”完全正确。

❓ 为什么在 ioctl 之前要memset结构体？
tV4l2Cap是局部变量，里面可能包含随机值。ioctl只会填充它定义的字段，其他字段可能保持原样。如果不清零，后续判断capabilities可能会误读到残留数据，导致错误判断。
✅ 你回答“不干净会污染”是对的。

❓ 代码中出现了两次ioctl和一个memset，为什么？
原作者的冗余写法。实际上只需要一次ioctl就够了，第二次和中间的memset可以忽略。初学者不必困惑。

步骤 3：枚举并选择像素格式——`VIDIOC_ENUM_FMT`

struct v4l2_fmtdesc tFmtDesc; memset(&tFmtDesc, 0, sizeof(tFmtDesc)); tFmtDesc.type = V4L2_BUF_TYPE_VIDEO_CAPTURE; tFmtDesc.index = 0; while (ioctl(iFd, VIDIOC_ENUM_FMT, &tFmtDesc) == 0) { if (isSupportThisFormat(tFmtDesc.pixelformat)) { ptVideoDevice->iPixelFormat = tFmtDesc.pixelformat; break; } tFmtDesc.index++; } if (!ptVideoDevice->iPixelFormat) { DBG_PRINTF("can not support the format of this device\n"); goto err_exit; }

❓ 为什么tFmtDesc.type固定为V4L2_BUF_TYPE_VIDEO_CAPTURE？
因为我们要枚举的是捕获类型的格式，而不是输出或覆盖类型。这是 V4L2 规定的常量。

❓ 如果摄像头只支持我们列表以外的格式（如 NV12）怎么办？
程序会找不到支持格式，ptVideoDevice->iPixelFormat保持为 0，然后打印错误并跳转到错误处理，返回 -1。
✅ 你的回答“跳到 err_exit”正确。
如何改进？在g_aiSupportedFormats数组里增加V4L2_PIX_FMT_NV12或其他需要的格式，并实现对应的转换函数（在转换模块中添加）。

步骤 4：设置图像格式——`VIDIOC_S_FMT`

struct v4l2_format tV4l2Fmt; memset(&tV4l2Fmt, 0, sizeof(tV4l2Fmt)); tV4l2Fmt.type = V4L2_BUF_TYPE_VIDEO_CAPTURE; tV4l2Fmt.fmt.pix.pixelformat = ptVideoDevice->iPixelFormat; tV4l2Fmt.fmt.pix.width = iLcdWidth; tV4l2Fmt.fmt.pix.height = iLcdHeigt; tV4l2Fmt.fmt.pix.field = V4L2_FIELD_ANY; iError = ioctl(iFd, VIDIOC_S_FMT, &tV4l2Fmt); if (iError) goto err_exit; ptVideoDevice->iWidth = tV4l2Fmt.fmt.pix.width; ptVideoDevice->iHeight = tV4l2Fmt.fmt.pix.height;

❓ 为什么要把分辨率设置为 LCD 的分辨率？
目的：让摄像头尽量输出与 LCD 相同尺寸的图像，这样后续就不需要缩放（PicZoom）或只需要很小的缩放，提高性能。

❓ 如果摄像头不支持这么大的分辨率，驱动会做什么？
驱动会自动调整到它支持的最接近的分辨率，并修改tV4l2Fmt.fmt.pix.width/height为实际值。
必须读回这个实际值，后续分配缓冲区、缩放时都要用它。
✅ 你的回答“驱动会找相近的”正确。

步骤 5：申请缓冲区——`VIDIOC_REQBUFS`

struct v4l2_requestbuffers tV4l2ReqBuffs; memset(&tV4l2ReqBuffs, 0, sizeof(tV4l2ReqBuffs)); tV4l2ReqBuffs.count = NB_BUFFER; // 4 tV4l2ReqBuffs.type = V4L2_BUF_TYPE_VIDEO_CAPTURE; tV4l2ReqBuffs.memory = V4L2_MEMORY_MMAP; iError = ioctl(iFd, VIDIOC_REQBUFS, &tV4l2ReqBuffs); if (iError) goto err_exit; ptVideoDevice->iVideoBufCnt = tV4l2ReqBuffs.count; // 实际获取到的个数

❓ 请求 4 个缓冲区，驱动只返回 2 个，程序还能工作吗？
能工作，只是缓冲区少了，可能在高帧率下丢帧，但不会崩溃。
✅ 你的回答正确。

步骤 6：查询并映射每个缓冲区——`VIDIOC_QUERYBUF`+`mmap`

for (i = 0; i < ptVideoDevice->iVideoBufCnt; i++) { struct v4l2_buffer tV4l2Buf; memset(&tV4l2Buf, 0, sizeof(tV4l2Buf)); tV4l2Buf.index = i; tV4l2Buf.type = V4L2_BUF_TYPE_VIDEO_CAPTURE; tV4l2Buf.memory = V4L2_MEMORY_MMAP; iError = ioctl(iFd, VIDIOC_QUERYBUF, &tV4l2Buf); if (iError) goto err_exit; ptVideoDevice->iVideoBufMaxLen = tV4l2Buf.length; ptVideoDevice->pucVideBuf[i] = mmap(NULL, tV4l2Buf.length, PROT_READ, MAP_SHARED, iFd, tV4l2Buf.m.offset); if (ptVideoDevice->pucVideBuf[i] == MAP_FAILED) goto err_exit; }

❓QUERYBUF的作用是什么？不调用能直接mmap吗？
QUERYBUF返回每个缓冲区在设备内存中的物理偏移量（m.offset）和长度（length）。mmap需要这两个参数才能正确映射。
✅ 你回答“length 需要查询”是正确的；offset同样需要查询。

❓tV4l2Buf.m.offset是什么？
它是内核分配给该缓冲区的物理地址偏移（相对于设备文件）。mmap通过这个偏移量找到对应的内核内存页。
⚠️ 你回答“映射给用户”不太准确，它表示偏移量，而不是映射。

❓mmap的参数PROT_READ为什么不加PROT_WRITE？

摄像头缓冲区是只读的（驱动写入数据，应用程序只读取）。
如果应用程序修改了缓冲区内容，可能会破坏下一帧数据，或者影响驱动行为。
加上PROT_WRITE也不是不行，但没必要，且可能带来安全隐患。
✅ 你的回答“只给看不给写”是对的，但附加的“影响别的程序”不严谨（因为是私有映射？实际是共享的，但写进去会损坏图像数据）。

❓MAP_SHARED与MAP_PRIVATE有什么区别？为什么用MAP_SHARED？

MAP_SHARED：映射区域的变化会写回内核缓冲区，其他进程也能看到。这里缓冲区由内核驱动管理，应用程序修改会直接影响内核中的数据。
MAP_PRIVATE：写时复制，修改只影响应用程序的副本，不会写回内核。这会导致驱动永远看不到应用程序“归还”缓冲区的动作，造成错误。
必须用MAP_SHARED，这样才能让驱动和应用程序共享同一块内存。
✅ 你的理解“大家都可以看到”是对的，但“不用 MAP_SHARED 就会一直旧数据”不准确——实际上用MAP_PRIVATE驱动根本没法正确工作，不仅仅是数据旧的问题。

步骤 7：把缓冲区放入驱动队列——`VIDIOC_QBUF`（仅 streaming 模式）

for (i = 0; i < ptVideoDevice->iVideoBufCnt; i++) { struct v4l2_buffer tV4l2Buf; memset(&tV4l2Buf, 0, sizeof(tV4l2Buf)); tV4l2Buf.index = i; tV4l2Buf.type = V4L2_BUF_TYPE_VIDEO_CAPTURE; tV4l2Buf.memory = V4L2_MEMORY_MMAP; iError = ioctl(iFd, VIDIOC_QBUF, &tV4l2Buf); if (iError) goto err_exit; }

❓QBUF把缓冲区交给驱动后，应用程序还能直接读写这个缓冲区吗？
技术上还能读写（因为映射还在），但不应该这样做，因为驱动可能正在向该缓冲区写入新数据或等待使用。乱写会破坏图像数据或导致驱动状态错误。
✅ 你回答“不行吧”偏向正确，应该明确“不建议，但内存仍然可访问”。

❓ 如果忘记调用QBUF，后面STREAMON会成功吗？
不会。驱动要求至少有一个缓冲区已入队，否则无法开始采集。STREAMON会返回错误。
✅ 你的回答“不够用”是对的，但更准确的表述是“STREAMON 会失败”。

步骤 8：保存操作表指针

ptVideoDevice->ptOPr = &g_tV4l2VideoOpr;

作用：让设备实例知道自己属于哪一套操作函数（V4L2）。
后续调用：ptVideoDevice->ptOPr->GetFrame(...)
这就是 C 语言模拟面向对象的多态。

⚠️ 错误处理与`goto`详解

err_exit: close(iFd); return -1;

❓ 为什么使用goto？

避免在每个错误点重复写close(iFd); return -1;
集中管理错误处理，代码更清晰。

❓ 如果已经mmap成功几个缓冲区，然后出错跳转到err_exit，只close(iFd)会内存泄漏吗？
原代码中，所有可能进入err_exit的点都在完全成功映射所有缓冲区之前。一旦mmap全部成功，就不会再跳转到err_exit。所以原代码是安全的。
但是，你的担忧有道理：如果我们在mmap成功后、但未完成全部初始化时出错（比如后续某个QBUF失败），那么已经映射的缓冲区确实不会被munmap，造成泄漏。
改进建议：在err_exit中增加对已映射缓冲区的清理循环。不过原课程代码没有这样做，因为所有goto都在mmap循环内部或更早，不会发生上述情况。

🧪 完整代码框架（带注释）

static int V4l2InitDevice(char *strDevName, PT_VideoDevice ptVideoDevice) { // 1. open // 2. VIDIOC_QUERYCAP // 3. VIDIOC_ENUM_FMT // 4. VIDIOC_S_FMT // 5. VIDIOC_REQBUFS // 6. VIDIOC_QUERYBUF + mmap // 7. VIDIOC_QBUF ptVideoDevice->ptOPr = &g_tV4l2VideoOpr; return 0; err_exit: close(ptVideoDevice->iFd); return -1; }

📊 流程图：V4L2 初始化决策与错误处理

❗ 初学者常见错误总结（包括我自己犯过的）

序号	错误现象	根本原因	正确做法
1	`VIDIOC_S_FMT`失败	没有先枚举格式，设置了驱动不支持的格式	先枚举，再设置
2	`mmap`失败，errno 为 EINVAL	没有先`QUERYBUF`获取 offset	必须先调用`QUERYBUF`
3	`STREAMON`失败	忘记调用`QBUF`或`QBUF`数量为 0	至少 QBUF 一个缓冲区
4	画面花屏或错位	没有读回`VIDIOC_S_FMT`后的实际宽高，用错误分辨率分配缓冲区	读回实际宽高，用于后续计算
5	`poll`超时或一直返回	没有启动`STREAMON`就开始`DQBUF`	先`STREAMON`，再`poll`
6	内存泄漏	在 mmap 成功后出错，未 munmap 就直接 close	错误处理中增加对已映射缓冲区的清理

✅ 本节自测题（用来检查掌握程度）

为什么打开摄像头要用O_RDWR？
VIDIOC_QUERYCAP后为什么必须判断V4L2_CAP_VIDEO_CAPTURE？
如果摄像头支持 1280x720，而 LCD 是 1024x600，设置VIDIOC_S_FMT为 1024x600 后，iWidth和iHeight会变成多少？
REQBUFS请求 4 个缓冲区，驱动只给 2 个，后续取帧还安全吗？
QUERYBUF提供的length和offset分别用于什么？
为什么mmap要用MAP_SHARED而不是MAP_PRIVATE？
如果忘记QBUF就调用STREAMON，会发生什么？
错误处理中使用goto有什么好处？在mmap后出错时，需要额外做什么清理？

💬 总结

(八) 课程深入讲解了 V4L2 初始化的每一个细节。你现在应该能回答上述所有问题了。
接下来的 (九) 将进入数据传输循环：poll等待数据、DQBUF取帧、QBUF放回，以及STREAMON/STREAMOFF。
掌握了本节，你就已经掌握了 V4L2 摄像头驱动的初始化骨架，剩下的知识点就是在这个骨架上添加肌肉。