当前位置: 首页 > news >正文

QQ本地缓存机制初步探寻

起因是在电脑上我想将一个QQ文件存放到其他文件夹下,而在QQ缓存文件夹下(...\Tencent Files\电脑登录的qq号\nt_qq\nt_data\,右键选择打开文件夹就可以快速找到对应文件的存放位置)对一个视频文件进行了重命名,在QQ中想要再预览同一个视频的时候发现又需要重新下载(即下图中最左与最右的视频是相同的)。

所以我又重命名了一遍(是的,相当于再次预览后有了3个相同的视频):

可以看到同一个视频在qq缓存时始终拥有一个固定的命名。而这个文件名07274e2fe9990417a1f599611cd36025,而这个命名是怎么产生的呢?在windows的cmd中输入以下指令(测试是不是MD5方式产生的):

certutil -hashfile "D:\...\nt_qq\nt_data\Video\2026-06\Ori\07274e2fe9990417a1f599611cd36025.mp4" MD5

得到的值是05fce820355ed39a43e61ffbef3d7f40,不匹配。

所以让AI去尝试其他常见的哈希方式,结果都不匹配:

测试项目计算结果是否匹配文件名
文件内容 MD505fce820355ed39a43e61ffbef3d7f40
文件内容 SHA151e24aa6f6e6e5c6ac533e03694edc8865be302b
文件内容 SHA256bdc4cd025276a4407b6d78223e4d0ab812e3b5ee...
文件内容 CRC329513aeda
文件前 1KB / 1MB / 末尾 N 字节 MD5多种结果
文件路径 / 文件名 / 文件大小 的 MD5多种结果
嵌套哈希 (MD5 of MD5 等)多种结果
标准 UUID (v1/v4)version 位为0,不符合标准

说明很有可能QQ不是在本地根据视频内容进行的计算(因为哈希会出现重复的情况),而可能是对原始下载 URL 进行哈希得到的或者是QQ 服务器直接下发的 file_id / file_uuid。不过事实并非如此。

查看缓存目录,以一个视频为例:

nt_qq/nt_data/Video/2026-06/Ori/07274e2fe9990417a1f599611cd36025.mp4 nt_qq/nt_data/Video/2026-06/Thumb/07274e2fe9990417a1f599611cd36025_0.png

可以看到视频和缩略图共享同一个 ID,说明这是 QQ NT 的标准缓存结构。

接着对同一缓存目录下的其他十六进制命名视频做 MD5 校验,发现并非所有文件都不匹配

文件名内容 MD5是否匹配
7a4e67066cff62b0d634bb195c4c1b7a.mp47a4e67066cff62b0d634bb195c4c1b7a匹配
35162df365e45b0b63b604db88540752.mp435162df365e45b0b63b604db88540752匹配
c34a6824666446818ff0e6524b08b239.mp4577353b33ca4db9bc0f86d0df9f97278❌ 不匹配
fb48745972b2bb0f795f7d2382172996.mp45329bf3eeea08efeac87d66ed659965a❌ 不匹配

所以推测某些视频(可能是本地直发文件)使用内容 MD5 命名;另一些视频在发送或者缓存过程中进行了压缩,导致前后的MD5发生了变化。

nt_qq/nt_db/下找到所有数据库文件,包括:

nt_msg.db、rich_media.db、files_in_chat.db、group_info.db ...

尝试用sqlite3直接打开,全部报错Error: file is not a database。用 Python 读取文件头确认:Header: 53 51 4c 69 74 65 20 66 6f 72 6d 61 74 20 33 00 ASCII: SQLite format 3

表面是标准 SQLite 头,但后续页面是密文——确认是 SQLCipher 4 加密,且 QQ NT 在标准头前额外加了 1024 字节自定义头部。

1008-1023: 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 (16 字节全零) 1024-1039: 5f d9 ca 34 61 b4 8d 82 3f 69 8c 59 f4 8a 33 40 (加密数据开始)

既然数据库加密,必须获取密钥。由于无法下载到现成的 PowerShell 脚本,自行编写了find_key_from_memory.py

  1. 枚举所有QQ.exe进程 PID
  2. 用 Windows API (OpenProcessVirtualQueryExReadProcessMemory) 遍历内存
  3. 在内存中搜索nt_msg.db和 对应的QQ 号 作为线索
  4. 在线索附近提取 16 字节可打印 ASCII 字符串作为候选密钥
  5. 对每个候选密钥,尝试连接剥离头部后的数据库并执行SELECT count(*) FROM sqlite_master;

扫描结果:

  • 扫描 7 个 QQ 进程,共 3.8 GB 内存
  • 收集到 40,001 个候选密钥,验证到第 1,500 个左右时命中,成功提取密钥

接着按剥离 1024 字节头部 → 生成 → 逐表导出 → 生成明文数据库 的过程进行

c2c_msg_tablegroup_msg_table40800列(Protobuf BLOB)中搜索字节串b"07274e2fe9990417a1f599611cd36025"。在c2c_msg_table中找到1 条匹配记录,group_msg_table中未找到。

$07274e2fe9990417a1f599611cd36025.mp4 $07274E2FE9990417A1F599611CD36025.png fEhRag8Q-jb6FPILieEkWWDWf-8xdUxic2Y4dIIULKJGAuq6X-ZQDMgRwcm9kUID1JFoQDn4OJuj0FqmYXaS4jYYW3XoCsK2CAQJuag dEhQ4k-yIPDEk7SC5169Krv88fxHQLRjNhgMghgso7-O8rpf5lAMyBHByb2RQgPUkWhAlwP3hH60xpVJhi9ABSKO-egLrWYIBAm5q

是 Protobuf 二进制,需要解析才能读出结构化字段。将Protobuf 解析为结构化 JSON,在messages表中搜索目标字符串,得到如下结果:

{ "type": "video", "filename": "07274e2fe9990417a1f599611cd36025.mp4", "filesize": 61058204, "md5_hex": "07274e2fe9990417a1f599611cd36025", "duration": 49997, "cdn_url": null, "local_path": null }

结合本地文件比对大小即可得到:

维度消息记录中的原始文件本地缓存文件
md5_hex07274e2fe9990417a1f599611cd36025
filesize61,058,204 bytes (58.2 MB)51,226,940 bytes (48.8 MB)
内容 MD505fce820355ed39a43e61ffbef3d7f40
文件名07274e2fe9990417a1f599611cd36025.mp407274e2fe9990417a1f599611cd36025.mp4

说明文件名是发送方原始视频文件的 MD5QQ 用这个 MD5 作为本地缓存文件名。但 在本地存储时对视频进行了压缩/转码,导致文件变小、内容 MD5 改变,因此本地的.mp4文件内容 MD5 与文件名不一致。

之所以改名后会重新下载,是因为和浏览器缓存类似,QQ 识别本地文件是否已存在,通常靠的是文件路径和文件名,而不是文件内容的 MD5 哈希值。文件名一变,索引就失效了。虽然视频内容完全没变(MD5 值相同),但 QQ 并不会在打开前先做完整的内容校验。它只查"之前有没有下载过这个名称的文件",查不到就重新拉取。

参考资料

https://qqbackup.github.io/QQDecrypt/

http://www.jsqmd.com/news/984580/

相关文章:

  • Unity基础(十四)场景异步加载
  • 如何快速掌握Windows驱动开发:终极硬件伪装指南
  • 2026年免费AI编程工具推荐榜单
  • 自动装盘机倒瓶检测系统的传感器选型与信号处理
  • 2026年未央区宠物医院大比拼:哪家最得宠主心?
  • PCDN服务SLA设计:承诺多少节点在线才合理?
  • OpenSpec实战
  • 关于NoSQL数据库的一切,终于说清楚了
  • 鸿蒙App开发--心愿池的动画特效:投币动画与进度条
  • 翰泰通环保空调客户满意度调查:9680+企业的真实反馈
  • 国内九大靠谱的地脚螺栓厂家盘点
  • 学习比特 享幸福人生
  • android开发 原生设置中的Device name 与Device model
  • 中小企业做GEO的投入和产出怎么算——从成本、时间线和效果三个方向来看
  • Playwright MCP Docker 部署:mcr 镜像、浏览器工具和权限配置
  • 2026高考大数据:1290万考生背后的赛道拥挤度与捡漏指南
  • Path of Building终极指南:5步打造完美流放之路角色
  • CSDN文章-API生态变化
  • GEO基础优化包含哪些基础项目
  • 论文去重难?5个实用工具帮你
  • Redis中的通用命令
  • 拒绝“胶水架构”:大模型时代,如何用统一任务基座破解 AI 研发的技术债?
  • 2027考研计算机王道408网课视频网盘资料-无偿分享
  • 终极指南:如何免费将VR视频转为2D并自由控制视角
  • 从 Kydi 到 Claude Code:企业和个人到底需要什么样的 AI 智能体?【奇墨科技】
  • 打造你的专属音乐库:LXMusic音源配置实战指南
  • 格力空调全国 24小时 售后服务热线人工客服号码上线
  • 2026年新发布:手工月饼如何选?元领科技发展有限公司全景解析 - 2026年企业资讯
  • 亚马逊270天库存生死线!超龄库存清仓全攻略
  • 终极指南:5分钟在Mac上实现Android手机USB网络共享