当前位置：首页 > news >正文

内核探秘：四种高效读取进程内存的技术对比与实践

news 2026/3/26 18:19:34

1. 为什么需要读取进程内存？

在开发内核级程序时，经常需要访问其他进程的内存空间。比如安全软件需要扫描可疑进程的内存，调试工具需要读取被调试进程的变量值，性能分析工具需要监控特定内存区域的变化。这些场景都绕不开一个核心问题：如何在内核模式下安全、高效地读取用户态进程的内存数据？

传统做法是让目标进程主动暴露内存接口，但这在很多场景下不现实。更常见的需求是"静默"读取，即在不干扰目标进程运行的情况下获取其内存内容。这就引出了我们今天要讨论的四种技术方案：直接memcpy、MmCopyVirtualMemory、CR3切换和MDL映射。

每种方法都有其适用场景和潜在风险。比如直接memcpy虽然简单，但稳定性堪忧；CR3切换性能优异，但对系统版本敏感。作为在Windows内核开发领域摸爬滚打多年的老手，我见过太多因为选错方法导致的蓝屏案例。接下来就结合代码实例，带大家深入理解这四种技术的优劣。

2. 直接memcpy：简单但危险

2.1 基本原理

直接memcpy是最直观的方法：先通过KeStackAttachProcess附加到目标进程空间，然后像访问本地内存一样使用memcpy。代码框架大致如下：

KAPC_STATE apc; KeStackAttachProcess(target_process, &apc); memcpy(dest_buffer, src_address, copy_size); KeUnstackDetachProcess(&apc);

2.2 致命缺陷

这种方法最大的问题是异常处理。当源地址无效时（比如页面未提交），会触发缺页异常。在内核模式下，这种异常如果没有妥善处理，直接导致系统蓝屏。我在早期项目中就踩过这个坑：当时读取一个游戏进程的内存，由于游戏频繁申请释放内存，导致memcpy时经常遇到无效地址，最终让测试机器蓝屏了一整天。

另一个问题是性能损耗。每次附加/分离进程都会导致CR3寄存器切换，频繁操作时开销明显。实测在循环读取场景下，这种方法比后续介绍的MDL方式慢3-5倍。

2.3 适用场景

除非是临时性的调试场景，否则不建议在生产环境使用。如果非要使用，务必加上结构化异常处理：

__try { KeStackAttachProcess(target_process, &apc); memcpy(dest_buffer, src_address, copy_size); } __except(EXCEPTION_EXECUTE_HANDLER) { status = GetExceptionCode(); } KeUnstackDetachProcess(&apc);

3. MmCopyVirtualMemory：微软官方方案

3.1 函数原型分析

这是微软提供的标准API，原型如下：

NTSTATUS MmCopyVirtualMemory( PEPROCESS SourceProcess, PVOID SourceAddress, PEPROCESS TargetProcess, PVOID TargetAddress, SIZE_T BufferSize, KPROCESSOR_MODE PreviousMode, PSIZE_T ReturnSize );

关键优势在于内部已经处理好异常分发和边界检查。我在多个反作弊驱动项目中验证过，其稳定性确实比直接memcpy强很多。

3.2 性能实测

通过对比测试读取不同大小的内存块（从4字节到4MB），得到以下数据：

内存大小	平均耗时(us)	成功率
4B	0.8	100%
4KB	2.1	100%
1MB	210	99.8%
4MB	850	98.5%

可以看到在处理大块内存时性能下降明显，且存在小概率失败情况。这是因为函数内部会临时锁定用户内存，可能遇到页面被换出的情况。

3.3 最佳实践

推荐用于中小规模的内存读取（<1MB）。使用时注意：

总是检查返回状态
大块内存建议分多次读取
PreviousMode通常设为UserMode

典型用法示例：

SIZE_T bytes_copied; status = MmCopyVirtualMemory( target_process, src_address, PsGetCurrentProcess(), dest_buffer, buffer_size, UserMode, &bytes_copied); if (!NT_SUCCESS(status)) { DbgPrint("Copy failed: 0x%X\n", status); }

4. CR3切换：极致性能之道

4.1 原理揭秘

每个进程的CR3寄存器存储着页表基址，切换CR3就等于切换了内存空间。这种方法直接修改CPU寄存器，避免了中间层开销。关键代码：

ULONG64 old_cr3 = __readcr3(); ULONG64 new_cr3 = *(PULONG64)((PUCHAR)target_process + 0x28); // EPROCESS->DirectoryTableBase __writecr3(new_cr3); memcpy(dest_buffer, src_address, copy_size); __writecr3(old_cr3);

4.2 风险提示

这种方法需要特别注意：

偏移0x28随系统版本变化，Win10 1809前后就不一样
操作期间必须禁用中断和APC
不能嵌套调用

我在Win11 22H2上实测的偏移是0x28，但在某些版本可能是0x388。建议通过内核调试器手动验证：

dt nt!_EPROCESS DirectoryTableBase

4.3 性能对比

与MmCopyVirtualMemory的基准测试对比：

操作类型	4B耗时(ns)	4KB耗时(us)
MmCopy	800	2.1
CR3切换	120	0.4

可见在小数据量时CR3方式快6-7倍。但要注意，这种性能提升伴随着更高的风险，适合对性能极度敏感的场景。

5. MDL映射：平衡的艺术

5.1 技术实现

MDL（Memory Descriptor List）通过建立临时映射来访问目标内存，流程分为三步：

创建MDL描述目标内存
锁定页面并映射到系统空间
访问后解除映射

完整示例：

PMDL mdl = IoAllocateMdl(target_address, size, FALSE, FALSE, NULL); if (!mdl) return STATUS_INSUFFICIENT_RESOURCES; __try { MmProbeAndLockPages(mdl, UserMode, IoReadAccess); PVOID mapped_address = MmMapLockedPagesSpecifyCache( mdl, KernelMode, MmCached, NULL, FALSE, NormalPagePriority); memcpy(dest_buffer, mapped_address, size); MmUnmapLockedPages(mapped_address, mdl); MmUnlockPages(mdl); } __except(EXCEPTION_EXECUTE_HANDLER) { IoFreeMdl(mdl); return GetExceptionCode(); } IoFreeMdl(mdl);

5.2 优势分析

MDL方式兼具稳定性和性能：

自动处理页面错误
映射后可以像访问本地内存一样操作
适合频繁访问同一内存区域

在需要反复读取某进程数据的场景（如游戏外挂检测），MDL是最佳选择。建立映射后，后续读取无需重复锁定页面。

5.3 内存管理细节

使用MDL时要注意：

MmProbeAndLockPages会提升IRQL到DISPATCH_LEVEL
映射的地址仅在锁定期有效
必须成对调用MmUnmapLockedPages和MmUnlockPages

我曾遇到一个棘手bug：忘记调用MmUnlockPages导致内存泄漏，最终系统因内存耗尽崩溃。现在养成了习惯：每个IoAllocateMdl都立即写上对应的释放代码。

6. 综合对比与选型建议

6.1 特性对比表

指标	直接memcpy	MmCopy	CR3切换	MDL映射
稳定性	低	高	中	高
小数据性能	中	低	高	中
大数据性能	低	低	高	高
编码复杂度	低	低	高	中
系统版本适配	高	高	低	高

6.2 选型指南

根据多年项目经验，建议：

快速原型开发：用MmCopyVirtualMemory
高频小数据读取：CR3切换（需处理版本差异）
大数据块操作：MDL映射
临时调试：直接memcpy（加异常处理）

在安全产品开发中，我通常采用混合策略：对关键路径用CR3切换保证性能，常规检查用MDL确保稳定，完全避免直接memcpy。

7. 实战中的坑与解决方案

7.1 跨版本兼容性

CR3切换最大的痛点在于EPROCESS结构偏移随Windows版本变化。可靠的解决方案是：

通过特征码定位DirectoryTableBase
运行时检测Windows版本
准备多个偏移量配置

ULONG GetCr3Offset() { RTL_OSVERSIONINFOW ver = {0}; RtlGetVersion(&ver); if (ver.dwBuildNumber >= 22000) return 0x28; // Win11 if (ver.dwBuildNumber >= 17763) return 0x28; // Win10 1809+ return 0x388; // 早期版本 }

7.2 死锁预防

MDL映射时可能遇到死锁情况，特别是操作分页内存时。最佳实践是：

在PASSIVE_LEVEL执行MmProbeAndLockPages
避免在DPC例程中使用
设置超时机制

7.3 性能优化技巧

对于需要持续监控的内存区域：

保持MDL长期有效
定期调用MmProbeAndLockPages更新
使用MmGetSystemAddressForMdlSafe获取虚拟地址

这样避免重复创建/释放MDL的开销，在我的一个内存监控驱动中将性能提升了40%。

8. 完整代码示例

以下是一个安全的混合实现，优先尝试CR3切换，失败后回退到MDL：

NTSTATUS SafeReadMemory( PEPROCESS TargetProcess, PVOID SourceAddress, PVOID Buffer, SIZE_T Size) { // 尝试CR3切换 ULONG cr3_offset = GetCr3Offset(); ULONG64 process_cr3 = *(PULONG64)((PUCHAR)TargetProcess + cr3_offset); if (process_cr3) { KIRQL old_irql = KeRaiseIrqlToDpcLevel(); ULONG64 old_cr3 = __readcr3(); __writecr3(process_cr3); BOOLEAN valid = MmIsAddressValid(SourceAddress); __writecr3(old_cr3); KeLowerIrql(old_irql); if (valid) { old_irql = KeRaiseIrqlToDpcLevel(); old_cr3 = __readcr3(); __writecr3(process_cr3); memcpy(Buffer, SourceAddress, Size); __writecr3(old_cr3); KeLowerIrql(old_irql); return STATUS_SUCCESS; } } // 回退到MDL PMDL mdl = IoAllocateMdl(SourceAddress, Size, FALSE, FALSE, NULL); if (!mdl) return STATUS_INSUFFICIENT_RESOURCES; NTSTATUS status = STATUS_SUCCESS; __try { MmProbeAndLockPages(mdl, UserMode, IoReadAccess); PVOID mapped = MmMapLockedPagesSpecifyCache( mdl, KernelMode, MmCached, NULL, FALSE, NormalPagePriority); memcpy(Buffer, mapped, Size); MmUnmapLockedPages(mapped, mdl); MmUnlockPages(mdl); } __except(EXCEPTION_EXECUTE_HANDLER) { status = GetExceptionCode(); } IoFreeMdl(mdl); return status; }

这段代码在我的多个商业项目中验证过稳定性，关键点在于：