当前位置: 首页 > news >正文

物理内存组织架构与Buddy分配器关系分析

物理内存组织架构与Buddy分配器关系分析

在Linux内核中,物理内存的管理是一个分层级的复杂系统。为了高效地应对不同硬件架构(如NUMA)和不同的内存需求(如DMA访问限制),Linux建立了严密的物理内存组织架构。而Buddy分配器(伙伴算法)则是这个架构中用于管理空闲页面的核心机制。本文将分析物理内存的组织方式以及Buddy分配器是如何嵌入其中发挥作用的。

引导内存分配器(memblock):启动早期使用,记录物理内存与保留区;系统起来后把可用内存交给 buddy。
zone:物理内存的分区视图(DMA/NORMAL/MOVABLE),是 buddy 运行的“管理边界”。
buddy 分配器:每个 zone 内的页级分配器,提供物理页(连续页)给上层。
slab/SLUB:对象级分配器,从 buddy 申请页,然后切成对象缓存给 kmalloc 等使用。
一句话:memblock 早期 → buddy 管页(按 zone) → slab 管对象。

一、物理内存组织架构

Linux内核采用Node(节点) -> Zone(区域) -> Page(页)的三级结构来描述物理内存。

1. 节点 (Node)

在NUMA(非一致性内存访问)架构中,内存被划分为多个节点。每个CPU都有其本地内存节点,访问速度最快。

  • 数据结构:struct pglist_data(typedef为pg_data_t)。
  • 作用:它是内存管理的最高层级容器。

2. 区域 (Zone)

为了适应硬件限制,每个Node内的内存被进一步划分为不同的区域。

  • 数据结构:struct zone
  • 常见的Zone包括:
    • ZONE_DMA/ZONE_DMA32:用于旧式硬件或32位设备进行DMA操作的低地址内存。
    • ZONE_NORMAL:内核可以直接映射的普通内存区域。
    • ZONE_HIGHMEM:32位系统中无法直接映射的高端内存。
    • ZONE_MOVABLE:用于可热插拔或通过内存碎片整理可移动的内存。

3. 页 (Page)

物理内存管理的最小单位,通常为4KB、8KB或更大。

  • 数据结构:struct page
  • 所有的物理页都在内存映射数组mem_map中有一个对应的描述符。

二、Buddy分配器 (伙伴算法)

Buddy分配器是Linux内核中用于解决外部碎片问题的一种物理内存管理算法。它不直接管理单个字节,而是页框(Page Frame)为基本单位。

核心原理

Buddy分配器将空闲内存分为不同阶(Order)的块链表进行管理。

  • 阶 (Order):表示内存块包含2 n 2^n2n个连续物理页。通常n nn的范围是 0 到MAX_ORDER-1(默认为11,即最大支持2 10 = 1024 2^{10}=1024210=1024个页的连续块,约4MB)。
  • 分配:当请求分配2 k 2^k2k个页时,检查第k kk阶是否有空闲块。如果有,直接分配;如果没有,则查找k + 1 k+1k+1阶,将2 k + 1 2^{k+1}2k+1的块分裂为两个2 k 2^k2k的块(互为伙伴),一个分配,一个插入第k kk阶链表。
  • 释放:释放内存块时,检查其物理地址相邻的“伙伴”块是否也空闲。如果空闲,则合并成更大的块,并向高阶递归合并,直到无法合并为止。

三、组织架构与Buddy分配器的关系

Buddy分配器并非独立存在,而是直接“寄生”在物理内存组织架构的Zone(区域)层级之上。

1. Buddy 是 Zone 的一部分

Buddy分配器的数据结构直接定义在struct zone中。

structzone{/* ... 前面的统计字段 ... *//* free areas of different sizes */structfree_areafree_area[MAX_ORDER];/* ... */};
  • 每个struct zone都有自己独立的一套free_area数组。
  • 这意味着:内存分配是在特定的Zone中进行的。例如,申请DMA内存时,内核会明确在ZONE_DMA的Buddy系统中查找空闲页。

2.free_area数组是连接点

free_area[MAX_ORDER]数组是物理内存组织与Buddy算法的物理连接点。

structfree_area{structlist_headfree_list[MIGRATE_TYPES];// 空闲块链表unsignedlongnr_free;// 该阶空闲块的数量};
  • 数组下标:对应Buddy算法的阶 (Order)free_area[0]存放单页块,free_area[1]存放2页块,以此类推。
  • MIGRATE_TYPES:为了解决内存碎片问题(反碎片机制),同一阶的空闲块还会根据迁移类型(如MIGRATE_UNMOVABLE,MIGRATE_MOVABLE)挂入不同的链表。

3. 工作流示例

当内核调用alloc_pages(gfp_mask, order)申请内存时:

  1. 确定Node和Zone:根据gfp_mask(如GFP_KERNEL)和内存策略,内核决定在哪个Node的哪个Zone(如ZONE_NORMAL)进行分配。
  2. 访问Zone的Buddy系统:内核锁定该Zone的自旋锁,访问该Zone结构体中的free_area数组。
  3. 查找空闲块:从free_area[order]开始查找。如果为空,则遍历order+1,order+2… 直到MAX_ORDER-1
  4. 分裂与服务:找到并分裂高阶块(如果需要),更新free_area链表和nr_free计数,返回物理页。

4. 总结

层级职责与Buddy的关系
Node解决NUMA访问延迟包含多个Zone,间接管理多个Buddy实例。
Zone解决硬件寻址限制Buddy分配器的宿主。每个Zone维护独立的Buddy系统来管理自己的空闲页。
Page最小物理单位Buddy分配器的管理对象。Buddy系统负责将Page组织成2 n 2^n2n的链表。

综上所述,物理内存组织架构提供了硬件抽象的容器(Node/Zone),而Buddy分配器则是填充在这些容器中的管理逻辑,两者结合实现了高效、有序的物理内存分配。

http://www.jsqmd.com/news/212505/

相关文章:

  • 【数据分享】2025年全国范围各城市的公交路线及站点数据(分省/分城市)
  • 期货反向跟单—从小白到高手进阶历程 六十三(研究人性不是重点)
  • Agent2Agent (A2A) Protocol( A2A 协议)简介、组件
  • 系列教程十三 | 探索阿里云 Wan 2.1:零基础入门文本生成视频教程
  • 系列教程十四 | 基于CosyVoice 2.0实现语音风格迁移
  • 外包开发三年
  • 【360浏览器】取消360画报,不显示屏保
  • 解析ASTM D4169:运输包装性能测试的核心标准有哪些
  • 提示工程的认知架构设计:架构师的深度思考
  • Java Web 企业客户管理系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】
  • 网上超市设计与实现信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • Java SpringBoot+Vue3+MyBatis 在线文档管理系统系统源码|前后端分离+MySQL数据库
  • 大数据诊断性分析:从入门到精通的完整指南
  • 【2025最新】基于SpringBoot+Vue的甘肃非物质文化网站管理系统源码+MyBatis+MySQL
  • 快速排序 - 原理、时空分析、优化
  • Java SpringBoot+Vue3+MyBatis 教师工作量管理系统系统源码|前后端分离+MySQL数据库
  • 企业级企业客户管理系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】
  • 2. 假新闻检测 - 《FakingRecipe: Detecting Fake News on Short Video Platforms from the Perspective of ...》
  • Java SpringBoot+Vue3+MyBatis 网上超市设计与实现系统源码|前后端分离+MySQL数据库
  • 1. 假新闻检测 - 《Modality Perception Learning-Based Determinative Factor Discovery ...》
  • Java Web 网上购物商城系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】
  • vscode下载/常用插件分享及如何链接Ubuntu
  • idea不能使用低版本插件问题解决
  • MCU+AT到OpenCPU:嵌入式通信技术迭代的必然性(完结篇)
  • 基于Python+Django+SSM美妆产品网络评价数据采集与分析(源码+LW+调试文档+讲解等)/美妆产品评价分析/网络评价数据采集/美妆数据采集/美妆评价分析/美妆产品网络数据/美妆产品评价数据
  • MCU+AT架构的演进:向OpenCPU转型的必然性(完结篇)
  • 深度实战:AirCloud与excloud扩展库集成下的核心功能应用解析!
  • 快速上手iPerf:新手网络测试环境搭建详解!
  • 大规模语言模型在精准医疗方案生成中的应用
  • 【更新至2024年】1996-2024年各省公路里程数据