当前位置: 首页 > news >正文

Buddy分配器

Buddy分配器

1. 内核在基本的伙伴分配器基础改进扩展

支持内存节点和区域,称为分区的伙伴分配器(zoned buddy allocator)。
为了预防内存碎片,把物理页框通过移动性分组。
针对分配单页做了性能优化,为了减少处理器锁的竞争,在内存区域增加了1个每处理器页集合。

2. 分区的伙伴分配器源码分析

2.1 数据结构

#defineMAX_ORDER11// MAX_ORDER是最大阶数,实际上最大可分配的是最大阶数加1,默认值是11,意味着伙伴分配器一次最多可以分配2^10页。structfree_area{structlist_headfree_list[MIGRATE_TYPES];// 不同类型的空闲区域unsignedlongnr_free;};structzone{/* ... */structfree_areafree_area[MAX_ORDER];/* ... */};

2.2 根据分配标志获取首选区域类型

内核使用GFP_ZONE_TABLE定义了标志组合到区域类型的映射表。其中GFP_ZONES_SHIFT是区域类型占用的位数。GFP_ZONE_TABLE把每种标志组合映射到32位整数的某个位置,偏移是(标志组合 * 区域类型位数),从这个偏移开始的GFP_ZONES_SHIFT个二进制位存放区域类型。

3. 备用区域列表 (Zonelist)

借用必须遵守规则:
一个内存节点的某个区域类型可以从另一个内存节点的相同区域类型借用物理页,比如节点0的普通区域可以从节点1的普通区域借用物理页。
高区域类型可以从低区域类型借用物理页,比如普通区域可以从DMA区域借用物理页。
低区域类型不能从高区域类型借用物理页,比如DMA区域不能从普通区域借用物理页。

包含所有内存节点的备用区域列表有两种排序方法:

  1. 节点优先顺序:先根据节点距离从小到大排序,然后在每个节点里面根据区域类型从高到低排序。优点是优先选择距离近的内存,缺点是在高区域耗尽以后使用低区域。
  2. 区域优先顺序:先根据区域类型从高到低排序,然后在每个区域类型里面根据节点距离从小到大排序。优点是减少低区域耗尽的几率,缺点是不能保证优先选择距离近的内存。

默认的排序方法就是自动选择最优的排序方法:比如是64位系统,因为需要DMA和DMA32区域的备用相对少,所以选择节点优先顺序;如果是32位系统,选择区域优先顺序。

4. 区域水位 (Watermarks)

数据结构如下:

enumzone_watermarks{WMARK_MIN,WMARK_LOW,WMARK_HIGH,NR_WMARK};structzone{/* ... */unsignedlongwatermark[NR_WMARK];// 该区域各种水线/* ... */};

最低水位以下的内存称为紧急保留内存,在内存严重不足的紧急情况下,给承诺“分给我们少量的紧急保留内存使用,我可以释放更多的内存”的进程使用。

Watermark水位控制内核选用了几个重要参数:

  • managed_pages: 伙伴分配器管理的物理页的数量
  • spanned_pages: 当前区域跨越的总页数,包括空洞
  • present_pages: 当前区域可用的所有物理页的数量,包括空洞

它们三者之间的关系:spanned_pages > present_pages > managed_pages

min_free_kbytes的计算:
min_free_kbytes代表的是系统保留空闲内存的最低限度。watermark[WMARK_MIN]的值是通过min_free_kbytes计算出来的。

5. 分区的伙伴分配器核心函数

入口函数:__alloc_pages_nodemask

参数说明:

  • gfp_mask: 分配标志(掩码)
  • order: 阶数
  • zonelist: 首选内存节点的备用区域列表
  • nodemask: 允许从哪些节点分配。如果是NULL,表示允许从所有节点分配。

5.1 快速路径分配页框

函数get_page_from_freelist用于尝试从备用区域列表的区域中分配页框。

它会遍历zonelist,对于每个zone,检查是否满足水位要求(zone_watermark_ok)。如果满足,则尝试从该zone分配。

5.2 慢速路径调用和遇到内存紧缺时的分析

如果在快速路径中分配失败,则会进入慢速路径(__alloc_pages_slowpath)。
慢速路径包含了更复杂的逻辑,例如:

  • 唤醒页回收线程(kswapd)。
  • 忽略水位限制进行分配(如果是紧急分配)。
  • 直接内存回收(Direct Reclaim)。
  • 调用 OOM Killer(如果配置允许)。
  • 重试分配等。
http://www.jsqmd.com/news/212509/

相关文章:

  • AI模型容器化部署实战
  • Slab,不连续页,buddy分配器与内存映射
  • Linux内存映射
  • 物理内存组织架构与Buddy分配器关系分析
  • 【数据分享】2025年全国范围各城市的公交路线及站点数据(分省/分城市)
  • 期货反向跟单—从小白到高手进阶历程 六十三(研究人性不是重点)
  • Agent2Agent (A2A) Protocol( A2A 协议)简介、组件
  • 系列教程十三 | 探索阿里云 Wan 2.1:零基础入门文本生成视频教程
  • 系列教程十四 | 基于CosyVoice 2.0实现语音风格迁移
  • 外包开发三年
  • 【360浏览器】取消360画报,不显示屏保
  • 解析ASTM D4169:运输包装性能测试的核心标准有哪些
  • 提示工程的认知架构设计:架构师的深度思考
  • Java Web 企业客户管理系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】
  • 网上超市设计与实现信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • Java SpringBoot+Vue3+MyBatis 在线文档管理系统系统源码|前后端分离+MySQL数据库
  • 大数据诊断性分析:从入门到精通的完整指南
  • 【2025最新】基于SpringBoot+Vue的甘肃非物质文化网站管理系统源码+MyBatis+MySQL
  • 快速排序 - 原理、时空分析、优化
  • Java SpringBoot+Vue3+MyBatis 教师工作量管理系统系统源码|前后端分离+MySQL数据库
  • 企业级企业客户管理系统管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】
  • 2. 假新闻检测 - 《FakingRecipe: Detecting Fake News on Short Video Platforms from the Perspective of ...》
  • Java SpringBoot+Vue3+MyBatis 网上超市设计与实现系统源码|前后端分离+MySQL数据库
  • 1. 假新闻检测 - 《Modality Perception Learning-Based Determinative Factor Discovery ...》
  • Java Web 网上购物商城系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】
  • vscode下载/常用插件分享及如何链接Ubuntu
  • idea不能使用低版本插件问题解决
  • MCU+AT到OpenCPU:嵌入式通信技术迭代的必然性(完结篇)
  • 基于Python+Django+SSM美妆产品网络评价数据采集与分析(源码+LW+调试文档+讲解等)/美妆产品评价分析/网络评价数据采集/美妆数据采集/美妆评价分析/美妆产品网络数据/美妆产品评价数据
  • MCU+AT架构的演进:向OpenCPU转型的必然性(完结篇)