当前位置：首页 > news >正文

ceph存储池pool和pg

news 2026/6/3 11:13:59

Pool（存储池）：是管理层面的逻辑单元（你创建它来划分业务）。
PG（归置组）：是分布层面的逻辑单元（它是连接“数据”与“硬盘”的中间桥梁）。是 Pool 内管理对象的最小数据单元
OSD：是真正的物理存储单元。

Pool (存储池)：逻辑分区

Pool 是 Ceph 中用于组织和管理数据的逻辑容器。你可以把它想象成一个虚拟的存储分区。

作用：
1. 数据隔离：为不同的业务或用户创建独立的 Pool，实现数据和配置的隔离。
2. 策略定义：每个 Pool 可以独立配置数据冗余方式（副本数或纠删码规则）、PG 数量、CRUSH 规则等。
关键属性：
- pg_num：Pool 中包含的 PG 数量，决定了数据分布的粒度。
- size：副本数量，例如 size=3 表示每个对象会保存 3 个副本。
- crush_rule：定义数据如何在物理设备上分布，例如跨主机或跨机架分布。

PG (归置组)：物理分布的中间层

PG 是 Ceph 架构中最精妙的设计之一。它的引入是为了解决一个核心难题：如何高效地管理集群中海量的对象（可能是数十亿级别）。

PG 存在的意义

想象一下，如果 Ceph 直接管理每一个对象，当集群扩容或有硬盘（OSD）故障时，系统需要遍历所有对象来计算新的位置，这将是巨大的性能开销。

PG 通过引入一个“间接层”解决了这个问题：

对象 → PG：客户端写入一个对象时，通过哈希算法（hash(object_id) % pg_num）将其映射到一个固定的 PG 中。
PG → OSD：Ceph 通过 CRUSH 算法，计算出这个 PG 应该由哪一组 OSD（例如 [osd.1, osd.5, osd.9]）来存储。

这种设计的好处是，Ceph 只需要管理数量相对较少且稳定的 PG（例如几千个），而不是海量的对象（数十亿个）。当集群状态变化（如 OSD 故障）时，Ceph 只需要重新计算 PG 与 OSD 的映射关系，然后以 PG 为单位进行数据迁移和恢复，极大地降低了系统开销。

Pool 和 PG 的关系

Pool 和 PG 是包含关系。

一个 Pool 由多个 PG 组成。
当你创建一个 Pool 时，必须为其指定 pg_num 参数。
这个 Pool 里的所有对象，都会被分散到这个 Pool 所包含的各个 PG 中。
每个 PG 再通过 CRUSH 算法被放置到一组 OSD 上。

数据流向可以概括为：
对象 (Object) → 归属到某个 Pool → 通过哈希映射到 Pool 内的某个 PG → 通过 CRUSH 算法映射到一组 OSD

如何设置 PG 数量 (pg_num)

PG 数量的设置对集群性能至关重要，需要在数据分布的均衡性和系统资源开销之间取得平衡。

PG 数量过少：会导致数据分布不均，某些 OSD 负载过高，形成“热点”。
PG 数量过多：会增加 OSD 的内存和 CPU 开销，因为每个 PG 都需要维护元数据。

计算公式

Ceph 官方推荐每个 OSD 承载 100 到 200 个 PG。你可以使用以下公式来计算一个 Pool 的初始 PG 数量：

总 PG 数 = (OSD 总数 * 100) / 池大小

池大小：对于副本池，就是副本数（如 3）；对于纠删码池，则是 k+m 的和。
计算结果：需要将计算结果向上取整到最接近的 2 的 n 次幂（如 64, 128, 256, 512, 1024...）。

示例：
一个拥有 100 个 OSD 的集群，要创建一个 3 副本的 Pool。

计算：(100 * 100) / 3 = 3333
取 2 的 n 次幂：最接近且大于 3333 的 2 的幂是 4096。
因此，建议将 pg_num 设置为 4096。

提示：在现代 Ceph 版本中，可以启用 PG 自动伸缩功能 (pg_autoscale_mode = on)，让 Ceph 根据集群状态自动调整 PG 数量，简化了运维工作。

查看全文

http://www.jsqmd.com/news/658229/

网络性能调优实践

3分钟掌握FanControl：打造完美静音的Windows风扇控制系统

模型推理耗时飙升200%？实时代码补全卡顿诊断全解析，精准定位GPU显存泄漏与Token调度失衡

2025届必备的降AI率方案推荐

2026论文查AI率渠道降AI工具实测指南「收藏备用」

5分钟掌握B站视频下载神器：bilibili-downloader完全指南

2026年灵敏感测实时微控制器选型：国内哪家厂商兼具精度与稳定性？

**发散创新：基于Python与ROS的机器人运动控制实战解析**在现代机器人系统开发中，*

【优化设计】遗传算法GA和粒子群算法PSO优化校园排水网络在长度和成本约束下的管道布局设计【含Matlab源码 15338期】

从ResNet到实战：MSTAR SAR图像目标分类的完整实现与调优

Python 中字典键值对的变量名缩写语法详解

CVAT标注效率翻倍：从零开始配置你的第一个自动驾驶数据集标注任务（避坑指南）

从方差最大化到数据压缩：深入剖析PCA的数学基础与SVD实现

如何让Switch手柄在Windows上获得专业游戏体验：JoyCon-Driver深度解析

三驾马车重塑文明：AI、机器人与量子计算的角色分野与终极融合

【优化求解】不同发动机和燃料对GA应用进行价格调整建模【含Matlab源码 15342期】

bootstrap怎么实现带有验证状态的表单

【技术底稿 16】37岁老码农的极简运维：给个人DevOps搭个统一入口

014、LangChain 入门到底先学什么？用一个知识库问答项目讲清 PromptTemplate、Chain 和 Output Parser

怎么在MongoDB中实现动态轮换证书(Certificate Rotation)而不停机

【优化位置】配电系统中电容的最佳位置（降低损耗和电压改善）【含Matlab源码 15346期】

科捷智能：锂电材料行业智能工厂物流构建实践

【人生底稿・番外篇 04】我的游戏青春：从村里的街机厅，到程序员的代码江湖

别再乱用@staticmethod了！深入理解Python中类方法、静态方法与实例方法的区别与实战选择

链表基础与虚拟头结点 ——203. 移除链表元素

新鲜出炉！Claude Code之父亲授 Opus 4.7 最佳实践

GM8775C MIPI转LVDS实战避坑指南

数据库性能优化实战

大语言模型会在“教学”中夹带“私货”

Pool (存储池)：逻辑分区

PG (归置组)：物理分布的中间层

Pool 和 PG 的关系

如何设置 PG 数量 (pg_num)

相关文章：