当前位置: 首页 > news >正文

[具身智能-334]:大模型存储文件中包含的内容与格式?

大模型存储文件的内容和格式,取决于其具体的应用场景和使用框架。之前提到的 Ollama 为例,其存储机制就非常具有代表性,它并非简单地将一个模型文件放在磁盘上,而是采用了一套结构化的管理方式。

📂 Ollama 的模型存储结构

Ollama 默认将所有模型数据存储在用户主目录下的~/.ollama隐藏文件夹中。这个目录是整个模型管理系统的核心,其内部结构清晰地分离了模型的元数据、配置和实际权重数据。

目录/文件类型作用
blobs/目录存储模型的实际权重数据块。
manifests/目录存储模型的清单或配置文件。
models/目录存储模型的元数据和注册信息。
id_ed25519文件Ollama 服务的私钥文件,用于安全通信。

下面我们来详细解析这些核心组成部分。

🧬 blobs/ - 模型的“血肉”

blobs目录是占用磁盘空间最大的部分,它存储了模型真正的“血肉”——权重数据。

  • 内容寻址:这里的文件并非以模型名称命名,而是使用其内容的加密哈希值(通常是 SHA256)来命名,例如sha256-abc123...。这种设计确保了数据的完整性和唯一性。
  • 数据分块:一个完整的模型可能被分解成多个这样的数据块(Blob)。
  • 核心格式:这些数据块的底层格式通常是GGUF (GPT-Generated Unified Format)GGUF 是一种为llama.cpp项目设计的文件格式,它将模型的权重、分词器、配置元数据等打包在一个文件中,并支持高效的量化(如 int4, int8),能显著减小模型体积和内存占用。
📜 manifests/ - 模型的“蓝图”

manifests目录存储的是模型的“蓝图”或“说明书”。

  • 清单文件每个模型都对应一个 JSON 格式的清单文件这个文件描述了如何将blobs/目录中的各个数据块组装成一个完整的、可运行的模型。
  • 包含信息:清单文件中包含了模型的配置信息、层次结构,以及组成该模型所需的所有 Blob 的哈希值列表。当 Ollama 加载一个模型时,它会先读取这个清单,然后根据指引去blobs/目录中找到并加载所有必要的数据块。
🗂️ models/ - 模型的“注册表”

models/目录充当了模型管理器的角色,相当于一个“注册表”。

  • 元数据管理:它通常包含一个manifests.db的 SQLite 数据库文件,记录了本地已下载的所有模型列表、它们对应的清单文件哈希、创建时间等管理信息。
  • 快速索引:这个目录让 Ollama 能够快速查询和索引本地的模型,当你执行ollama list命令时,信息就来源于此。

🔄 模型加载流程

结合以上结构,Ollama 加载一个模型(例如llama3)的完整流程如下:

  1. 查询注册表:Ollama 首先在models/目录的数据库中查找llama3对应的清单文件哈希。
  2. 读取蓝图:根据哈希值,在manifests/目录中找到并读取对应的清单文件。
  3. 组装模型:解析清单文件,获取所有必需的 Blob 哈希列表,然后从blobs/目录中取出这些数据块。
  4. 加载运行:将这些 GGUF 格式的数据块在内存中组装成完整的模型,并交给底层的llama.cpp推理引擎进行加载和运行。

总而言之,Ollama 通过这种将模型“蓝图”(manifests)与“血肉”(blobs)分离,并用“注册表”(models)进行统一管理的结构化方式,实现了对大模型文件的高效、安全和灵活的存储与调用。

http://www.jsqmd.com/news/620745/

相关文章:

  • 信托资金流向与交易对手辨析:钱给了谁,谁就是交易对手吗?
  • 架构师视角:如何通过NVIDIA Profile Inspector重构你的游戏配置管理工作流
  • **发散创新:基于Go语言实现的Raft共识算法实战解析**在分布式系统中,**一致性**是核心挑战之一。而Raft共识算法因其简洁性和
  • 深度解析:2026年近期南通地区外墙阳台渗漏水维修哪家服务商更靠谱? - 2026年企业推荐榜
  • DXVK深度解析:彻底解决GTA IV在Linux平台的纹理模糊问题终极指南
  • SolidEdge许可证分点典型成功案例深度解析
  • PCL点云配准实战:4PCS算法从原理到代码实现(附完整Demo)
  • 2026年安徽地区动物园安全防护升级:高性价比防坠网供应商评估与选择白皮书 - 2026年企业推荐榜
  • S2-Pro集成开发环境搭建:VSCode远程连接与调试指南
  • 非标光源定制专家:恒立高如何以专业LED灯珠方案赋能多元照明场景? - 2026年企业推荐榜
  • 告别官方例程:手把手教你为Xilinx XDMA IP设计自定义用户逻辑(附Verilog源码)
  • SpringAI 1.0.0 实战:用阿里百炼平台免费额度,5分钟搞定你的第一个AI对话接口
  • 2026年大功率LED灯珠选购指南:揭秘头部厂商与专业选型策略 - 2026年企业推荐榜
  • htcw_gfx:嵌入式设备无关图形库深度解析
  • Pixel Dream Workshop应用场景:像素风格UI组件库(按钮/滑块/图标)生成
  • 2026浙江市场围栏采购指南:深度测评河北实力厂家 - 2026年企业推荐榜
  • 2026年Q2钢结构生产厂商专业评估:全国基建工程优选供应商深度解析 - 2026年企业推荐榜
  • 浙江地区重型钢格板服务商综合评估与选型指南(2026) - 2026年企业推荐榜
  • Abaqus求解高峰期(HPC调用)许可证峰值管理技巧
  • 2024年最新高德API实战:动态获取多级行政边界数据与ECharts可视化全攻略
  • 从Sora2到Veo-3.1:2025年AI视频生成,我们离‘电影级’还有多远?
  • 混合整数规划求解器选型指南:Gurobi/SCIP/CBC性能对比与适用场景
  • 如何在安卓设备上安装Hanime1Plugin:终极免费动画观影神器完整指南
  • 2026年湖南市场镀锌钢格栅板供应商选择指南:如何甄别跨区域优质服务商 - 2026年企业推荐榜
  • 智能生活中枢:基于 ESP32-S3 的桌面智能助手与日程提醒终端设计与实现
  • Claude Code 桌面应用使用指南
  • Janus-Pro-7B WebUI详细步骤:从7860端口访问到5图并行生成
  • 2026山东企业制服定制深度测评:如何甄选可靠供应商? - 2026年企业推荐榜
  • 避坑指南:我用PHPStudy搭Pikachu靶场踩过的那些雷(附正确配置流程)
  • 03鲲鹏:华夏之光永存 架构师级·带领鲲鹏走进世界巅峰(3)