当前位置: 首页 > news >正文

MongoDB GridFS分片时选择什么键比较好

GridFS分片只能用_id字段,且必须为hashed策略;files和chunks集合自动关联,其他字段无法作为分片键;查询需依赖filename或metadata等字段的手动二级索引。GridFS 分片必须用 _id 字段,其他字段无效GridFS 本身不支持对 files 或 chunks 集合任意字段分片——MongoDB 强制要求:只有 _id 字段能作为分片键。这是硬性限制,不是最佳实践建议。试图用 filename、uploadDate 或自定义字段建分片会直接报错 cannot shard collection with non-_id shard key on a GridFS namespace。原因很简单:GridFS 是两个集合(files 和 chunks)的逻辑封装,MongoDB 内部通过 _id 关联二者。若允许其他分片键,会导致文件元数据和实际数据块跨分片后无法保证原子性或一致性。分片命令只能写成:sh.shardCollection("mydb.fs.files", { "_id": "hashed" })fs.chunks 会自动继承 fs.files 的分片策略,无需、也不能单独操作如果你已有非 _id 分片键的普通集合,别指望 GridFS 能复用它选 "_id": "hashed" 还是 "_id": "ascending"?绝大多数场景下,"_id": "hashed" 是唯一合理选择。默认 ObjectId 本身是时间+机器+进程+计数器组成的,按升序插入时天然导致“热点写入”——所有新文件都落在同一个分片上,彻底失去分片意义。而 hashed 策略把 _id 哈希后均匀分布,写入压力才能摊开。但要注意:哈希后就失去了按时间范围查询的能力(比如“查昨天上传的所有文件”),因为哈希打乱了顺序。用 hashed:适合高并发上传、文件大小较均匀、不依赖时间范围扫描的场景用 ascending:仅限极小集群、调试用途,或你完全控制 _id 生成逻辑(例如自己构造带时间戳的字符串 ID 并确保散列度)不要尝试复合分片键,{ "_id": 1, "uploadDate": 1 } 这类写法在 GridFS 中语法非法真正影响性能的其实是 filename 和 metadata 查询方式既然分片键锁死在 _id,那怎么高效查文件?答案是:靠二级索引,而不是分片键。GridFS 不会自动为 filename 或 metadata 字段建索引,你得手动加。 Murf AI AI文本转语音生成工具

http://www.jsqmd.com/news/663671/

相关文章:

  • 【紧急预警】2026奇点大会披露:主流AI合并工具存在CVE-2026-7891漏洞,可能导致commit lineage污染——附3行脚本自检方案
  • 四旋翼无人机多领航编队 - 跟随控制(二阶一致性 + 滑模对比)研究(Matlab代码实现)
  • bilibili-parse:PHP实现的B站视频解析API技术深度解析
  • Android CarrierTestOverride 实战:无需实体卡模拟指定运营商网络环境
  • 别再只会画方框了!Matlab rectangle函数从画圆到自定义形状的5个实用技巧
  • 免费TCP路由追踪工具tracetcp:为什么它能解决你的网络诊断难题?
  • 2026年质量好的贵州工程质量检测/贵州学校工程质量检测可靠服务公司 - 品牌宣传支持者
  • 手把手教你为高通平台(如骁龙888)定制设备树:搞定BOARD-ID和MSM-ID配置
  • mysql如何通过代码库管理数据库账号_MySQL版本控制与权限脚本
  • 微信聊天记录备份终极指南:5分钟掌握WeChatExporter完整使用方案
  • 波束赋形算法实战:从原理到代码,一步步拆解广义旁瓣相消器(GSC)在Python中的实现
  • Cursor Free VIP:三步解锁AI编程神器的终极免费指南
  • 2026年质量好的系统门窗精选厂家推荐 - 行业平台推荐
  • 用STM32F103C8T6+ESP8266做智能药盒,从硬件选型到代码调试的完整避坑指南
  • 云原生环境中的存储管理:从PV到StorageClass的全面指南
  • Android开发者必看:高通USB驱动调试实战指南(附常见问题排查)
  • STM32无刷电机无感控制实战:从反电动势波形分析到代码调参(附2836电机24V驱动实测)
  • 十五、Fluent组分输运模型实战:从湿空气模拟到燃烧化学反应的通用解法
  • 【反蒸馏实战 13】数据科学家:当MLOps工具链降低建模门槛,你的“建模专家”标签正在失效@数据科学家从模型构建者到AI系统设计师
  • 【CNN】从结构到实战:拆解卷积神经网络的核心组件与视觉应用
  • Notepad--:跨平台文本编辑器的国产替代方案与高效工作流实践
  • 告别Arduino IDE!用CircuitPython玩转Seeeduino XIAO,像写Python脚本一样简单
  • 告别SysTick!用STM32通用定时器TIM4实现微秒级延时(附CubeMX配置避坑指南)
  • View的三大特性之一:迟绑定
  • ArcGIS Pro影像分类精度上不去?试试这个‘面向对象+向导’的组合拳,效果立竿见影
  • 2026.4.18:使用docker compose安装极狐GitLab-ce
  • UnrealPakViewer技术解析:企业级UE4资源包分析架构深度评估
  • 利用豆包产生虚拟场景的测试
  • Midscene.js:打破视觉自动化测试壁垒,让AI成为你的跨平台测试专家
  • 从入门到精通:富斯MC6接收机的7种模式与实战应用指南