当前位置: 首页 > news >正文

DigitalOcean 亮相 NVIDIA GTC 2026:为智能体时代打造 AI 工厂

人工智能的格局已经从静态模型演变为动态的、长时间运行的智能体。在 DigitalOcean,我们致力于为开发者提供一个专为智能体打造的 AI 推理云平台——让他们无需承担传统基础设施的运维负担和复杂成本。

今天,在 NVIDIA GTC 2026 上,DigitalOcean 宣布与 NVIDIA 合作大规模扩展推理能力。我们正在超越基础架构,构建一个专为 AI 构建者和下一代自主智能体提供支持的 AI 工厂(AI Factory)。

AI 智能体的成熟平台

DigitalOcean 正在迅速成为智能体工作流的主导平台和 AI 企业的首选部署平台。当开源智能体 OpenClaw(前身为 Clawdbot)风靡全球时,DigitalOcean 敏锐地察觉到了市场对一键部署(或者说无感知部署)的需求。

  • 不到 36 小时,DigitalOcean 就将生产级的一键部署 OpenClaw 功能上线到了 DigitalOcean Marketplace(生态插件市场)
  • 结果证明了我们的影响力:OpenClaw 在 DigitalOcean 上实现了 43,000+ 部署量,目前有超过 11,000 个 OpenClaw 部署在实际场景中运行
  • DigitalOcean 的开发者们不仅仅是在部署模型,他们还在利用 DigitalOcean 的生态系统,从备份、快照到 Gradient AI 无服务器推理等相关服务,以支持他们的智能体工作负载

DigitalOcean 和 NVIDIA 还合作开发了开源工具集 NVIDIA NemoClaw,只需一条命令就能更安全地运行 OpenClaw 常驻助手。NVIDIA OpenShell 运行时提供了一个安全环境来运行自主智能体和开源模型,然后无缝部署到 DigitalOcean。

AI 工厂:深度融合云基础设施与推理服务

为什么 DigitalOcean 在这个 AI 市场中处于独特的领先地位?我们正大力投入,将云基础服务与 AI 推理能力深度集成,打造一个支持各类推理场景的卓越平台。

不同于传统超大规模云(如 AWS、GCP)的碎片化与复杂性,我们的 AI 工厂为构建者提供了直达生产、易于扩展的简化路径。除了尖端 GPU,你还能无缝整合以下完整的 DigitalOcean 产品套件,为生产业务保驾护航:

  • Kubernetes 托管服务(DOKS)用于编排
  • VPC 和云防火墙提供无妥协的安全性
  • 负载均衡器轻松扩展流量
  • 高性能 NAS 存储加速推理和微调
  • OpenSearch 等托管数据库处理对智能体记忆和检索至关重要的海量向量数据集

专为 AI 构建的基础设施:Richmond 数据中心

为支撑这个 AI 工厂,我们启用了全新的 ​Richmond 数据中心​——DigitalOcean 专为 AI 打造的 latest 设施。

  • 该数据中心配备最先进的 NVIDIA HGX B300 GPU 服务器
  • 400 Gbps 无损 RDMA 网络架构,满足复杂智能体工作流和大规模模型部署所需的高吞吐数据传输
  • 与计算、网络、存储及推理中心等核心云服务无缝集成

基于 DigitalOcean 的 build.nvidia.com

通过与 NVIDIA 的深度合作,我们正在将世界上最先进的开源模型直接集成到 NVIDIA 原生技术栈中——而这些模型实际运行在 DigitalOcean 的高性能基础设施上。

具体来说:

  • 直接在 build.nvidia.com 调用无服务器端点​:用户现在可以在 build.nvidia.com 上直接使用 DigitalOcean 的无服务器推理能力,运行 GLM-5、Kimi-K2.5、Minimax-M2.5 等顶尖开源模型,无需跳转,无需重新配置。
  • Blackwell 带来的性能跃升​:这些最先进的模型跑在 DigitalOcean 由 NVIDIA Blackwell GPU 驱动的无服务器推理平台上,相比 HGX H200 性能提升约 4 倍(基于内部测试数据)。
  • Dynamo 1.0 加持,成本再降​:我们已经采用 NVIDIA Dynamo 1.0 来优化生产级推理。在 DigitalOcean Kubernetes 上运行 Dynamo 的客户不仅获得了显著的性能提升,在 Hopper GPU 上的推理成本也降低了高达 3 倍。

通过 build.nvidia.com 与 DigitalOcean 的深度集成,AI 开发者现在可以:在 NVIDIA 的 API 目录里试用高性能模型做原型设计 → 然后一键无缝部署到 DigitalOcean GPU Droplets 进入生产环境。整个流程无需重构技术栈,基础设施层面的摩擦被彻底消除。

我们邀请你今天就上手试试,开始交付下一代 AI 应用。

扩展开源模型目录

同时,DigitalOcean 宣布,NVIDIA 的 Nemotron 3 Nano 模型现已上线 DigitalOcean 推理云平台。

  • 该模型为深度推理工作流带来了卓越效率
  • 利用稀疏混合专家(MoE)架构,每个 Token 仅激活 32 亿参数
  • 这种效率支持高达 100 万 Token 的上下文窗口,为复杂的长时间任务解锁高级智能体推理

欢迎参加在旧金山举办的 DigitalOcean Deploy,与创新者一起探讨现实世界推理的挑战、使用 AI 智能体进行构建,以及定义智能体时代的未来。

同时,也欢迎中国区的企业与开发者关注卓普云 AI Droplet,今年 DigitalOcean 还将发布一系列面向 AI 与机器学习的 GPU 算力产品、AI 推理产品等服务,并通过卓普云 AI Droplet 为大家提供专业的技术服务。

http://www.jsqmd.com/news/511981/

相关文章:

  • Z-Image-Turbo_Sugar脸部Lora赋能内容创作:短视频博主头像批量生成方案
  • 2026功率预测生死局:MKAN多尺度网络如何将光伏预测误差斩落马下?
  • 如何为本地开发环境配置 HTTPS 以对接微信登录
  • 世嘉MD完全档案中文版PDF
  • 零碳园区管理系统投资效益分析与评估模型的未来发展趋势
  • 为什么大厂软件都带签名?代码签名证书作用揭秘
  • OpenFein统一重试和统一降级,且原生Fein重试失效
  • 1%的预测精度提升,在现货市场值多少钱?基于100MW电站的年度收益敏感性分析
  • ClearerVoice-Studio与SpringBoot集成:构建智能语音微服务
  • 避坑指南:PINN在常微分方程积分中的常见问题与解决方案
  • SparkFun I2C GPS库:寄存器级控制与多星座定位开发指南
  • 【高精度气象】2026别再只问“天气准不准”:真正拉开收益差距的,是把预报接进交易、调度和运维
  • 深入理解 C#.NET TaskScheduler:为什么大量使用 Work-Stealing
  • 智能排班系统:企业人力资源管理的数字化革新
  • SiameseAOE模型内网穿透测试指南:本地开发调试GPU模型服务
  • 户籍制度捆绑资源下留守儿童问题对人口结构的长效影响
  • COMSOL多极分解:分方向多级展开通用模型在电磁场与透射率光学BIC仿真中的应用及面上箭头展示
  • RAG系统深度解析
  • Qwen3-ASR语音识别应用:会议记录、字幕生成实战案例
  • Harbor镜像仓库对接OpenLDAP统一认证实操手册
  • 告别手动排班:智能排班系统助力HR实现高效管理
  • 巧用手机原生功能,零成本给重要文档加密防护
  • 企业数据安全体系建设指南:从风险识别到技术落地的全流程(2026版)
  • Retinaface+CurricularFace镜像教程:手把手教你搭建人脸识别环境,简单易用
  • 养老设计行业黑马崛起:揭秘深圳医博传人如何用3个月霸榜搜索引擎的“危险操作“
  • 从零基础到行业专家:50 步 AI 成长路线图,构建可落地的 AI 核心能力
  • 揭秘Open-Sora的‘数据炼金术‘:我是如何用GPT-4V+LLaVA打造百万级视频字幕的
  • Pixel Dimension Fissioner部署教程:Docker镜像开箱即用+Stable v1.0.0适配
  • 三菱电机编码器软件修改全攻略:J2、J2S、J3、J4系列大揭秘
  • PageAdmin平台版技术说明:站群集约化与应用平台化技术方案