当前位置: 首页 > news >正文

DigitalOcean 打造 AI 原生云,帮助 AI 应用大幅降低成本与运维复杂度

人工智能行业存在一个复合型的瓶颈,而这个瓶颈并非模型本身,而是推理。

过去仅仅是一次模型调用,如今已演变成一个持续交互的系统。现在的应用程序会编排多个模型,检索并合成数据,执行工具,并在生产环境中重复这一循环。这些不再是“无状态请求”,而是更像基础设施而非软件特性的动态系统。

以下四个变化正在重新定义基础设施必须具备的能力:

  • 推理已取代训练成为重心
  • 推理模型正成为默认选择
  • 自主智能体正在大规模运行
  • 开源模型正以极低的成本达到与闭源模型相当的质量

大多数技术栈从未为此而设计。超大规模云服务商提供了数百种服务,但依然需要将它们拼接在一起。推理提供商则坐落在别人的算力之上,额外增加了一层利润空间。GPU 供应商提供芯片,但不提供系统。

推理已悄然成为现代技术栈中最昂贵、却又最无人真正掌控的一层。每一项新能力都被叠加在一个碎片化的基础之上,而其底层的复杂性则在不断累积。

最终,你遇到的问题不再是模型问题,而是技术栈的问题。

今天,在 Deploy 2026 大会上,DigitalOcean 发布了 DigitalOcean 的 AI 原生云,这是一个面向生产级AI工作负载的全栈系统。

DigitalOcean 的 AI 原生云建立在 DigitalOcean 的核心云服务之上,涵盖计算、存储、网络和托管服务,并针对AI系统在实际生产中的运行方式,扩展了专门设计的能力。

目标很简单:精简技术栈,让构建者能够专注于构建,而不是把各种系统拼凑在一起。

在这里,开源不是附加功能,而是基础。DigitalOcean 去除了不必要的抽象层,消除了供应商之间的利润叠加,让开发者可以直接访问构建和扩展AI系统所需的原语。

这并非空谈。像 Workato 这样的客户在 DigitalOcean 上运行了数万亿次自动化任务,成本降低了67%。Character.ai 部署于DigitalOcean 云平台上,每天处理超过 10 亿次查询,推理吞吐量提高了2倍。Hippocratic AI 医疗平台支持超过 2000 万次患者交互,延迟降低了40%。这三个客户案例表明 DigitalOcean AI 原生云已在生产环境中稳定运行。

面向现代AI系统的五层技术栈

AI应用程序不是单一系统,而是由多个相互作用的层组成,这些层必须持续协同工作。

DigitalOcean AI 原生云将这五层整合为一个统一的系统,包括 托管式Agents、数据与分析、推理引擎、核心云服务、基础设施。(如下图所示)

DigitalOcean AI原生云的新增能力

这些并非概念上的层次,而是实际运行的系统。DigitalOcean 正在扩展产品服务,提供涵盖推理、数据和存储的生产级能力,使其能够大规模运行。

Inference Router(推理路由器,公测版)

一个具备策略感知能力的控制平面,可根据成本、延迟、质量与数据合规性动态路由请求。
团队无需硬编码模型逻辑,只需定义意图,系统即可在不同模型提供商和部署方式之间自动优化执行路径。

例如,LawVo 运行着 130+ AI 智能体,每周处理超过 5 亿 Token,在无需修改代码的情况下,将推理成本降低了 42%。

专用推理与 Bring Your Own Model

支持在专用 GPU 基础设施上运行自定义或微调模型,全面掌控性能、扩展和配置。

开发者可以从 Hugging Face 或自有环境部署模型,通过预调优的推理栈和托管编排,实现高吞吐运行,而无需承担 Kubernetes 的复杂性。

扩展模型与服务

通过统一系统运行和评估文本、图像、音频和视频模型。

模型库持续更新,包含 25+ 新模型,并支持“Day 0”首发接入,例如 NVIDIA Nemotron 3 Nano Omni(在 DigitalOcean 首发)。该高效开源多模态模型整合视觉、语音、语言与工具调用能力,并通过 NVIDIA TensorRT-LLM 在内核层优化。

内置评估工具可在上线前对质量、成本和延迟进行基准测试。

PostgreSQL和MySQL高级版(公测)

托管式PostgreSQL和MySQL高级版提供超大规模云服务商级别的可靠性和扩展能力,与标准版并行提供。

托管式 Weaviate(预览版)

提供可用于生产环境的向量数据库基础设施,无需运维负担,并与 Serverless Inference 原生集成,具备可预测定价。

Knowledge Bases(知识库)

一个完全托管的 RAG 服务,处理数据摄取、分块、嵌入、检索和重排序,并为智能体框架提供 MCP 支持。让你的团队只需几天就能从原型走向生产。

旨在简化,同时不限制灵活性

优势并不在于任何一个单独的层,而在于它们如何协同工作。

当智能体、推理和数据运行在同一个系统上时,性能和成本方面的优化会自动相互叠加。技术栈变得能够自我强化,而不是碎片化。

与此同时,灵活性得以保留。开放的 API 和与现有工具的兼容性,使得采用新模型、集成外部系统以及根据需要演进架构变得容易。

展望未来

从本地部署到云计算的转变催生了 AWS。从云到 SaaS 的转变催生了 Salesforce。而从云原生到 AI 原生和智能体原生应用的转变,将催生下一家伟大的基础设施公司。DigitalOcean 志在于此。

五层技术栈。一个平台。层层开放。今天就让我们与开发者一起构建吧。

http://www.jsqmd.com/news/727982/

相关文章:

  • 2026年B2B媒体发稿服务商资源实力盘点:关投强拥有多少媒体资源 - 发稿平台推荐
  • taotoken 多模型聚合平台为 matlab 用户提供稳定 ai 算力支持
  • 3D 角度检测新标杆|昆泰芯 KTH5701AQ3 三轴磁传感器 高效赋能智能硬件升级
  • XAPK转换APK实用指南:3分钟轻松解决Android应用安装难题
  • Mistral AI 推 Medium 3.5 模型与远程 Agent 功能,打造完整企业 AI 解决方案
  • 5个简单步骤:用Mac Mouse Fix让普通鼠标在macOS上获得专业级体验
  • 视频硬字幕提取终极指南:本地AI一键生成SRT字幕的高效解决方案
  • 企业接入大模型API时,为什么统一入口比单模型直连更重要
  • 国内主流石笼网生产厂家实测排行与采购指南 - 奔跑123
  • 快捷支付|简化网银繁琐流程,支付高效便捷
  • 2026年4月,正规全屋定制门店究竟藏着哪些不为人知的消费秘密?
  • 温州GEO优化公司:构建属于你的AI时代数字资产
  • LibreVNA矢量网络分析仪深度解析:从入门到精通的全方位实战指南
  • R3nzSkin国服换肤指南:零风险解锁英雄联盟全皮肤体验
  • Redis 入门到实战:原理 + 常见用法 + 避坑总结
  • 别再纠结选哪个了!用小麦检测数据集实测YOLOv5/v7/v8,告诉你n/s/m/l/x各版本到底差在哪
  • Copilot 命令行使用方式介绍(npm)
  • 向上管理:测试从业者与技术管理者的同频共振之道
  • 【收藏备用】2026年大模型入门指南:就业+保研全拆解,小白/程序员必看
  • 场地ViL实测:总线注入这样做,智驾测试真实度+复现率双达标|新能源研发必看
  • SchoolCMS开源教务管理系统:如何为中小学校构建现代化数字校园
  • 国内固滨笼生产厂家实力排行:5家头部企业盘点 - 奔跑123
  • 使用Python快速入门Taotoken并完成你的第一个AI对话
  • 研一死磕大模型,预备进厂拧螺丝
  • 86 - DOS 1.00诞生45周年:微软公开最早DOS源码,为开发者打开计算机历史之窗
  • 步进/伺服电动滑台怎么配电控柜?高校实验室与自动化厂选型区别详解
  • 英国机器视觉协会主办会议,录用率31.9%!CCF推荐学术会议(C)截稿提醒
  • SAP ABAP开发实战:用SHDB录屏搞定ME47批量修改,别再一条条点了
  • 别再傻傻全量编译了!OpenHarmony 4.0模块化编译实战,5分钟搞定单个HAP/库
  • 海康设备型号代码(H5/H7/KT2/G5)在Python/Node.js项目中的自动化处理技巧