当前位置：首页 > news >正文

DigitalOcean 打造 AI 原生云，帮助 AI 应用大幅降低成本与运维复杂度

news 2026/6/24 11:31:07

人工智能行业存在一个复合型的瓶颈，而这个瓶颈并非模型本身，而是推理。

过去仅仅是一次模型调用，如今已演变成一个持续交互的系统。现在的应用程序会编排多个模型，检索并合成数据，执行工具，并在生产环境中重复这一循环。这些不再是“无状态请求”，而是更像基础设施而非软件特性的动态系统。

以下四个变化正在重新定义基础设施必须具备的能力：

推理已取代训练成为重心
推理模型正成为默认选择
自主智能体正在大规模运行
开源模型正以极低的成本达到与闭源模型相当的质量

大多数技术栈从未为此而设计。超大规模云服务商提供了数百种服务，但依然需要将它们拼接在一起。推理提供商则坐落在别人的算力之上，额外增加了一层利润空间。GPU 供应商提供芯片，但不提供系统。

推理已悄然成为现代技术栈中最昂贵、却又最无人真正掌控的一层。每一项新能力都被叠加在一个碎片化的基础之上，而其底层的复杂性则在不断累积。

最终，你遇到的问题不再是模型问题，而是技术栈的问题。

今天，在 Deploy 2026 大会上，DigitalOcean 发布了 DigitalOcean 的 AI 原生云，这是一个面向生产级AI工作负载的全栈系统。

DigitalOcean 的 AI 原生云建立在 DigitalOcean 的核心云服务之上，涵盖计算、存储、网络和托管服务，并针对AI系统在实际生产中的运行方式，扩展了专门设计的能力。

目标很简单：精简技术栈，让构建者能够专注于构建，而不是把各种系统拼凑在一起。

在这里，开源不是附加功能，而是基础。DigitalOcean 去除了不必要的抽象层，消除了供应商之间的利润叠加，让开发者可以直接访问构建和扩展AI系统所需的原语。

这并非空谈。像 Workato 这样的客户在 DigitalOcean 上运行了数万亿次自动化任务，成本降低了67%。Character.ai 部署于DigitalOcean 云平台上，每天处理超过 10 亿次查询，推理吞吐量提高了2倍。Hippocratic AI 医疗平台支持超过 2000 万次患者交互，延迟降低了40%。这三个客户案例表明 DigitalOcean AI 原生云已在生产环境中稳定运行。

面向现代AI系统的五层技术栈

AI应用程序不是单一系统，而是由多个相互作用的层组成，这些层必须持续协同工作。

DigitalOcean AI 原生云将这五层整合为一个统一的系统，包括托管式Agents、数据与分析、推理引擎、核心云服务、基础设施。（如下图所示）

DigitalOcean AI原生云的新增能力

这些并非概念上的层次，而是实际运行的系统。DigitalOcean 正在扩展产品服务，提供涵盖推理、数据和存储的生产级能力，使其能够大规模运行。

Inference Router（推理路由器，公测版）

一个具备策略感知能力的控制平面，可根据成本、延迟、质量与数据合规性动态路由请求。
团队无需硬编码模型逻辑，只需定义意图，系统即可在不同模型提供商和部署方式之间自动优化执行路径。

例如，LawVo 运行着 130+ AI 智能体，每周处理超过 5 亿 Token，在无需修改代码的情况下，将推理成本降低了 42%。

专用推理与 Bring Your Own Model

支持在专用 GPU 基础设施上运行自定义或微调模型，全面掌控性能、扩展和配置。

开发者可以从 Hugging Face 或自有环境部署模型，通过预调优的推理栈和托管编排，实现高吞吐运行，而无需承担 Kubernetes 的复杂性。

扩展模型与服务

通过统一系统运行和评估文本、图像、音频和视频模型。

模型库持续更新，包含 25+ 新模型，并支持“Day 0”首发接入，例如 NVIDIA Nemotron 3 Nano Omni（在 DigitalOcean 首发）。该高效开源多模态模型整合视觉、语音、语言与工具调用能力，并通过 NVIDIA TensorRT-LLM 在内核层优化。

内置评估工具可在上线前对质量、成本和延迟进行基准测试。

PostgreSQL和MySQL高级版（公测）

托管式PostgreSQL和MySQL高级版提供超大规模云服务商级别的可靠性和扩展能力，与标准版并行提供。

托管式 Weaviate（预览版）

提供可用于生产环境的向量数据库基础设施，无需运维负担，并与 Serverless Inference 原生集成，具备可预测定价。

Knowledge Bases（知识库）

一个完全托管的 RAG 服务，处理数据摄取、分块、嵌入、检索和重排序，并为智能体框架提供 MCP 支持。让你的团队只需几天就能从原型走向生产。

旨在简化，同时不限制灵活性

优势并不在于任何一个单独的层，而在于它们如何协同工作。

当智能体、推理和数据运行在同一个系统上时，性能和成本方面的优化会自动相互叠加。技术栈变得能够自我强化，而不是碎片化。

与此同时，灵活性得以保留。开放的 API 和与现有工具的兼容性，使得采用新模型、集成外部系统以及根据需要演进架构变得容易。

展望未来

从本地部署到云计算的转变催生了 AWS。从云到 SaaS 的转变催生了 Salesforce。而从云原生到 AI 原生和智能体原生应用的转变，将催生下一家伟大的基础设施公司。DigitalOcean 志在于此。

五层技术栈。一个平台。层层开放。今天就让我们与开发者一起构建吧。

http://www.jsqmd.com/news/727982/

相关文章：

2026年B2B媒体发稿服务商资源实力盘点：关投强拥有多少媒体资源 - 发稿平台推荐

taotoken 多模型聚合平台为 matlab 用户提供稳定 ai 算力支持

3D 角度检测新标杆｜昆泰芯 KTH5701AQ3 三轴磁传感器高效赋能智能硬件升级

XAPK转换APK实用指南：3分钟轻松解决Android应用安装难题

Mistral AI 推 Medium 3.5 模型与远程 Agent 功能，打造完整企业 AI 解决方案

5个简单步骤：用Mac Mouse Fix让普通鼠标在macOS上获得专业级体验

视频硬字幕提取终极指南：本地AI一键生成SRT字幕的高效解决方案

企业接入大模型API时，为什么统一入口比单模型直连更重要

国内主流石笼网生产厂家实测排行与采购指南 - 奔跑123

快捷支付｜简化网银繁琐流程，支付高效便捷

2026年4月，正规全屋定制门店究竟藏着哪些不为人知的消费秘密？

温州GEO优化公司：构建属于你的AI时代数字资产

LibreVNA矢量网络分析仪深度解析：从入门到精通的全方位实战指南

R3nzSkin国服换肤指南：零风险解锁英雄联盟全皮肤体验

Redis 入门到实战：原理 + 常见用法 + 避坑总结

别再纠结选哪个了！用小麦检测数据集实测YOLOv5/v7/v8，告诉你n/s/m/l/x各版本到底差在哪

Copilot 命令行使用方式介绍（npm）

向上管理：测试从业者与技术管理者的同频共振之道

【收藏备用】2026年大模型入门指南：就业+保研全拆解，小白/程序员必看

场地ViL实测：总线注入这样做，智驾测试真实度+复现率双达标｜新能源研发必看

SchoolCMS开源教务管理系统：如何为中小学校构建现代化数字校园

国内固滨笼生产厂家实力排行：5家头部企业盘点 - 奔跑123

使用Python快速入门Taotoken并完成你的第一个AI对话

研一死磕大模型，预备进厂拧螺丝

86 - DOS 1.00诞生45周年：微软公开最早DOS源码，为开发者打开计算机历史之窗

步进/伺服电动滑台怎么配电控柜？高校实验室与自动化厂选型区别详解

英国机器视觉协会主办会议，录用率31.9%！CCF推荐学术会议（C）截稿提醒

SAP ABAP开发实战：用SHDB录屏搞定ME47批量修改，别再一条条点了

别再傻傻全量编译了！OpenHarmony 4.0模块化编译实战，5分钟搞定单个HAP/库

海康设备型号代码（H5/H7/KT2/G5）在Python/Node.js项目中的自动化处理技巧