当前位置: 首页 > news >正文

AI工程化(一)定义和层级划分

一、介绍

1、为什么需要工程化

在简单场景下,我们通常不需要工程化。

例如,像 Redis 这样的工具,在基础使用阶段,仅仅作为缓存读写组件时,并不需要复杂的架构设计或框架支持。但随着业务规模扩大、使用场景变复杂,就会逐渐暴露出一系列问题,例如:

  • 缓存雪崩
  • 缓存穿透
  • 缓存击穿
  • 数据一致性

这时,仅靠简单调用已经无法满足需求,就需要引入一整套工程化方案(如缓存策略、限流、降级、分布式设计等)来保证系统的稳定性和可扩展性。

AI 系统的发展路径其实是类似的。

在最初阶段,我们可能只需要简单调用一个大模型 API,传入 prompt 并获取结果,这种方式几乎不需要工程化。但随着应用深入,会逐渐遇到更多复杂问题,例如:

  • Prompt 变得越来越复杂、难以维护
  • 不同任务需要不同模型(成本 vs 效果的权衡)
  • 输出结果不稳定,需要控制和校验
  • 多轮对话、上下文管理变复杂
  • 性能、成本、延迟需要优化

此时,单纯“调用模型”已经不够,需要引入工程化手段来系统性地解决这些问题。

例如:

  • 通过 Prompt 模板化、拆分与组合来提升可维护性
  • 构建模型路由机制,根据任务复杂度选择不同模型
  • 引入中间层(Agent / Workflow)管理任务流程
  • 增加缓存、重试、评估机制提升稳定性

因此,AI 工程化的本质,是在复杂业务场景下,对模型能力进行可控、可扩展、可维护的系统化封装。当 AI 从“玩具”变成“基础设施”,工程化就不再是可选项,而是必选项。

2、工程化的定义

AI 工程化(AI Engineering),可以理解为:

将大模型能力从“简单调用”升级为“可管理系统”的过程。将AI研究成果转化为稳定(可靠)、可维护(可控)、可扩展的生产系统。

更具体一点,它包含以下几个核心方面:

  1. Prompt 工程化
    将原本零散的 prompt,转化为结构化、可复用、可版本化的模块。
  2. 模型管理与路由
    根据任务复杂度、成本、延迟等因素,动态选择合适的模型(如小模型 vs 大模型)。
  3. 任务编排(Workflow / Agent)
    将复杂任务拆解为多个步骤,由系统自动调度执行。
  4. 结果控制与评估
    对模型输出进行校验、过滤、打分,确保结果稳定可靠。
  5. 性能与成本优化
    包括缓存、批处理、流式输出、降级策略等。
  6. 可观测性与运维
    监控调用情况、错误率、成本消耗,以及效果评估。

3、对比

二、层级划分

1、逻辑概念层级

AWS 前负责人 Greg Coquillo 提出《The 8-Layer Architecture of Agentic AI》

1️⃣ Infrastructure Layer(基础设施层)

作用:提供算力与数据基础

  • GPU / TPU / 云计算资源
  • 数据湖 / 数据仓库
  • 存储系统(如对象存储)
  • 网络与负载均衡

👉 本质:AI 的“地基”,没有这一层,上层能力无法运行。


2️⃣ Agent Internet Layer(Agent 网络层)

作用:让 Agent 能连接世界与彼此

  • 多 Agent 系统(Multi-Agent Systems)
  • 通信协议
  • 向量数据库(如 Pinecone、Weaviate)
  • Agent 身份与状态管理
  • 执行环境 / 外部 API

👉 本质:让 Agent“活起来”,可以通信、调用外部能力。


3️⃣ Protocol Layer(协议层)

作用:定义 Agent 之间如何协作

  • A2A(Agent-to-Agent)协议
  • MCP(Model Context Protocol)
  • AGP / ANP 等 Agent 协议
  • Function Call Protocol

👉 本质:AI 世界的“HTTP 协议”,标准化交互方式。


4️⃣ Tooling & Enrichment Layer(工具与增强层)

作用:扩展模型能力边界

  • RAG(检索增强生成)
  • 向量数据库(FAISS、Chroma)
  • 工具调用(Function Calling)
  • 代码执行(Python / Sandbox)
  • 外部 API / 插件系统

👉 本质:让 AI 不只是“会说”,而是“能做”。


5️⃣ Cognition & Reasoning Layer(认知与推理层)

作用:让 AI 具备“思考能力”

  • 规划(Planning)
  • 决策(Decision Making)
  • 推理引擎(Reasoning)
  • 自我改进(Self-Improvement)
  • 错误处理(Error Handling)
  • 多步任务处理

👉 本质:Agent 的“大脑”。


6️⃣ Memory & Personalization Layer(记忆与个性化层)

作用:让 AI 具备“记忆”和“个性”

  • 短期记忆(Working Memory)
  • 长期记忆(Long-term Memory)
  • 用户画像(Profile)
  • 对话历史
  • 行为建模
  • 情感上下文

👉 本质:让 AI 从“工具”变成“助手”。


7️⃣ Application Layer(应用层)

作用:面向具体业务场景

  • 个人助手
  • 内容创作(写作 / 视频 / 代码)
  • 电商推荐
  • 学习助手
  • 协作办公 Agent(如 Slack / Notion)
  • 自动化任务机器人

👉 本质:用户真正使用的“产品层”。


8️⃣ Ops & Governance Layer(运维与治理层)

作用:保证系统稳定、可控、可监管

  • 部署与 CI/CD
  • 成本控制(Cost Optimization)
  • 监控与可观测性
  • 权限与隐私治理
  • 日志与审计
  • 安全与信任机制

👉 本质:AI 工程化的“护城河”。

2、技术栈层级

上面的概念层级压缩成技术栈层级:

1️⃣ Infrastructure Layer(基础设施层)

  • 云、算力、存储
    👉 和前面8层里的基础设施是一样的

2️⃣ Architecture Layer(模型架构层)

  • Transformer、Diffusion、CNN、RNN、RAG、MoE 等

👉 这一层讲的是:

模型“怎么被设计出来”

⚠️ 和 Agent 架构里的“Protocol / Tooling”完全不是一类东西


3️⃣ ML Foundation Model Layer(基础模型层)

  • GPT-4、Claude、LLaMA、Mistral、Gemini 等

👉 这一层是:

具体的大模型产品


4️⃣ LLM Layer(模型实例 / 推理层)

  • GPT-3.5、Claude Instant、Mistral、Phi 等

👉 可以理解为:

可调用的模型版本(推理服务)


5️⃣ API Layer(接口层)

  • OpenAI API、Azure OpenAI、Anthropic API、Replicate 等

👉 这一层是:

开发者真正调用的入口


6️⃣ Application Layer(应用层)

  • ChatGPT、Notion AI、Copilot、Runway 等

👉 用户直接使用的产品

http://www.jsqmd.com/news/571799/

相关文章:

  • 从电话网到互联网:三种数据交换技术演进与实战选型指南
  • 解密WZ文件格式:WzComparerR2的技术实现与数据可视化方案
  • 执业药师刷题软件实测!5款主流款避坑推荐,新手小白直接抄作业 - 品牌测评鉴赏家
  • VideoSrt:基于Golang的智能视频字幕生成解决方案
  • MAVLink垂直扩展:Emaxx导航板专用协议库设计与实践
  • 3个高效技巧用CSS片段打造你的专属Obsidian工作台
  • HoRain云--Vue3事件处理
  • Windows系统卡顿?终极优化指南:让你的电脑速度提升50%
  • 技术驱动:英文建站哪家公司技术实力强?重点关注团队、架构与服务支持 - 品牌推荐大师
  • 2026年中国安防行业软件发展概况
  • Gemma-3-12B-IT大模型微调实战:领域适配指南
  • 如何让老旧Mac焕发新生:OpenCore Legacy Patcher全方位使用指南
  • cool-admin(midway版)前端性能优化:10个最佳实践指南
  • 2026墙柜整装十大品牌解析:行业趋势与品质之选 - 品牌排行榜
  • 5分钟部署Qwen3语义雷达:可视化界面,体验真正的语义检索
  • TouchGal:3个关键功能让你成为真正的Galgame收藏家
  • Laravel5.x版本特性全解析
  • Wan2.2-I2V-A14B效果展示:水墨风、赛博朋克、胶片质感视频样例
  • 告别技能循环困扰,实现智能高效的魔兽世界战斗体验
  • 零知派——ESP32‑S3 基于 ESP32-CAM 驱动 OV3660 摄像头模块开发
  • 2026中国木门十大品牌解析:行业品质与设计的标杆 - 品牌排行榜
  • Vue3 + Ant Design Vue 实战:如何优雅解决TreeSelect多选标签溢出问题?
  • 5个简单步骤:大麦抢票开源工具如何帮你告别手速焦虑
  • F1C200s/F1C100s RGB LCD驱动适配避坑指南:从设备树修改到源码调试
  • Pixel Epic实战案例:用AgentCPM-Report 3步生成逻辑严密深度研报
  • PyInstaller打包踩坑实录:当你的Python项目里有SQLite数据库和外部配置文件时,如何避免‘文件找不到’错误?
  • 2026深圳留学中介哪家好?专注美国高端本科申请与高端定制服务的机构精选 - 品牌2026
  • leetcode 1559. 二维网格图中探测环-Detect Cycles in 2D Grid
  • Qwen3-0.6B-FP8极速对话工具:Matlab科学计算集成方案
  • 2026临沂GEO优化怎么选?深度测评,破解企业获客痛点