当前位置: 首页 > news >正文

上线AI却怕被投毒、泄密?掌握这三大支柱,打造坚不可摧的AI架构

有智无诚,不过是复杂的风险。要打造持久的AI,就必须将零信任原则应用于数据管道,并将模型端点视为敏感的API来对待。

当我刚开始大规模部署AI系统时,我犯了大多数技术领导者都会犯的错误:我把安全和数据架构问题当作在智能层构建完成后才需要解决的问题。我们进展迅速,推出模型,庆祝早期取得的胜利,然而,六个月后,我们发现其中一条机器学习管道无意中将敏感的客户数据泄露给了本无权访问这些数据的下游系统。虽然没有发生数据泄露事件,也没有登上新闻头条,但这一事件给我们敲响了警钟,彻底改变了我对AI架构的看法。

事实上,大多数企业构建AI的方式都是错误的。他们在模型性能、基础设施和计算能力上投入大量资金,却将数据治理和安全视为事后才需考虑的问题。根据我在各行业的工作经验,这种方法创建的系统虽然在技术上令人印象深刻,但本质上却很脆弱。有智无诚,不过是复杂的风险。

本文概述了我所开发的框架,即我现在所说的“安全智能框架”,以及任何技术领导者如何应用该框架来构建既强大又可靠的AI系统。

为何安全必须融入设计,而非事后添加

在部署AI时,想要快速推进的想法是可以理解的。业务压力真实存在,AI项目往往始于概念验证,在有人认真考虑安全问题之前,就悄然发展成了生产系统。

但这种顺序是危险的,根据《IBM 2024年数据泄露成本报告》,全球数据泄露的平均成本已达488万美元,且未在安全运营中嵌入AI和自动化的企业所需支付的成本显著更高。架构不佳的AI系统会扩大组织的攻击面,通过模型API、训练数据管道和推理端点等传统安全框架从未设计用来应对的环节,产生新的漏洞。

更深层次的问题在于文化层面,当安全被视为部署时的检查清单,而非设计原则时,团队在截止日期的压力下就不可避免地会走捷径。我见过一些组织在没有访问日志、没有输出监控、没有回滚计划的情况下就推出了生产AI系统,因为这些对话发生在构建之后,而非构建之前。到那时,架构已经确定,事后添加安全措施不仅成本高昂、具有破坏性,而且往往还不完整。

当我重新设计我们的AI架构时,我从一个单一原则出发:系统的每一层都必须假定其他每一层都可能受到损害。这是将零信任思维应用于AI,它彻底改变了你设计数据流、访问控制和模型治理的方式。美国国家标准与技术研究院(NIST)的AI风险管理框架为此提供了坚实的基础——这是我在与任何开始认真部署AI的团队分享的首批文件之一。

安全AI系统的三层架构

安全智能框架建立在三个相互依赖的层次之上,每个层次都必须独立处理,然后作为一个整体进行集成。

数据层

大多数漏洞都始于这一层,我见过一些企业将机器学习模型直接连接到生产数据库,且访问控制极少,他们认为模型本身不是用户,因此不会构成风险。这种想法是错误的,而且代价高昂。

数据管道必须强制实施最小权限访问原则,AI系统的每个组件都应仅访问其所需的具体数据,不能更多。在我曾合作过的一家企业中,仅在管道层面实施基于角色的访问控制,就将敏感数据暴露量减少了60%以上,且对模型性能没有任何影响。同样重要的是数据血缘。你必须能够在任何时候准确回答:是哪个数据训练了给定的模型,数据来自哪里,以及谁有权访问这些数据。没有数据血缘,你就无法进行审计,无法遵守规定,也无法在出现问题时进行调试。

模型层

一旦数据得到妥善治理,注意力就应转向模型本身。这里的主要风险是模型反演攻击,即对手从模型输出中提取训练数据,以及在大语言模型部署中的提示注入攻击,即恶意输入操纵模型行为。

抵御这些威胁意味着要将模型端点视为任何其他敏感的API——将身份验证、速率限制、输出过滤和对抗性测试作为部署管道中的标准做法。大语言模型应用的开放式网络应用安全项目(OWASP)十大安全风险是我找到的针对模型层风险最实用的参考资料之一——它列出了让AI安全团队夜不能寐的确切攻击模式。当我们在内部知识管理中部署自然语言处理(NLP)系统时,我们添加了一个输出审查层,在将结果返回给用户之前扫描响应中的个人身份信息。这增加了40毫秒的延迟,但每一毫秒都值得。

治理层

这一层最常被忽视,因为它感觉更像是行政工作,而非架构设计。实际上,治理是长期将其他两层凝聚在一起的关键。

治理意味着对生产中的每个模型都有明确的归属,包括谁构建了它、谁维护它以及谁对其输出负责,它意味着模型版本控制和回滚能力,它还意味着定期对模型性能和数据访问模式进行审计。微软的“负责任的AI标准”和谷歌的“模型卡框架”都是我在工作中借鉴过的实用起点,它们都不是即插即用的解决方案,但都提供了结构化的思考方式,几乎可以适应任何组织环境。

实际中的做法

实施这一框架并不需要一次性重建所有内容,我用了三个季度的时间分阶段引入这一框架。

第一季度,我们专注于数据层——审计管道、实施访问控制和建立血缘跟踪。这项工作虽然枯燥,但却发现了三个我们之前不知道存在的数据访问问题。在两个案例中,内部团队一直在查询他们从未被授权使用的数据集,仅仅是因为没有设置限制。

第二季度,我们着手处理模型层——加固端点、引入输出过滤并将对抗性测试嵌入到我们的持续集成/持续部署(CI/CD)管道中。团队形成了安全第一的思维模式,使得这些改变感觉自然而非强加。

第三季度,我们正式确立了治理体系,指定模型所有者、建立审查周期并将模型审计纳入现有的IT流程。到年底,我们拥有了一个让安全团队、法律团队和业务利益相关者都能信任的系统。以前需要数周才能批准的新AI项目,现在只需几天就能确定范围并获得批准,因为基础问题已经在架构层面得到了解答。

信任是设计出来的,而非假设的

安全与智能并非相互对立,而是相辅相成。使AI系统安全的规范,也使其更可靠、更可审计,并且更容易向需要信任它的利益相关者解释。

AI不是一个技术问题,而是一个信任问题。

如果你在没有结构化方法处理数据治理和安全的情况下构建AI系统,那么你并没有比竞争对手更快。你只是在积累技术债务,其成本将远远超过你曾经获得的速度。未来十年在AI领域领先的企业将不会是那些部署最多模型的企业,而会是那些部署人们可以信任的模型的企业。

从数据入手,保护模型,治理一切,其余的就是执行。

学习资源推荐

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!​

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示

​因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

http://www.jsqmd.com/news/657335/

相关文章:

  • 重构设计到动画的工程化路径:AEUX如何实现300%的跨平台转换效率革新
  • 使用vscode查看c语言工程代码
  • BotCash:Nvidia企业级Agent生态,智能体平台战争的新变量
  • 为什么渠道管理混乱,终端管控难,窜货问题严重?——基于实在Agent的端到端自动化治理方案
  • 搜维尔科技:光学式、IMU式、无标记式和混合式:如何选择最佳的手部追踪运动捕捉系统
  • 不想学化妆踩坑白费功夫,福州化妆培训学校的正确挑选思路分享 - 企业推荐官【官方】
  • 3分钟搞定视频画中画:Chrome扩展让你边看视频边工作
  • ceph系统层次结构
  • 别再手动拼ModbusRTU报文了!用C#封装一个通用读取类(支持01/02/03/04功能码)
  • B站字幕下载终极指南:如何一键获取并转换CC字幕
  • 微信小程序蓝牙开发全流程:从授权到数据交互
  • 云南高端家政品牌E嫂家政,六年培训近万女性,用专业重塑家庭服务 - 企业推荐官【官方】
  • 5分钟快速上手:暗黑破坏神2存档编辑器d2s-editor终极指南
  • 2026年玻璃钢除臭箱厂家推荐:污水除臭箱/物理处理厂除臭设备/除臭生物箱专业供应 - 品牌推荐官
  • 录音软件哪个最好用?实测口碑精选附实用选择建议
  • 如何使用Jmeter编写脚本压测?
  • PCB设计避坑指南:信号上升时间与阻抗匹配的黄金6倍法则
  • PCB布局核心逻辑与功能分区
  • 练习5
  • 高速数字孪生管控平台,视频孪生 + 人员无感定位全域覆盖
  • Windows平台Qt5.12.12安卓开发环境避坑指南:从零到一的完整配置
  • PEG-PLLA-Mal-Fe₃O₄ NPs,聚乙二醇-聚L-乳酸-马来酰亚胺修饰四氧化三铁纳米颗粒,定义与特点
  • AIGlasses_for_navigation跨平台适配:Windows/Linux/macOS本地化部署方案
  • 朱雀AI检测率高怎么降?推荐嘎嘎降AI一次搞定
  • Easyfish钓鱼平台 实现企业级规模化的钓鱼演练|攻防演练
  • 从α到ω:搞定Markdown数学公式,你得先跨过希腊字母这道坎
  • 海安装修公司选哪家?千万认准源头厂家!这些坑必须避开! - 企业推荐官【官方】
  • 如何用Python轻松下载加密m3u8视频:解密、多线程、批量处理全攻略
  • 西格电力零碳园区管理系统:园区碳中和的“智慧大脑”
  • Redis密码在springboot中自定义加解密实践