当前位置: 首页 > news >正文

直播预告 | 约翰斯·霍普金斯大学肖超玮教授:迈向安全可靠的AI智能体

PaperWeekly × 星弧 STARC

科研觉醒

AI前沿讲座

直播主题

迈向安全可靠的 AI 智能体

直播嘉宾

肖超玮

JHU 助理教授、NVIDIA Research 研究员

直播时间

2026年3月7日(周六)

11:00-12:00

参会方式

腾讯会议/VooV ID: 442 086 886

报告介绍

Topic

迈向安全可靠的 AI 智能体

人们正在投入巨大努力使人工智能与人类价值观对齐,并确保其被负责任地使用。然而,一个根本性的问题依然存在:人工智能是否真正安全?

在本次报告中,我将介绍我们提出的“双路径原则”(Dual Pathways Principle),该原则融合模型层面与系统层面的视角,用于构建安全且可靠的智能体(AI Agent)。

我将介绍我们的 AutoDan 和 Armor 系列工作,这些工作结合安全机制与以人为中心的原则,致力于构建安全可靠的人工智能系统。

随后,我将讨论为何人工智能安全必须采用系统级的方法,并介绍我们提出的“安全内生设计”(security-by-design)框架,用于构建安全可靠的智能体。通过整合上述方法,我将勾勒出通往安全可靠人工智能智能体的发展路径。

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

·

http://www.jsqmd.com/news/437613/

相关文章:

  • ATTO390-PCL,ATTO390-聚己内酯,ATTO390-Dox,ATTO390-阿霉素
  • PDF-Extract-Kit-1.0医疗行业应用:病历报告结构化提取方案
  • 如何解决“电脑无法识别iPhone”的问题?
  • 2015-2025年政府公共安全基础设施建设采购数据库
  • H7-TOOL脱机烧录增加凌思微LE5010,ADI的ADuCM361和华润微CS32F469支持
  • YOLO26 旋转框检测 OBB 技术:角度预测与解码优化
  • 如何成为世界级的智能体工程师
  • 如何轻松地将联系人和短信从OPPO备份到计算机
  • M2LOrder服务网络安全配置指南:API访问鉴权与防滥用策略
  • 基于微信小程序的民宿预订管理系统小程序设计与实现
  • 一酌藏时光,半盏润人心
  • MyTV-Android:让老旧安卓电视重获新生的轻量级直播解决方案
  • 手把手教你玩转HY-1.8B-2Bit-GGUF:免费镜像+完整API调用示例
  • 基于微信小程序的乡镇医院挂号预约系统小程序设计与实现
  • Visio破解后频繁失效?终极解决方案来了!
  • 如何让Mac软件管理像玩手机一样简单?5个实用技巧解决你的烦恼
  • 基于微信小程序的中小学生个性化阅读平台小程序设计与实现
  • Gemma-3-270m与Git版本控制:AI项目协作开发实践
  • YOLO26 实例分割技术:Mask 分支与特征融合
  • 基于微信小程序的自习室预约小程序设计与实现
  • JQ8400语音芯片实战:5分钟搞定MP3播放器开发(附完整代码)
  • 老旧设备优化方案:让安卓电视重获新生的实用指南
  • OWL ADVENTURE辅助C语言学习:可视化代码流程图与结构识别
  • Kalibr源码解析(二): 重投影误差的统计特性与可视化分析
  • 文墨共鸣大模型实战:基于LSTM的时序文本情感分析应用
  • NCS8803:解锁商显新可能,HDMI转EDP低功耗转换方案深度解析
  • YOLO26 姿态估计技术:关键点检测 pipeline 解析
  • 不用电感的电压反转:用Arduino+MOSFET搭建电荷泵实验台
  • zteOnu:让ZTE光猫管理不再复杂的命令行工具
  • Gemma3大模型远程访问指南:用cpolar实现24小时在线的AI工作站(含固定域名技巧)