智能体AI前景光明但挑战重重,企业级系统构建要素有哪些?
智能体AI:现状与挑战
在多智能体企业系统中,哪些技术、设计、标准、开发方法和安全实践正蓬勃发展?为此咨询了专家。智能体AI已成为软件行业新宠,其自主性不断增强,有望提升企业效率。Shopify应用机器学习主管Andrew McNamara称,智能体是能代表用户行动的AI系统,以Shopify的Sidekick为例,智能体系统会持续运行直至任务完成。
目前,智能体AI开发已涵盖多个业务领域。大型语言模型(LLM)提供商Anthropic指出,AI智能体最常用于软件工程领域,约占使用案例一半,其次是后台办公自动化、营销、销售、金融和数据分析。ServiceNow的AI平台对外产品管理集团副总裁Heath Ramsey举例,如IT事件解决,AI智能体可跨系统获取数据、实施修复等。
但是,以智能体为中心的开发需要全新系统思维,避免不确定性和令牌膨胀等陷阱,基于LLM的安全漏洞也亟待解决,如智能体失调。智能体架构设计需要全新方案,AIRRIVED首席执行官Anurag Gurtu表示,构建智能体系统需为自主性设计架构,智能体需要运行时、大脑、执行能力、记忆和约束机制。
尽管智能体AI前景光明,但投资回报率难以捉摸。据Alteryx称,不到一半组织表示智能体AI实验有可衡量影响,不到三分之一组织信任AI做准确决策。那么,成功的企业级智能体系统背后要素有哪些呢?不妨探索智能体系统共同特征,为开发者和架构师提供指导。
智能体系统的架构组件
智能体系统由关键构建模块组成,形成软件架构网络。Akamai云布道师Ari Weil说,构建AI智能体像构建神经系统,涵盖推理、记忆等约束层。ServiceNow的Ramsey补充,智能体系统依赖AI、工作流自动化和企业控制协同作用。
推理模型
将智能体系统分解为基础组件,需从底层模型开始。Jentic企业架构主管Frank Kilcommins表示,推理模型是核心,它根据用户提示等进行规划。不同推理模型各有优劣,Shopify的McNamara称,要寻找有智能体特性、能适当调用工具、遵循指令的模型。
上下文和数据
智能体需要上下文,包括公司内部数据等,有助于观察和调试其行为。Sonar的Edgar Kussberg指出数据来源多样,企业正构建知识库,支持语义检索模式也不断涌现。亚马逊的Anusha Kovi表示,多数团队会将向量存储与结构化数据结合使用。
工具和发现
为让智能体行动,需对数据库等有读写访问权限。金融服务公司Block的数据和AI主管Jackie Brosamer表示,增强智能体功能体现在连接AI与现有系统方式上。行业围绕模型上下文协议(MCP)形成统一标准,MCP注册表应运而生,还有许多MCP使用公开案例。
定义工作流
为常见流程制定清晰工作流文档很有用。ServiceNow的Ramsey表示,关键是通过定义好的工作流协调智能体,避免混乱。Jentic的Kilcommins提到可用“清晰的、机器可读的功能定义”,并以Arazzo规范为例。
多智能体编排
智能体需相互集成,融入反馈循环。AIRRIVED的Gurtu表示,大规模应用中多智能体系统通常必要,一般由专业智能体团队组成。这需要连接机制,亚马逊的Kovi说核心是编排层,常见编排组件有多种,开放标准和协议对智能体协作也很重要。
安全和授权
鉴于LLM易产生幻觉,安全是构建智能体系统重要因素。Gurtu表示保障的是会行动的软件,决策可能导致控制失败。Kilkommins建议明确权限,避免权限升级和数据泄露,需采用细致安全方法。Kovi补充,智能体运行时决定查询内容和调用工具,即时授权很重要,约束机制应体现在政策和配置中。
人工检查点
即使有认证和授权机制,敏感操作仍需人工审批。Shopify默认“设计中融入人工干预”,设置审批关卡,防止对生产系统自主更改,商家可审核AI内容。其他公司在金融交易方面也有类似做法,Block的Brosamer提到,涉及生产系统操作需人工检查点,用户确认是Cash App内智能体Moneybot关键要素。
评估能力
构建智能体系统需大量前期测试,评估结果是否符合预期。例如,Shopify部署前会严格评估智能体输出,采用人工测试和评判器进行用户模拟。McNamara表示,评判器评估结果与人类评估者可靠匹配后,可大规模信任。其他专家也认为评估对企业级智能体系统至关重要。
行为可观测性
可观测性是智能体系统核心层面,需超越传统监控,捕捉更高级信号。Sonar的Kussberg表示,可观测性要从一开始构建,对执行每一步都要有透明度,通过观察智能体行为可持续改进系统。
上下文优化策略
几乎所有专家认为,为AI智能体提供少量相关数据远胜数据过载,这对避免上下文窗口上限和降低输出质量至关重要。Brosamer表示,精心策划的数据管理比数据量重要,智能体输出质量取决于上下文质量。在Block,工程师维护README文件等帮助智能体获取信息。Sonar的Kussberg补充,智能体系统需要在正确时间获取正确数据,采用渐进式信息披露。Shopify采用模块化指令交付方式,McNamara称即时上下文交付是关键。Kovi指出,上下文应包括语义细微差别。
架构最佳实践
关于智能体系统开发有许多建议。首先,并非所有内容都需智能化,Kilkommins建议区分自适应和确定性行为,将后者编码,可提高稳定性。
确定智能体流程应用领域需找到可复用用例。Ramsey表示,成功部署智能体AI的组织先确定高摩擦流程,如员工服务请求等。Gurtu补充,智能体有明确业务目标时表现最佳。其他专家认为限制智能体自主性结果更好,Kussberg称智能体作为专家表现更好。Shopify扩展工具时设定明确边界,选择子智能体架构,McNamara建议早期避免多智能体架构,构建低级工具并教会系统转换语言。
专家还分享其他建议:采用开放基础设施,可使用适合的模型;以API为先,良好设计和定义能让企业为AI智能体做准备;保持数据同步,事件驱动架构可保持数据时效性;平衡访问与控制,保障安全需进行安全演练等;持续改进,避免智能体漂移。
智能体系统的未来
智能体AI开发进展迅速,目前系统模式正逐渐形成。专家预计将转向多智能体系统开发,推动对复杂编排模式需求,依赖开放标准。一些人预测知识工作将变革,Block的Brosamer预计到2026年将看到构建智能体“工厂”的框架实验,最具挑战性的是优化信息流。未来可能更注重替代云服务和边缘推理,减少延迟。Akamai的Weil表示,未来AI需要贴近应用,智能体要在现实世界行动。
总之,构建智能体系统复杂,相关实践在不断成熟。要实现大规模、可持续发展,需结合新技术、设计思维和安全约束机制,赋予智能体自主性。未来充满可能性,但智能设计决定项目成败。
关键词
生成式AI、人工智能、软件开发、开发方法
