当前位置: 首页 > news >正文

深入解析 Strands Agents + Exa 集成:构建能联网搜索的 AI 深度研究助手

概述

亚马逊云科技开源的 Strands Agents SDK 近日发布了与 Exa 搜索引擎的集成。这篇文章详细拆解这个集成的架构设计、代码实现和实际效果。

Strands Agents SDK 简介

Strands Agents 是一个模型驱动的 Agent 框架。核心理念:开发者提供模型、system prompt 和工具列表,模型在 agent loop 中自主决定工具调用顺序和时机。

每次迭代中,模型接收完整对话历史(包括之前所有工具调用及其结果)。如果需要更多信息就请求工具,Strands 执行后把结果反馈给模型。循环持续到模型产出最终答案。

框架自带 40+ 预构建工具,支持 Model Context Protocol (MCP)。

Exa 搜索引擎

Exa 是专为 LLM 设计的搜索引擎:

  • 语义匹配而非关键词匹配
  • 返回结构化文本而非 HTML
  • 支持分类过滤(news/research paper/github/company 等)
  • 提供多种搜索模式:instant (~200ms) / fast (~450ms) / auto (~1s) / deep (~3-6s)

集成架构

两个核心工具:

语义搜索,支持:

  • 4 种搜索模式(instant/fast/auto/deep)
  • 分类过滤(news/research paper/github/PDF 等)
  • 域名/日期/文本内容过滤
  • 行内摘要和 JSON Schema 结构化输出

exa_get_contents

URL 全文提取,支持:

  • 缓存优先,未命中则实时爬取
  • 可配置 livecrawl 模式(fallback/always)
  • 字符数限制控制 token 消耗
  • 子页面追踪

完整实现:6 步深度研究助手

from strands import Agent
from strands.models.bedrock import BedrockModel
from strands_tools.exa import exa_search, exa_get_contentsdef create_research_agent() -> Agent:model = BedrockModel(model_id="us.anthropic.claude-sonnet-4-6",region_name="us-west-2",max_tokens=20000,)return Agent(model=model,system_prompt=load_system_prompt(),tools=[exa_search, exa_get_contents],)

System prompt 定义 6 步工作流:

Step 1 — 概览搜索:auto 模式,5 条结果,2000 字摘要,限最近一周。

Step 2 — 新闻搜索:news 分类,30 天窗口,24 小时缓存。

Step 3 — 学术论文:research paper 分类,JSON Schema 约束输出(title/findings/methodology/conclusions)。

Step 4 — GitHub 项目:github 分类,4000 字 highlights。

Step 5 — 深度阅读:选 2-3 个高价值 URL,exa_get_contents 抓全文,强制实时爬取,追踪参考文献和方法论子页面。

Step 6 — 综合报告:无工具调用,整合前 5 步输出结构化研究简报。

多步工作流的优势

  • 有据可查:每个结论追溯到源 URL
  • Token 高效:搜索时就做摘要,LLM 处理的是精炼知识
  • 自主深入:跨源类型迭代,不需要人工干预

可观测性

集成 Amazon Bedrock AgentCore Observability(基于 OpenTelemetry):

  • 每次工具调用和 LLM 推理生成 span
  • 父子关系可视化完整调用链
  • CloudWatch GenAI Observability Dashboard 展示平均 span 延迟
  • 支持检查每步的搜索参数、延迟和 token 消耗

Agent 行为非确定性,tracing 把调试从猜测变成检查。

实践建议

  1. 默认用 auto 搜索模式,deep 仅用于需要全面覆盖的研究任务
  2. 用 maxCharacters 控制 highlights,管理 token 预算
  3. 分类过滤在源类型明确时效果好
  4. JSON Schema 摘要适合需要结构化数据的场景

参考资料

  • Building web search-enabled agents with Strands and Exa
  • Strands Agents SDK
  • Exa 文档
  • 示例代码
  • Amazon Bedrock AgentCore 文档
http://www.jsqmd.com/news/818542/

相关文章:

  • 6款降维普AI软件实测数据:哪款几分钟把AI率从90%降到5%?
  • 从质谱数据到生物学洞察:MZmine3如何重新定义代谢组学分析效率
  • 十七岁的雨季
  • C++默认成员函数
  • 5 分钟判断:你更需要 TTS 还是 STT?
  • 别光看Nordic了!用Zephyr OS的蓝牙协议栈,在国产MCU上也能玩转BLE
  • 2025-2026年北京办公室装饰装修公司推荐:五家排行评测专注科技企业办公区防工期延误 - 品牌推荐
  • 创业团队如何利用多模型聚合平台优化AI应用开发成本
  • 2026年5月节能模压桥架选型攻略:聚焦可靠供应商与核心优势 - 2026年企业推荐榜
  • 2026现阶段浙江马克笔厂商甄选指南:以温州中锐为例剖析核心竞争力 - 2026年企业推荐榜
  • 告别城通网盘限速:三步获取高速直连地址的终极方案
  • 为什么你的Turbo模式响应延迟仍超8秒?揭秘Midjourney官方未公开的4层排队机制与实时带宽抢占策略
  • 2026南充靠谱装修公司盘点:南充整装装修、南充新房装修、南充旧房改造、南充本地装修公司、南充环保装修、南充硬装装修选择指南 - 优质品牌商家
  • 本地知识库liz:基于RAG的智能文档检索工具部署与调优指南
  • 2026年5月深圳除甲醛公司推荐:五家品牌评测对比办公室除醛防眼干 - 品牌推荐
  • 性能测试从入门到精通:这3个工具+5个技巧,让你快速上手
  • 同花顺问财数据获取终极指南:Python量化分析的高效解决方案
  • Vue项目打包上线前,别忘了用terser-webpack-plugin清理console和注释(Webpack 4/5配置详解)
  • 2026福州VR交互式展示避坑实测:TOP4权威认证选择指南
  • 2026年5月国际十大物流公司排行榜推荐:十家专业评测夜班跨境货物追踪不丢件 - 品牌推荐
  • 2025-2026年国内空气净化器品牌推荐:五款排名产品专业评测解决儿童房装修致甲醛刺鼻 - 品牌推荐
  • 2026年长途整车专线物流公司排行及品牌甄选指南:跨省汽车托运公司电话/跨省零担专线物流公司价格/长途汽车托运公司多少钱/选择指南 - 优质品牌商家
  • Vue项目性能优化的全流程指南
  • 2026年5月提干辅导培训机构前十名推荐:十大排名产品评测夜间备考防效率低下 - 品牌推荐
  • 安全测试的核心技能:掌握这4个方法,成为测试领域的稀缺人才
  • d2dx:让经典《暗黑破坏神2》在现代PC上重获新生的魔法引擎
  • 2026游乐场无动力游乐设备厂家推荐:四川无动力游乐设备厂家、室内无动力游乐设备、室外无动力游乐设备、小型无动力游乐设备选择指南 - 优质品牌商家
  • 2026年5月新消息:哈尔滨企业短视频服务团队口碑*,翰诺科技为何持续领跑? - 2026年企业推荐榜
  • 10分钟精通APK安装器:Windows系统无缝运行安卓应用的完整指南
  • 2026年5月北京办公室装饰装修公司推荐:五家专业评测专注科技总部场景防工期延误 - 品牌推荐