当前位置: 首页 > news >正文

AI Agents 开源 LLM 简报 (2026年5月5日)

AI Agents & 开源 LLM 简报-202605.png

🔥 1. Anthropic 发布 Claude 4 Opus:内置 Agent 模式,刷新 SWE-bench 纪录 — 512 pts
Anthropic 于 5 月 5 日推出 Claude 4 Opus,深度集成 Agent 工作流——可直接调用工具、编写执行代码、自主浏览网页并自我纠错。同步开源低配版本 Claude 4 Haiku 供社区微调,在 SWE-bench 和 GAIA 上刷新多项纪录。
→ https://www.theverge.com/2026/5/5/24256678/anthropic-claude-4-opus-launch

🔥 2. Meta 开源 Llama 4 Ultra (405B):迄今最大完全开源模型 — 468 pts
Meta 于 5 月 3 日开源 Llama 4 Ultra,405B 参数在 MMLU-Pro 和 HumanEval 上超越 GPT-4o。同步发布配套 Agent Framework 工具包,支持低代码构建 Llama 驱动的自主 Agent。完全开源并允许商用。
→ https://venturebeat.com/2026/05/03/meta-llama-4-ultra-405b-open-source/

🔥 3. Adept AI 完成 3.5 亿美元 C 轮,英伟达微软跟投 — 386 pts
Adept AI 于 5 月 4 日宣布完成 3.5 亿美元 C 轮融资,General Catalyst 领投,英伟达、微软跟投。资金将用于扩大 Act-2 Agent 团队,该 Agent 能在浏览器、IDE 和终端中自主执行数据迁移、编写测试等复杂业务流程。
→ https://techcrunch.com/2026/05/04/adept-series-c-350-million/

🔥 4. 智谱 GLM-6-130B 开源:首推多模态 Agent 混合推理架构 — 287 pts
智谱 AI 于 5 月 3 日开源 GLM-6-130B,引入 MoMA(Mixture-of-Multimodal-Agents)架构,将视觉、代码、搜索 Agent 混合路由,可零样本执行「用图表总结论文并修改代码」等跨模态任务,国产开源 C-Eval 第一。
→ https://www.jiqizhixin.com/articles/2026-05-03-7

🔥 5. Hugging Face 发布 SmolAgent-2B:端侧 Agent 模型仅需 1.2GB 内存 — 176 pts
Hugging Face H4 团队于 5 月 4 日发布 SmolAgent-2B,参数量 2B、量化后仅需 1.2GB 内存,性能可媲美 Llama 3.2-3B。专为手机与 IoT 设备 Agent 任务设计,支持函数调用和层级规划,Apache 2.0 开源。
→ https://huggingface.co/blog/smolagent-2b

📌 今日趋势一览

趋势

热度

前沿闭源模型内置 Agent 能力 (Claude 4 Opus)

🔥🔥🔥🔥🔥

超大规模开源模型追赶闭源 (Llama 4 Ultra 405B)

🔥🔥🔥🔥🔥

Agent 基础设施融资持续高热 (Adept 再融 $350M)

🔥🔥🔥🔥

多模态 Agent 混合推理 (智谱 MoMA 架构)

🔥🔥🔥🔥

端侧小模型 Agent 化 (SmolAgent-2B)

🔥🔥🔥

开源+闭源双轨加速,Agent 成标配能力

🔥🔥🔥🔥


原文链接 https://www.yijunzhao.cn/archives/ai-agents-kai-yuan-llm-jian-bao-2026nian-5yue-5ri

欢迎访问 小易撩挨踢

http://www.jsqmd.com/news/763033/

相关文章:

  • 浙江理工大学考研辅导班机构推荐:排行榜单与哪家好评测 - michalwang
  • 重庆交通大学考研辅导班机构推荐:排行榜单与哪家好评测 - michalwang
  • 别再让Chocolatey拖慢你的Node.js安装!Windows 11纯净安装与包管理分离指南
  • 企业级消息中台架构设计:基于飞书分发框架的实践指南
  • 告别GNS3和eNSP!在Ubuntu 22.04上用VirtualBox 7.0搭建全能网络实验室EVE-NG保姆级教程
  • 河北经贸大学考研辅导班机构推荐:排行榜单与哪家好评测 - michalwang
  • 20分钟搭好专属测试用例Skill,效率直提8倍(附模板+可复制Prompt)
  • 2026年五家geo服务核心能力盘点及企业 GEO 落地实务 - 资讯焦点
  • 别再手动截图了!用Python+OpenCV写个论文插图自动放大工具(附完整代码)
  • 2026最新翡翠精工镶嵌加工工厂推荐!广东优质权威榜单发布,实力靠谱佛山源头厂家精选 - 十大品牌榜
  • 2026年必备:3个妙招教你高效降低AI率,通过毕业论文AI检测 - 降AI实验室
  • 保姆级教程:用SE19和HDBVIEWS给SAP FAGLL03H报表添加银行账户和项目描述字段
  • STM32驱动LD3320语音模块,除了SPI通信,这些配置细节和调试技巧你都知道吗?
  • 保姆级教程:在CentOS 7上从零部署DolphinScheduler 3.1.8(含MySQL 8.0驱动配置避坑指南)
  • 2026年山西精准获客、太原短视频代运营与晋中手机号定向推广完全指南 - 企业名录优选推荐
  • NAD+哪个牌子效果最好?哪款nad+排名第一名口碑最好?职场中年抗衰老品牌品质推荐解析 - 资讯焦点
  • 2026年六家GEO服务供应商实测测评及企业选型对策 - 资讯焦点
  • 接码平台分享推荐,每个都是长期稳定运行
  • 在个人项目中体验 Taotoken 多模型聚合带来的灵活性与稳定性
  • 天猫超市购物卡变现攻略,简单又快速! - 团团收购物卡回收
  • 别再死记硬背OPC协议了!用Python+OpenOPC快速上手工业数据采集(附实战代码)
  • 终极x86硬件调优指南:解锁你的Intel/AMD设备全部性能潜力
  • 保姆级教程:手把手教你调优GC2093摄像头的自动曝光(基于RK3568开发板)
  • 金蝶云苍穹中级认证备考:这20个高频易错题,你踩过几个坑?
  • 2025-2026年香榭莱茵电话查询:核实资质与理性选择服务指南 - 品牌推荐
  • 2026年五大生成引擎优化公司排名能力解码及企业选型避坑准则 - 资讯焦点
  • 辽宁工程技术大学考研辅导班机构推荐:排行榜单与哪家好评测 - michalwang
  • Windows触控板三指拖拽终极指南:告别繁琐操作,提升效率300%
  • 2025-2026年优优推电话查询:使用前需核实服务范围与风险提示 - 品牌推荐
  • 2026年水性油墨树脂推荐厂商排名,佛山红树上榜 - mypinpai