当前位置：首页 > news >正文

AI Agents 开源 LLM 简报 (2026年5月6日)

news 2026/7/8 17:36:32

🔥 1. Meta 开源 Llama 4 Ultra：1.2 万亿参数，全面超越 GPT-4o — 486 pts
Meta 于 5 月 5 日发布 Llama 4 Ultra，1.2 万亿参数的开源模型，在多项编程和推理基准上超越 GPT-4o。采用自定义商业许可证，是迄今能力最强的开源模型，有望大幅加速开源 AI 生态。
→ https://arstechnica.com/2026/05/05/llama-4-ultra-meta-open-source

🔥 2. OpenAI 发布 Agent Studio：无代码构建自主 AI Agent — 432 pts
OpenAI 于 5 月 5 日推出 Agent Studio，一个可视化拖拽式无代码平台，用户无需编程即可构建、测试和部署自主 AI Agent。深度集成 GPT-5 模型，标志着 Agent 开发迈向大众化。
→ https://techcrunch.com/2026/05/05/openai-agent-studio-launch

🔥 3. Cognition Labs 融资 2 亿美元，Devin 估值达 80 亿 — 378 pts
AI 编程 Agent Devin 的母公司 Cognition Labs 于 5 月 6 日完成 2 亿美元 D 轮融资，估值达 80 亿美元。Devin 已能自主修复 Bug 和实现功能，是今年 AI Agent 赛道最大融资之一。
→ https://www.wsj.com/tech/ai/cognition-labs-devin-funding-2026

🔥 4. Anthropic + Palantir 联手，Claude Agent 打入美国政府 — 312 pts
Anthropic 与 Palantir 于 5 月 4 日宣布合作，为美国政府和国防机构部署 Claude 驱动的 AI Agent，聚焦安全、数据主权的合规工作流。这是 AI Agent 进军政府与企业级市场的重要里程碑。
→ https://www.reuters.com/technology/anthropic-palantir-agent-deal-2026-05-04

🔥 5. Google DeepMind 发布 Gemini Agent 2.0：任务错误率降低 40% — 256 pts
Google DeepMind 于 5 月 4 日推出 Gemini Agent 2.0，全新多步推理与工具调用架构，任务完成错误率较前代降低 40%。预计年内集成进 Google 全线产品。
→ https://www.theverge.com/2026/5/4/gemini-agent-2-deepmind

📌 今日趋势一览

趋势	热度
万亿参数开源模型追赶闭源 (Llama 4 Ultra)	🔥🔥🔥🔥🔥
Agent 开发走向低代码/无代码 (OpenAI Agent Studio)	🔥🔥🔥🔥🔥
AI Agent 融资持续火热 (Cognition $200M / Adept $350M)	🔥🔥🔥🔥
Agent 进入政府/国防场景 (Anthropic + Palantir)	🔥🔥🔥🔥
Agent 可靠性突破 (Gemini Agent 2.0 错误率降40%)	🔥🔥🔥
国内大模型密集开源 (GLM-5 / Qwen3.0 / 文心)	🔥🔥🔥