55-260507 AI 科技日报 (DeepSeek-V4开源,四月迎来国产AI模型开源潮)
55-260507 AI 科技日报 (DeepSeek-V4开源,四月迎来国产AI模型开源潮)
AI模型
- Zyphra发布ZAYA1:小参数MoE模型表现惊艳— Zyphra发布1B参数的ZAYA1 MoE模型,在Q8量化下MLX实现约17 tps的推理速度,生成质量不错。 🔗
- DeepSeek-V4在复杂Agent任务中表现突出且成本低— 在涉及数百工具的复杂Agent任务压力测试中,DeepSeek-V4 Pro表现最佳且成本最低。 🔗
- GENE-26.5机器人大脑发布— 沉默一年后,首款机器人大脑GENE-26.5发布,声称向通用机器人智能迈出一步。 🔗
- 字节发布Doubao-Seed-2.0-lite全模态模型— 字节发布全模态大模型Doubao-Seed-2.0-lite,首次实现GUI理解与操作一体化,能统一理解多种模态数据。 🔗
- 字节跳动推出统一多模态模型Mamoda2.5— 字节跳动推出统一多模态模型Mamoda2.5,继续推进其在多模态领域的布局。 🔗
产品发布
- 代码库AI Agent能力更新:更省Token、能操控浏览器— 代码库AI Agent更新,更省Token、理解代码库,并新增浏览器自动化和远程控制能力。 🔗
- GPT Image 2正式在ChatGPT上线— GPT Image 2正式上线ChatGPT,支持根据提示重绘图像。 🔗
- TRAE SOLO设计工具开放注册— TRAE SOLO开放注册,不再需要邀请码。 🔗
- TokenSpeed推理引擎发布,专为高速Agent工作负载设计— LightSeek发布推理引擎TokenSpeed,专为高速Agent负载设计,具备先进的KV缓存管理和多硬件支持。 🔗
- Agentic机器人应用商店上线— Agentic机器人应用商店上线,宣称已有300+应用和上万台机器人,目标是大幅降低机器人应用开发门槛。 🔗
研究论文
- 动态MoE与稀疏激活成为训练新趋势— 大模型训练中,动态MoE和稀疏激活技术正变得普遍,整个训练内核正在经历转变。 🔗
- Gemini 4 31B投机解码测试:性能提升显著— 据测试,vLLM对Gemini 4 31B的MTP(推测解码)技术进行验证,在4个推测token下性能提升显著。 🔗
- 实时全身人体网格恢复技术— 新研究实现了从单张RGB图像实时重建全身人体网格。 🔗
- DeepMind联合EVE Online开发商探索游戏AI前沿— Google DeepMind与《EVE Online》合作,利用其复杂游戏环境测试AI代理的记忆、持续学习和长期规划能力。 🔗
- OpenAI发布用于大规模AI训练的新网络协议MRC— OpenAI发布用于大型AI训练集群的开放网络协议MRC,已在生产中部署。 🔗
工具推荐
- Lab RL发布:可验证领域的强化学习新工具— Lab RL发布,目标是让强化学习在各类可验证领域直接有效,降低训练AI代理的门槛。 🔗
- AI编码今年最大进展:/goal命令— AI编码工具引入/goal命令,让agent能理解项目目标,提升开发效率。 🔗
- 开源AI新闻雷达系统Horizon上线— 开源AI新闻系统Horizon,能多源抓取新闻、AI评分并生成简报,节省信息筛选时间。 🔗
- YC总裁发布Claude Code全栈插件gstack— gstack插件将Claude Code变成全栈工程团队,覆盖开发全流程。 🔗
- 新课程:构建生成交互式UI的AI代理— 新课程教开发者构建能生成图表、表单等交互式UI的AI代理,超越纯文本输出。 🔗
行业动态
- 四月AI模型总结:DeepSeek-V4开源与Agent生态爆发— 国内头部AI厂商旗舰模型已全部开源,Hermus成为新的Agent主流框架,GPT-Image2定义视觉生成新标准。 🔗
- Anthropic获SpaceX超算访问权,合作规模达60亿美元— Anthropic将获得SpaceX AI的Colossus 1超算访问权,该笔30兆瓦算力租赁交易估值约60亿美元/年。 🔗
- 月之暗面Kimi完成新一轮融资— 月之暗面Kimi完成新一轮约20亿美元融资,为AGI研发和市场竞争储备资金。 🔗
- DeepSeek获大基金领投估值近450亿— DeepSeek获大基金领投,估值接近450亿,显示国家级资本对AI大模型公司的支持。 🔗
- 无问芯穹再获超7亿元融资— 无问芯穹再获超7亿元融资,资金将用于AI算力优化与调度技术的研发及产品落地。 🔗
关注我,每天获取AI最新资讯。
