当前位置: 首页 > news >正文

55-260507 AI 科技日报 (DeepSeek-V4开源,四月迎来国产AI模型开源潮)

55-260507 AI 科技日报 (DeepSeek-V4开源,四月迎来国产AI模型开源潮)

AI模型

  1. Zyphra发布ZAYA1:小参数MoE模型表现惊艳— Zyphra发布1B参数的ZAYA1 MoE模型,在Q8量化下MLX实现约17 tps的推理速度,生成质量不错。 🔗
  2. DeepSeek-V4在复杂Agent任务中表现突出且成本低— 在涉及数百工具的复杂Agent任务压力测试中,DeepSeek-V4 Pro表现最佳且成本最低。 🔗
  3. GENE-26.5机器人大脑发布— 沉默一年后,首款机器人大脑GENE-26.5发布,声称向通用机器人智能迈出一步。 🔗
  4. 字节发布Doubao-Seed-2.0-lite全模态模型— 字节发布全模态大模型Doubao-Seed-2.0-lite,首次实现GUI理解与操作一体化,能统一理解多种模态数据。 🔗
  5. 字节跳动推出统一多模态模型Mamoda2.5— 字节跳动推出统一多模态模型Mamoda2.5,继续推进其在多模态领域的布局。 🔗

产品发布

  1. 代码库AI Agent能力更新:更省Token、能操控浏览器— 代码库AI Agent更新,更省Token、理解代码库,并新增浏览器自动化和远程控制能力。 🔗
  2. GPT Image 2正式在ChatGPT上线— GPT Image 2正式上线ChatGPT,支持根据提示重绘图像。 🔗
  3. TRAE SOLO设计工具开放注册— TRAE SOLO开放注册,不再需要邀请码。 🔗
  4. TokenSpeed推理引擎发布,专为高速Agent工作负载设计— LightSeek发布推理引擎TokenSpeed,专为高速Agent负载设计,具备先进的KV缓存管理和多硬件支持。 🔗
  5. Agentic机器人应用商店上线— Agentic机器人应用商店上线,宣称已有300+应用和上万台机器人,目标是大幅降低机器人应用开发门槛。 🔗

研究论文

  1. 动态MoE与稀疏激活成为训练新趋势— 大模型训练中,动态MoE和稀疏激活技术正变得普遍,整个训练内核正在经历转变。 🔗
  2. Gemini 4 31B投机解码测试:性能提升显著— 据测试,vLLM对Gemini 4 31B的MTP(推测解码)技术进行验证,在4个推测token下性能提升显著。 🔗
  3. 实时全身人体网格恢复技术— 新研究实现了从单张RGB图像实时重建全身人体网格。 🔗
  4. DeepMind联合EVE Online开发商探索游戏AI前沿— Google DeepMind与《EVE Online》合作,利用其复杂游戏环境测试AI代理的记忆、持续学习和长期规划能力。 🔗
  5. OpenAI发布用于大规模AI训练的新网络协议MRC— OpenAI发布用于大型AI训练集群的开放网络协议MRC,已在生产中部署。 🔗

工具推荐

  1. Lab RL发布:可验证领域的强化学习新工具— Lab RL发布,目标是让强化学习在各类可验证领域直接有效,降低训练AI代理的门槛。 🔗
  2. AI编码今年最大进展:/goal命令— AI编码工具引入/goal命令,让agent能理解项目目标,提升开发效率。 🔗
  3. 开源AI新闻雷达系统Horizon上线— 开源AI新闻系统Horizon,能多源抓取新闻、AI评分并生成简报,节省信息筛选时间。 🔗
  4. YC总裁发布Claude Code全栈插件gstack— gstack插件将Claude Code变成全栈工程团队,覆盖开发全流程。 🔗
  5. 新课程:构建生成交互式UI的AI代理— 新课程教开发者构建能生成图表、表单等交互式UI的AI代理,超越纯文本输出。 🔗

行业动态

  1. 四月AI模型总结:DeepSeek-V4开源与Agent生态爆发— 国内头部AI厂商旗舰模型已全部开源,Hermus成为新的Agent主流框架,GPT-Image2定义视觉生成新标准。 🔗
  2. Anthropic获SpaceX超算访问权,合作规模达60亿美元— Anthropic将获得SpaceX AI的Colossus 1超算访问权,该笔30兆瓦算力租赁交易估值约60亿美元/年。 🔗
  3. 月之暗面Kimi完成新一轮融资— 月之暗面Kimi完成新一轮约20亿美元融资,为AGI研发和市场竞争储备资金。 🔗
  4. DeepSeek获大基金领投估值近450亿— DeepSeek获大基金领投,估值接近450亿,显示国家级资本对AI大模型公司的支持。 🔗
  5. 无问芯穹再获超7亿元融资— 无问芯穹再获超7亿元融资,资金将用于AI算力优化与调度技术的研发及产品落地。 🔗

关注我,每天获取AI最新资讯。

http://www.jsqmd.com/news/773568/

相关文章:

  • 手写一个并查集:从原理到最小生成树实战
  • 代码变现双擎:独立开发者的 Gumroad 与 CodeCanyon 掘金指南
  • 直面维普算法升级:实测4款降AI优化工具,用它论文稳妥过稿
  • 通过 OpenClaw 配置 Taotoken 实现自动化 AI 任务处理
  • 5分钟掌握Illustrator脚本自动化:设计师效率提升终极指南
  • OpenRGB:一站式解决多品牌RGB灯光同步难题的终极方案
  • 个人开源项目冷启动:从Hegelion看状态管理库的架构与社区运营
  • 为现有基于 OpenAI SDK 的项目迁移至 Taotoken 端点
  • VideoDownloadHelper:5分钟快速搞定网页视频下载的终极解决方案
  • Android手机变无线触控板:局域网远程控制电脑演示与操作
  • 3篇3章3节:Obsidian 的 Markdown 语法讲解和举例
  • 图片换背景在线制作怎么操作?一文教你3步快速搞定
  • 如何用25美元打造你自己的AI智能眼镜:开源硬件终极指南
  • 3个维度重构:开源智能水印工具的元数据叙事哲学
  • 【流程】Ubuntu24配置流程
  • Snap.Hutao:重新定义你的原神数据分析体验
  • 3分钟搞定Figma中文界面:设计师必备的母语设计体验
  • Windows本地部署dify
  • Shroud:为AI智能体打造企业级隐私保护层,安全调用LLM API
  • 开源FPGA MPEG-2视频编码器:硬件实现、架构解析与工程实践
  • 即梦去水印保存后还有水印?2026实测去水印使用方法全解析
  • WordPress Boost:AI辅助开发工具,提升WordPress项目内省与安全审计效率
  • 如何在Windows上轻松安装APK文件?告别模拟器的终极方案
  • 2026.5.8
  • 如何在网页中快速生成二维码:qrcode.js完整使用指南
  • 构建AI自进化系统:从自动化到自主演化的工程实践
  • 从桌面到浏览器:手把手教你将MATLAB App Designer应用打包成可交互的Web页面(含Excel导入/动态日志实战)
  • DATAGEN数据生成工具:从架构解析到实战,打造高效测试数据工厂
  • 如何快速下载无水印快手视频:小白也能懂的完整教程
  • UndertaleModTool终极指南:3步解锁GameMaker游戏修改的无限可能