当前位置: 首页 > news >正文

拒绝蒸馏微软发布自研 MAI-Thinking-1 追平 Claude Opus 4.6完全从零训练不沾任何第三方模型输出

“我们现在已经基本追平了几个月前的最先进水平。”在 Build 大会前夕,微软 AI 执行副总裁兼 CEO Mustafa Suleyman 在采访中表示。
昨日,微软在 Build 大会上发布了一系列自研的 AI 模型。这标志着微软在模型研发上的一次重要推进,去年该公司才推出了首批自研模型,在此之前微软还主要依赖 OpenAI 的模型。甚至有一些观察人士,将本次大会称为微软的“AI 独立日”。
同时,Suleyman 也登台说明了公司在 AI 发展上的思考。他强调,微软的 AI 工作始终致力于支持人类员工和用户,而非取代他们,微软希望打造的是一种被称为“人本主义超级智能(humanist superintelligence)”的体系。
整体来看,这次 Build 大会的核心信号非常明确:微软正在从“AI 应用整合者”,转向“全栈 AI 基础设施与模型提供者”。
完全从零开始训练,微软推出首个高级推理模型
微软新模型家族的核心是 MAI-Thinking-1,这是微软首个高级推理模型。
据介绍,MAI-Thinking-1 是一款“中等规模模型”,拥有 350 亿活跃参数和 128K 上下文窗口,总参数规模约 1 万亿,在效率与性能之间取得平衡,同时强调低 token 成本。微软开发者市场负责人兼 GitHub 首席运营官 Kyle Daigle 在主题演讲前的媒体沟通会上表示,“MAI-Thinking-1 的设计目标,是擅长处理复杂的多步骤指令、www.ntjrcw.com长上下文推理以及代码生成。”
在过去一年中,推理模型这一类别主要由 OpenAI 的 o 系列、Google 的 Gemini 推理版本,以及 Anthropic 的 Claude 扩展思考模式所主导,另有开源权重阵营的 DeepSeek R1 在 2025 年初一度撼动了这一格局。
MAI-Thinking-1 是微软在这一赛道的新入局产品。在关键的软件工程基准测试中,它可以对标行业领先模型;在 SWE Bench Pro 编程基准上,其表现与 Claude Opus 4.6 持平。同时,该模型展现出先进的数学推理能力;MAI-Thinking-1 在 AIME 2025 中达到 97.0%,在 AIME 2026 中达到 94.5%。在微软进行的盲测人工对比评估中,用户对它的偏好甚至超过了 Anthropic 的 Claude Sonnet 4.6。
目前,微软尚未披露具体的训练方法,例如是否采用了“可验证奖励强化学习”(类似 OpenAI o1 的技术路径)、过程奖励建模或其他方案。但他们明确了一点“否定信息”:模型的训练数据中不包含任何其他已训练 AI 系统的概率分布或输出序列。
微软强调,MAI-Thinking-1 完全从零开始训练,使用的是企业级、干净且具备合规商业授权的数据,并且在预训练阶段排除了 AI 生成内容,也没有使用来自第三方模型的蒸馏数据,这迫使“模型真正学会任务本身”。
而这一“独立训练”的主张,或成为 MAI-Thinking-1 面向企业客户的差异化卖点。对于那些需要“干净知识产权来源”的企业来说,这一点甚至比模型能力本身更关键。对初创公司或非监管场景的开发者而言,这种差异可能显得抽象。但对部署在医疗、金融、国防或任何需要合规采购与数据治理的场景中的 AI 来说,这很可能会变成采购流程中的一个“必选勾选项”。
MAI 模型家族:一个多模态生态系统
微软还发布了另外六款 MAI 系列模型,覆盖图像生成、语音转写、语音合成和编程等方向。
其中,MAI-Code-1-Flash 是一款推理效率极高的智能体编程模型,专为并深度集成于 GitHub Copilot、Visual Studio Code 以及微软整体技术栈而打造。其参数规模为 50 亿(5B),性能可对标 Haiku,但成本更低。
MAI-Image-2.5(包括其超高效的 Flash 版本)同时支持世界级的文生图与图像编辑能力,其 Arena 评分已超过 Nano Banana Pro。MAI Transcribe-1.5 是当前全球最强的语音转录模型之一,达到 SOTA(最先进水平)准确率。它的速度是同类模型的 5 倍,并内置支持 43 种语言的领域专有术语。MAI-Voice-2 提供覆盖 15 种语言的高质量、自然语音生成能力,并支持通过短语音样本进行声音适配,www.iissbbs.com同时具备完善的滥用防护机制。其更高性价比版本 MAI-Voice-2-Flash 也即将推出。
未来,这些模型都将统一接入 Foundry 以及一个新的专用环境 MAI Playground。除了在 Azure AI Foundry 上分发并针对微软一方产品(1P)优化之外,这些模型还将面向开发者广泛开放,并支持在更多平台上使用。首次,开发者将可以对模型权重进行自定义调优。
值得一提的是,所有这些模型都建立在同一个基础之上:从零开始“向上爬升”(hill-climbing),不依赖任何蒸馏方法,共享一致的数据规范、训练基础设施和评估体系。
“升级版 OpenClaw”来了:首日用就能被信任?
2026 年初,OpenClaw 席卷 AI 圈。现在,微软推出了 Scout,这是一款基于 OpenClaw 框架构建的 AI 智能体,可以全天候自主运行,在 Microsoft 365 应用之间独立完成任务。据介绍,Scout 可以连接 Teams、Outlook、OneDrive 和 SharePoint 等应用,并访问聊天、邮件、日历和联系人数据。用户可通过 Teams 调用它,它还可以与用户的浏览器交互,并通过模型上下文协议(MCP)连接外部应用。该工具可在云端、桌面端和网页端运行。
“该智能体会在后台持续运行,理解你的各类应用和系统中工作的运作方式,并在不需要每次提示的情况下主动采取行动。”微软企业副总裁 Omar Shahine 在一篇博客中表示,这类智能体会以用户的身份执行操作,并拥有受治理的 Entra 身份。作为微软资深员工,Shahine 近期还宣布将领导一个新团队,把基于 OpenClaw 的个人助手引入 Microsoft 365 应用。
Shahine 表示,Scout 可以减少办公人员面对的重复性任务,例如与同事协调和安排会议时间,或根据即将到来的工作安排自动在日历中预留时间。“它还可以发现风险,例如决策停滞,从而让你在问题演变成阻碍之前及时处理。”
值得注意的是,由于明显存在安全漏洞,OpenClaw 一度受到审查,但微软承诺 Scout 具备“企业级安全与控制能力,从第一天起就可以在组织中被信任使用”。微软还表示,将向开源 OpenClaw 项目进行上游贡献。
目前,Scout 以“实验性版本”的形式向其 Frontier 项目客户开放,并需要通过 Intune 策略配置以及“主动选择确认(opt-in attestation)”。定价方面,微软暂未公布更多细节,尚不清楚 Scout 是否会包含在 Microsoft 365 Copilot 订阅中,还是作为单独产品收费。
尽管微软大力推进 AI,其仍在努力说服企业客户相信 Microsoft 365 Copilot 的附加费用是值得的。该产品面向大型企业定价为每位用户每月 30 美元。今年 1 月,微软表示约有 3% 的 Microsoft 365 客户为该附加订阅付费,总计约 1500 万付费用户。上月,微软宣布该数字已增长至 2000 万。Scout 是微软在 Microsoft 365 中推出的一系列智能体工具中的最新一项,这些工具还包括 Agent Mode(用户可在 Word、Excel 等应用中与 Microsoft 365 Copilot 交互生成内容)以及 Copilot Cowork(微软版的 Anthropic Claude Cowork 智能体,可独立完成任务)。

http://www.jsqmd.com/news/944036/

相关文章:

  • 测试常用仪器:信号发生器使用说明(常见问题及处理方法)
  • ESXi 6.7克隆虚拟机后,磁盘扩容和LVM调整的完整避坑指南
  • PS去掉图片白色背景的5种方法,PS如何去白底变透明?
  • 星盘接口开发文档:三限比接口指南
  • 保姆级教程:在ThingsBoard里用规则链给设备温度设个“电子哨兵”
  • 如何3分钟搞定B站缓存转换:终极高效指南
  • 如何快速部署Leantime:面向新手的完整项目管理安装指南
  • 漫画迷的终极救星:告别在线焦虑,打造你的私人漫画图书馆
  • OpenVoiceV2实战指南:5分钟掌握开源语音克隆核心技术
  • ESP-07模块自制PCB适配板:从2mm引脚到标准面包板的完整开发平台设计
  • 如何快速掌握macOS光标个性化:免费神器Mousecape的终极指南
  • Jina Reader终极指南:如何免费让AI读懂整个互联网内容
  • 学术研究技能如何无缝迁移至产业界:五大维度解析与实战转化
  • DIY Arduino直流电源测量模块:从分压、运放差分放大到校准全解析
  • 全世界航司都在学廉航?航空市场这是怎么了?
  • 别再买AI采购SaaS了!真正降本增效的路径是这6种混合部署模式(含成本对比热力图与实施周期甘特图)
  • ESP32太阳能气象站:低功耗设计、云端同步与HomeKit接入全攻略
  • TVA:具身视觉智能的范式跃迁内涵(11)
  • PS 字体怎么加粗?4 种官方加粗方法全覆盖
  • 电子积木:连接虚拟仿真与物理实作的课堂电子教学方案
  • 工业制造供应链三大真实落地瓶颈:从实操痛点看AI落地思路
  • 深入Linux内核:拆解vDPA框架如何统一硬件与virtio/vhost生态
  • B站缓存视频转换终极指南:m4s转MP4一键搞定
  • 2026惠州黄金回收商家推荐:惠奢汇惠城旗舰店(中检认证)+ 3家口碑门店避坑指南 - 生活测评小能手
  • 自制电子纺织品万用表探针:实现织物电路无损测试与实时监测
  • 终极Windows任务栏美化指南:3分钟让你的桌面焕然一新
  • 如何快速掌握云端数据库管理:CloudBeaver完全指南
  • 需求洞察与决策指南:三钻模型的实战解析
  • 从“70%搭架子”到一键生成:飞算JavaAI如何重构上下文工程
  • 多智能体强化学习如何实现配电网主动电压控制的终极解决方案:MAPDN深度解析