当前位置: 首页 > news >正文

阿里批准林俊旸离职:基础模型已上升为集团最大战略 这对千问是好事

雷递网 雷建平 3月5日

阿里巴巴CEO吴泳铭今日发布内部邮件,宣布公司已决定批准千问核心负责人林俊旸同学的辞职申请,由阿里云CTO、通义实验室负责人周靖人会继续带领通义实验室推进后续工作。

同时,阿里将成立基础模型支持小组,由吴泳铭本人,周靖人,及阿里集团CTO范禹共同协调集团资源支持基础模型建设。

吴泳铭同时强调,技术发展不进则退。发展基础大模型是阿里面向未来的关键战略。

从这封信来看,吴泳铭亲自挂帅,负责基础模型的资源支持,这意味着,未来千问模型团队将得到更多GPU资源支持,毫无疑问对千问模型团队是好事。

阿里对千问的战略定位已从技术影响力构建转向基础模型和超级入口两手都要抓的卡位。这一转变意味着考核指标从开源社区活跃度、论文引用量等学术维度,转向用户留存率、场景渗透率、商业化收入等运营维度。

小天才从来都不好管

林俊旸现年33岁,是阿里巴巴最年轻的P10级技术负责人,也是通义千问核心推动者,被业界视为Qwen开源生态的"代言人",Qwen也在林俊旸主导下坚持"全尺寸全模态"开源策略,全球下载量突破10亿次,衍生模型超20万个,但开源模型的商业化效率始终存疑。

林俊旸2019年毕业,进入阿里达摩院智能计算实验室,一年后,通义千问立项,林俊旸成为核心架构成员;2022年升任技术负责人;2024年带队开源Qwen系列,在全球模型排行榜上与GPT、Claude正面交锋;2025年5月,林俊旸晋升,成为阿里最年轻P10级专家,毫无疑问是个小天才选手。

小天才从来都不好管,林俊旸此次离职与通义实验室组织架构调整有关,通义实验室计划将Qwen团队从"垂直整合"模式拆分为预训练、后训练、文本、多模态等多个水平分工团队,各团队独立运行、直接向上汇报,林俊旸从原本统筹全链条的负责人,变为仅管理其中一个模块。

从客观来说,林俊旸有些恃才傲物,从自己利益角度出发考虑问题。组织的架构调整,让林俊旸有不适应性,林俊旸昨日发布消息:“me stepping down. bye my beloved qwen”,引发了一场千问舆论风波,是在以离职相威胁进行逼宫,而在阿里这样的大公司,本质上是要用组织确定性取代个人英雄主义,消弭职能重叠、适配集团层面的商业化需求。

内部信其实释放出一个信息:给林俊旸体面告别。

OpenAI前后经历了联合创始人Ilya、CTO Mira Murati等多达10个联合创始人的离职和动荡,也未严重影响OpenAI在AI领域的前沿性,如今还估值超过8000亿美元,还刚融资1100亿美元,由软银、亚马逊和英伟达投资。

千问要让AI行业从“聊天对话”迈入“办事时代”

近期,阿里千问近期动作频频,其中,阿里刚开源了4款 Qwen3.5 小尺寸模型系列:Qwen3.5-0.8B/2B/4B/9B。这一系列模型继承Qwen3.5家族的技术能力,采用原生多模态训练、最新的模型架构,可满足从极端资源受限到高性能轻量级应用的不同需求。

同一天,阿里千问大模型官宣,阿里巴巴将大模型B端品牌和C端应用品牌统一为千问,“通义千问”的名称将不再使用。

2026年初,千问App宣布C端月活用户破亿,全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,实现点外卖、买东西、订机票等AI购物功能,并向所有用户开放测试。千问App当时称,要让千问App成能完成真实生活复杂任务的AI助手,让AI行业从“聊天对话”迈入“办事时代”。

阿里管理层认为,AI发展将经历“学习人”、“辅助人”和“超越人”三个阶段。大模型的能力已进入到“辅助人”的Agentic AI时代,阿里大力入局C端市场的时机已经成熟。

AI是阿里未来十年唯一可能再造一个“淘宝+阿里云”级别的赛道,这也是阿里全力以赴的重要原因。而当下,千问App要直接和豆包、元宝打消耗战,模型团队只投身研究、不负责市场的时代已经过去了,那就是技术团队要配合产品团队,要能协调,这也是千问内部近期一系列团队调整的核心原因。

一位业内人士就评论说,只关注技术,不关注应用落地,投入广告20亿也白搭。

当然,林俊旸的离职,也是千问团队的损失,这种技术人才最难管理,阿里在管理技术人才的路径上也有提升空间。吴泳铭就强调,持续加大对人工智能领域的研发投入,加大吸纳优秀人才的力度,释放的信息就是,钱和算力管够,技术人员可以继续发挥优势。

吴泳铭也提出,技术发展不进则退,既指行业竞争(DeepSeek、OpenAI等对手紧逼),也是希望组织内部不能有"技术贵族"躺在功劳簿上。

——————————————

雷递由媒体人雷建平创办,若转载请写明来源。

http://www.jsqmd.com/news/441540/

相关文章:

  • 文脉定序快速上手:使用Gradio搭建Web界面,支持上传多段‘卷宗’重排
  • Qwen1.5-1.8B-Chat-GPTQ-Int4应用指南:技术文档自动摘要与问答系统构建
  • SiameseUIE开源大模型实操手册:从模型加载、Schema调试到结果验证全链路
  • Pi0具身智能v1快速原型:验证任务描述到动作序列的交互逻辑
  • SpringBoot+Vue 物流信息管理系统管理平台源码【适合毕设/课设/学习】Java+MySQL
  • Qwen-Image-2512-Pixel-Art-LoRA部署避坑指南:OOM解决、中断失效、风格不纯全排查
  • Nunchaku-flux-1-dev效果展示:跨风格艺术创作对比分析
  • 2026年开年五一商圈足浴门店评测:谁定义了城市微度假新标准? - 2026年企业推荐榜
  • Java SpringBoot+Vue3+MyBatis 西安工商学院课表管理系统系统源码|前后端分离+MySQL数据库
  • Tao-8k模型提示词(Prompt)工程高级教程:从基础到精通
  • Spring_couplet_generation 与Git工作流:团队协作开发与版本管理
  • 大数据领域OLAP的核心技术与应用解析
  • Glyph视觉推理实用教程:从部署到提问,手把手教你用
  • 文化遗产保护:AudioLDM-S复原古乐器声音的实践
  • Wan2.1 VAE多模态生成效果:融合文本与草图输入生成完整场景
  • 2026年评价高的高档朗声打火机品牌推荐:高档朗声打火机精选厂家 - 品牌宣传支持者
  • 春联生成模型赋能内容创作:AIGC短视频文案批量生产
  • Anaconda环境下的MusePublic大模型开发与依赖管理
  • Keil5嵌入式开发环境联动:为STM32项目注入MiniCPM-V-2_6视觉AI能力
  • Qwen-Image-2512-Pixel-Art-LoRA实战教程:自定义LoRA权重热替换与多风格切换
  • InsightFace人脸分析系统应用场景:数字人驱动——基于68点3D关键点生成唇动/眨眼动画
  • AI内容安全新范式:Asian Beauty Z-Image Turbo本地化部署满足GDPR/个保法要求
  • AgentCPM赋能嵌入式设备?边缘计算场景下的轻量化研报摘要生成探索
  • Clawdbot汉化版环境部署:Firewall规则配置+企业微信IP白名单加固
  • SenseVoice-Small在智能客服系统中的语音识别应用案例
  • SiameseUIE效果展示:含标点/括号干扰文本(如‘李白(盛唐)’)鲁棒性验证
  • Qwen2.5-1.5B镜像免配置:预置requirements.txt与一键run.sh脚本说明
  • Pi0大模型GPU部署指南:TensorRT加速推理配置与吞吐量提升实测
  • Z-Image-Turbo从零开始:手把手教你用命令行生成第一张AI图
  • SenseVoice-Small ONNX与Elasticsearch整合:语音内容检索系统