当前位置: 首页 > news >正文

【大模型学习】主流大模型统计

文章目录

  • 文本生成大模型
    • 1. OpenAI
    • 2. claude
    • 3. Gemini
    • 4. Qwen
      • Qwen第一代
      • Qwen2
      • Qwen2.5
      • Qwen3
    • 5. Kimi
    • 6. DeepSeek
    • 7. Llama系列
    • 8. Mistral AI(欧洲最强)
    • 9. xAI(马斯克)
    • 10. 百川智能(Baichuan AI)
    • 11. Zhipu AI(智谱AI / GLM)
    • 12. MiniMax(国内)
      • 最新模型(2026年6月8日08:53:06)
  • VL多模态大模型
  • 语音识别大模型
  • 语音合成大模型

文本生成大模型

1. OpenAI

时期模型是否开源
2019GPT-2部分开放,后来开源
2020GPT-3闭源
2022GPT-3.5闭源
2023GPT-4闭源
2024GPT-4o闭源
2025-2026GPT-5 系列闭源

从2019年之后,多数语音生成大模型均为闭源模型

2. claude

Claude 是由 Anthropic 公司开发的大语言模型系列。Authropic成立于2021年,总部位于美国旧金山,创始团队中不少成员来自OpenAI,包括其CEO与总裁。
Anthropic的核心方向是:

  • 大语言模型
  • AI安全
  • 可解释性研究
  • 企业级AI应用
    目前的主流模型:
模型定位特点
Claude 4 Opus旗舰模型最强推理、复杂Agent、多步规划
Claude 4 Sonnet主力模型性能与成本平衡,目前最流行
Claude 3.5 Sonnet上代经典仍有大量企业在使用
Claude 3 Haiku轻量模型低成本、低延迟

其特点是大型项目代码理解能力强,上下文管理能力非常受欢迎。

3. Gemini

Gemini 是 Google 的大模型家族,由 Google DeepMind开发,它可以理解和生成文本、图片、音频、视频、代码等多种模态内容,是 Google 对标 GPT 和 Claude 的核心 AI 产品。
Claude 擅长代码和长文档,GPT 擅长综合能力,而 Gemini 最大的优势是与 Google 生态深度融合。
目前 Google 的主力模型家族已经演进到 Gemini 3 系列。Google 官方列出的主要模型包括:

  • Gemini 3 Pro
  • Gemini 3.1 Pro
  • Gemini 3.5 Flash
  • Gemini Omni
  • Gemini Audio
  • Gemini Nano

Gemini最大的特点是,原生多模态,很多模型是文字模型+图片模型+语音模型拼起来的。
它的设计初衷就是,文本+图片+视频+音频+代码,统一处理。
第二个特点就是,他有Google的生态加成,你可以将其天然的接入,Gmail,Google Drive,Google Docs等。
第三个特点就是超长上下文,可以将整个项目源码,接口文档,需求说明等一次性的喂进去,它对于长文档和超长代码库分析能力一直都是业内领先梯队。

4. Qwen

Qwen 是 阿里云通义千问 的大模型系列。开发团队:

  • 阿里云
  • 通义实验室(Tongyi Lab)

发布时间是2023年,到现在已经发展成国内最完整的大模型生态之一。

Qwen第一代

Qwen-7B Qwen-14B Qwen-72B

当时最大的特点:

  • 中文能力强
  • 英文能力不错
  • 开源权重

Qwen2

这是很多企业开始大规模采用的版本。
特点,推理能力提升,代码能力提升,多语言支持增强

0.5B 1.5B 7B 14B 72B

Qwen2.5

这一代是Qwen的封神之作,真正爆发。
很多榜单上,Qwen2.5-72B 已经接近甚至超过不少的闭源模型。
很多企业开始:

GPT验证需求 -> Qwen2.5上线部署

Qwen3


一代最大的特点:

Hybrid Thinking(混合思考) 简单问题 -> 直接回答 复杂问题 -> 先思考再回答

目前Qwen的生成已经非常恐怖了,它不仅仅是聊天模型,而是已经形成:

Qwen ├── Qwen3 # 文本生成 ├── Qwen-Coder # 代码模型 ├── Qwen-VL # 视觉多模态 ├── Qwen-Audio # 音频模型,支持语音识别,音频理解,对话等 ├── Qwen-Omni # 全模态 ├── Qwen-ASR # 语音识别 └── Qwen-Agent # agent模型

5. Kimi

Kimi 是中国公司 Moonshot AI(月之暗面) 开发的大模型产品。
因为它率先解决了一个痛点:长文档,它在2024年已经开始主打200万字长文本

6. DeepSeek

DeepSeek 是一家中国人工智能公司,因推出高性能、低成本的大语言模型(LLM)而受到广泛关注。它由量化基金公司幻方量化(High-Flyer)孵化,核心方向是通用人工智能与开源模型研发。
DeepSeek 最出名的一点,是它在相对较低训练成本下,做出了接近国际顶级模型的效果。比如:DeepSeek-V2、DeepSeek-Coder、DeepSeek-R1(推理模型)。这些模型在数学、代码、推理等任务上表现很强,尤其是在中文场景里。

7. Llama系列

核心:Llama2 / Llama3 / Llama3.1 / Llama3.2
特点:

  • 开源生成最强之一
  • 被全球二次训练最多

8. Mistral AI(欧洲最强)

法国公司,核心模型:

Mistral 7B Mixtral(MOE)

特点:

  • 小而强
  • 推理效率高
  • 很适合企业部署

9. xAI(马斯克)

10. 百川智能(Baichuan AI)

核心,Baichuan2 / Baichuan3
特点:中文能力不错,偏企业落地,一度是国产第一梯队竞争者。

11. Zhipu AI(智谱AI / GLM)

模型:GLM系列
特点:中文强、多模态布局早、学术背景强(清华系)
代表作品:ChatGLM

12. MiniMax(国内)

特点:长文本能力强,对话产品化做的比较激进
产品:海螺AI

最新模型(2026年6月8日08:53:06)

MiniMax M3,目前最顶的版本。
核心能力:

  • M3(旗舰通用大模型)
  • 1M超长上下文(百万token)
  • 原生多模态(文本+图像+其他)
  • 强化Agent / coding能力
  • 新架构:MSA(稀疏注意力)

它是国内首个 “三合一”:

coding agent multimodal

VL多模态大模型

语音识别大模型

语音合成大模型

http://www.jsqmd.com/news/983213/

相关文章:

  • 告别网盘限速!LinkSwift网盘直链下载助手终极指南
  • 2026汉中南郑区装修公司口碑推荐:谁是真正的“透明消费“标杆? - 装修新知
  • 别再乱用REPLACE INTO了!MySQL里‘有则更新,无则插入’的正确姿势是它(附避坑实例)
  • 开源漫画阅读器:纯净阅读体验的技术实现与应用指南
  • ansys明明设置了英文显示,有些字却仍显示中文,什么原因?
  • 2026 企业级全流程 AI 标书工具深度评测:从招文解析到资产沉淀
  • GoGoGo:终极Android虚拟定位工具,无需ROOT实现摇杆控制定位
  • 2026 企业级 AI 标书工具技术架构与落地 ROI 深度分析
  • K20微控制器时钟与ADC实战:从手册参数到高精度系统设计
  • 梧州旅游静态网页作业包|含动态顶部横幅与景点滚动介绍的HTML双页模板
  • 5分钟掌握缠论自动化工具:告别手动画中枢的终极方案
  • AI专著生成技巧:利用AI写专著工具,高效完成20万字专著创作!
  • 2026汉中汉台区装修公司口碑TOP5是哪几家?怎么选不踩坑 - 装修新知
  • 模板驱动型文档自动化:结构化内容批量生成实战指南
  • 视频修复新纪元:如何用Untrunc拯救你的珍贵数字记忆
  • Windows/Linux的‘钩子’(LSM)与可信计算3.0是怎么‘握手’的?一个实际配置案例讲明白
  • 别再用微信传大文件了!5款不限速的文件传输与数据同步工具推荐
  • 深入解析NXP KL16 ADC/DAC与通信接口:从电气特性到工程实践
  • Excel自动化避坑指南:用openpyxl移动、复制、删除工作表时,你可能会遇到的3个‘坑’
  • 制造业AI落地的关键:AI基础设施才是真正的胜负手
  • 【Electron 鸿蒙 PC 适配踩坑 FAQ】真实问题×对症解法——遇到问题直接跳查
  • TQVaultAE终极指南:泰坦之旅无限仓库与装备管理系统完全解析
  • 如何快速实现网站全量备份?HTTrack离线浏览完整指南
  • 终极小说阅读神器:Uncle小说打造你的私人数字书房完整指南
  • i.MX6接口电气特性实战:D-PHY/HSI/UART设计要点与信号完整性调试
  • 汉中南郑区装修公司推荐榜单:2026年避坑指南(数据验证版) - 装修新知
  • Amazon Quick + MCP 远程服务实战:让 AI 助手直接操作飞书,从设计到落地
  • QFIL读写eMMC分区保姆级教程:从XML解析到实战避坑(附system.xml配置详解)
  • MuleSoft驱动的企业级AI编排:安全可信的LLM集成实践
  • 怎样使用GTA圣安地列斯存档编辑器:5个实用技巧完全掌控游戏进度