当前位置：首页 > news >正文

常用的大语言模型有什么

news 2026/4/9 20:37:33

目前常用的大语言模型（Large Language Models, LLMs）主要包括以下几类，涵盖开源与闭源、学术与商业用途的代表性模型：

1.OpenAI 系列

GPT-3 / GPT-3.5：广泛用于 ChatGPT（免费版）等应用。
GPT-4 / GPT-4 Turbo：性能更强，支持多模态（如 GPT-4V），上下文窗口更大（最高达 128K tokens）。
GPT-4o（2024年发布）：更快、更便宜，支持实时语音和视觉交互。

注：OpenAI 模型为闭源，通过 API 或 ChatGPT 使用。

2.Anthropic 系列（Claude）

Claude 2 / Claude 2.1：强调安全性和长上下文（支持 200K tokens）。
Claude 3 系列（2024年发布）：
- Claude 3 Haiku（轻量快速）
- Claude 3 Sonnet（平衡性能与成本）
- Claude 3 Opus（最强性能，对标 GPT-4）

支持多模态（如图像理解），部分版本可通过 API 使用。

3.Google 系列（Gemini / PaLM）

PaLM / PaLM 2：Google 早期大模型，用于 Bard（现升级为 Gemini）。
Gemini 系列（2023年底发布）：
- Gemini Nano（设备端运行）
- Gemini Pro（通用用途，API 可用）
- Gemini Ultra（最强版本，对标 GPT-4）

Gemini 原生支持多模态，整合进 Google Workspace 和 Android。

4.Meta（Facebook）系列（Llama）——开源代表

Llama（2023年7月）：开源，需申请许可。
Llama 2：可商用（部分限制），性能接近 GPT-3.5。
Llama 3（2024年4月发布）：
- 支持 8B 和 70B 参数版本
- 上下文长度达 8K tokens
- 性能显著提升，接近 Claude 3 Sonnet / GPT-3.5+
Llama 3.1 / 3.2（2024年下半年及2025年陆续发布）：进一步优化推理、多语言和工具调用能力。

Llama 系列是当前最流行的开源基础模型，广泛用于微调和本地部署。

5.Mistral AI（法国）—— 高效开源模型

Mistral 7B：小而强，性能优于 Llama 2 13B。
Mixtral 8x7B：稀疏 MoE（Mixture of Experts）架构，效果接近 GPT-3.5。
Mistral Large（闭源）：对标 GPT-4，支持多语言。
Mistral Small / Medium：面向不同应用场景的商用模型。

Mistral 模型以高性价比和推理效率著称，支持商业使用。

6.中国主流大模型

通义千问（Qwen）（阿里云）：
- Qwen-1.5 / Qwen2 / Qwen2.5 / Qwen3（持续迭代）
- 开源版本（如 Qwen-Max、Qwen-Plus、Qwen-Turbo）覆盖不同场景
- 支持多模态（Qwen-VL）、代码（Qwen-Coder）、数学（Qwen-Math）
DeepSeek（深度求索）：
- DeepSeek-V2 / V3，支持 MoE 架构
- DeepSeek-Coder 系列在代码任务上表现优异
GLM 系列（智谱 AI）：
- GLM-4（2024年发布），支持多模态和 Agent 能力
- 开源 GLM-3、GLM-Edge 等
Moonshot（月之暗面）：
- 支持超长上下文（最高 128K–256K tokens）
百川智能（Baichuan）：
- Baichuan2-7B/13B，开源可商用

7.其他值得关注的模型

Command系列（Cohere）：面向企业 NLP 任务。
Phi 系列（Microsoft）：小型但高效，适合边缘设备（如 Phi-3-mini 仅 3.8B 参数，性能媲美 Llama 2 7B）。
Yi 系列（零一万物）：Yi-34B 在多个基准测试中表现优异。

选择建议：

想本地部署/微调→ 选Llama 3、Qwen、Mistral等开源模型。
追求最强性能→ 用GPT-4o、Claude 3 Opus、Gemini Ultra。
注重中文能力→Qwen、GLM-4、DeepSeek表现优秀。
低成本/高效率→Mistral 7B、Phi-3、Claude 3 Haiku。

http://www.jsqmd.com/news/347081/

相关文章：

实用指南：SpringBoot3.3.0集成Knife4j4.5.0实战

2026年消音室厂家推荐排行榜，消音房/全消音室/半消音室/消音管/消音实验室/消音箱/手动/气动/全自动消音箱，专业声学设计与静音技术深度解析 - 品牌企业推荐师（官方）

为啥说 PBR 普及之前的“传统光照模型”（比如 Blinn‑Phong）不统一、没物理约束？——一篇大白话讲透的渲染江湖史

零基础冲执业药师证！2026高口碑培训推荐，选对少走一年弯路 - 品牌测评鉴赏家

道生天合拟投3000万美元在摩洛哥建厂，交付半径这笔账怎么算

【报告】从3000万美元摩洛哥建厂看道生天合的EMEA交付半径与贸易弹性

遵循 “选型-规划-规范安装-严格验证” 全协议读卡器模块支持多种卡片类型（EM/Mifare/CPU卡等）和输出协议（RS485/韦根等），适用于梯控、门禁等场景。故障排查应优先检测电源和通讯状态。

男士必看！揭秘十大手动剃须刀品牌，谁才是剃须之王？ - 品牌测评鉴赏家

国产32位微控制器MCU哪家好？极海半导体凭全栈实力成优选 - 资讯焦点

2026年防锈油厂家推荐排行榜：免清洗/硬膜/脱水/超薄层/卷板静电喷涂/长期封存/水性/环保无钡/触变性/汽相等全系列防锈油专业解析与选购指南 - 品牌企业推荐师（官方）

2026年电机微控制器MCU哪家好？五大主流品牌深度解析 - 资讯焦点

2005-2025年中国全球投资追踪数据库

2026学历提升机构红榜｜高性价比推荐+避坑指南，小白秒上岸！ - 品牌测评鉴赏家

告别油塌，轻松拿捏氛围感发型｜热门发泥实测 - 品牌测评鉴赏家

AI原生应用助力业务流程增强的实战指南

强化学习在AI Agent交互式学习中的应用

2026年2月GEO服务专业机构推荐：综合实力、技术壁垒与实效转化TOP7权威榜单深度评测 - 资讯焦点

【金融项目实战】5_接口测试 _Jmeter功能脚本实现

细软塌救星！5款持久定型蓬松水实测，高颅顶焊住一整天不扁塌 - 品牌测评鉴赏家

2026年发泥大揭秘！优质品牌带你重塑发型魅力 - 品牌测评鉴赏家

【金融项目实战】6_接口测试 _Jmeter自动化脚本实现（重点）

财务姐姐偷偷求我的Python代码：3秒对账，10秒报税，1分钟搞定月报

【年度妙题2】柯西不等式的巧妙应用

干皮面霜推荐秋冬必备：从屏障修护到长效保湿的5款实力之选 - 资讯焦点

2026年无油空压机厂家实力推荐榜：旋齿/螺杆/涡旋全系列深度解析，医用与工业高效节能之选 - 品牌企业推荐师（官方）

2026执业药师培训机构硬核推荐：高口碑TOP6避坑指南，备考党直接抄作业 - 品牌测评鉴赏家

跨部门协作项目管理软件哪个好用？2026年五大优选工具深度解析 - 资讯焦点

2026男士发泥封神榜！Tony私藏款，通勤约会帅到自带滤镜 - 品牌测评鉴赏家