当前位置: 首页 > news >正文

常用的大语言模型有什么

目前常用的大语言模型(Large Language Models, LLMs)主要包括以下几类,涵盖开源与闭源、学术与商业用途的代表性模型:


1.OpenAI 系列

  • GPT-3 / GPT-3.5:广泛用于 ChatGPT(免费版)等应用。
  • GPT-4 / GPT-4 Turbo:性能更强,支持多模态(如 GPT-4V),上下文窗口更大(最高达 128K tokens)。
  • GPT-4o(2024年发布):更快、更便宜,支持实时语音和视觉交互。

注:OpenAI 模型为闭源,通过 API 或 ChatGPT 使用。


2.Anthropic 系列(Claude)

  • Claude 2 / Claude 2.1:强调安全性和长上下文(支持 200K tokens)。
  • Claude 3 系列(2024年发布):
    • Claude 3 Haiku(轻量快速)
    • Claude 3 Sonnet(平衡性能与成本)
    • Claude 3 Opus(最强性能,对标 GPT-4)

支持多模态(如图像理解),部分版本可通过 API 使用。


3.Google 系列(Gemini / PaLM)

  • PaLM / PaLM 2:Google 早期大模型,用于 Bard(现升级为 Gemini)。
  • Gemini 系列(2023年底发布):
    • Gemini Nano(设备端运行)
    • Gemini Pro(通用用途,API 可用)
    • Gemini Ultra(最强版本,对标 GPT-4)

Gemini 原生支持多模态,整合进 Google Workspace 和 Android。


4.Meta(Facebook)系列(Llama)——开源代表

  • Llama(2023年7月):开源,需申请许可。
  • Llama 2:可商用(部分限制),性能接近 GPT-3.5。
  • Llama 3(2024年4月发布):
    • 支持 8B 和 70B 参数版本
    • 上下文长度达 8K tokens
    • 性能显著提升,接近 Claude 3 Sonnet / GPT-3.5+
  • Llama 3.1 / 3.2(2024年下半年及2025年陆续发布):进一步优化推理、多语言和工具调用能力。

Llama 系列是当前最流行的开源基础模型,广泛用于微调和本地部署。


5.Mistral AI(法国)—— 高效开源模型

  • Mistral 7B:小而强,性能优于 Llama 2 13B。
  • Mixtral 8x7B:稀疏 MoE(Mixture of Experts)架构,效果接近 GPT-3.5。
  • Mistral Large(闭源):对标 GPT-4,支持多语言。
  • Mistral Small / Medium:面向不同应用场景的商用模型。

Mistral 模型以高性价比和推理效率著称,支持商业使用。


6.中国主流大模型

  • 通义千问(Qwen)(阿里云):
    • Qwen-1.5 / Qwen2 / Qwen2.5 / Qwen3(持续迭代)
    • 开源版本(如 Qwen-Max、Qwen-Plus、Qwen-Turbo)覆盖不同场景
    • 支持多模态(Qwen-VL)、代码(Qwen-Coder)、数学(Qwen-Math)
  • DeepSeek(深度求索)
    • DeepSeek-V2 / V3,支持 MoE 架构
    • DeepSeek-Coder 系列在代码任务上表现优异
  • GLM 系列(智谱 AI):
    • GLM-4(2024年发布),支持多模态和 Agent 能力
    • 开源 GLM-3、GLM-Edge 等
  • Moonshot(月之暗面)
    • 支持超长上下文(最高 128K–256K tokens)
  • 百川智能(Baichuan)
    • Baichuan2-7B/13B,开源可商用

7.其他值得关注的模型

  • Command系列(Cohere):面向企业 NLP 任务。
  • Phi 系列(Microsoft):小型但高效,适合边缘设备(如 Phi-3-mini 仅 3.8B 参数,性能媲美 Llama 2 7B)。
  • Yi 系列(零一万物):Yi-34B 在多个基准测试中表现优异。

选择建议:

  • 想本地部署/微调→ 选Llama 3QwenMistral等开源模型。
  • 追求最强性能→ 用GPT-4oClaude 3 OpusGemini Ultra
  • 注重中文能力QwenGLM-4DeepSeek表现优秀。
  • 低成本/高效率Mistral 7BPhi-3Claude 3 Haiku
http://www.jsqmd.com/news/347081/

相关文章:

  • n8n
  • 实用指南:SpringBoot3.3.0集成Knife4j4.5.0实战
  • 2026年 消音室厂家推荐排行榜,消音房/全消音室/半消音室/消音管/消音实验室/消音箱/手动/气动/全自动消音箱,专业声学设计与静音技术深度解析 - 品牌企业推荐师(官方)
  • 为啥说 PBR 普及之前的“传统光照模型”(比如 Blinn‑Phong)不统一、没物理约束?——一篇大白话讲透的渲染江湖史
  • 零基础冲执业药师证!2026高口碑培训推荐,选对少走一年弯路 - 品牌测评鉴赏家
  • GraphRAG
  • 道生天合拟投3000万美元在摩洛哥建厂,交付半径这笔账怎么算
  • 【报告】从3000万美元摩洛哥建厂看道生天合的EMEA交付半径与贸易弹性
  • 遵循 “选型-规划-规范安装-严格验证” 全协议读卡器模块支持多种卡片类型(EM/Mifare/CPU卡等)和输出协议(RS485/韦根等),适用于梯控、门禁等场景。故障排查应优先检测电源和通讯状态。
  • 男士必看!揭秘十大手动剃须刀品牌,谁才是剃须之王? - 品牌测评鉴赏家
  • 国产32位微控制器MCU哪家好?极海半导体凭全栈实力成优选 - 资讯焦点
  • 2026年 防锈油厂家推荐排行榜:免清洗/硬膜/脱水/超薄层/卷板静电喷涂/长期封存/水性/环保无钡/触变性/汽相等全系列防锈油专业解析与选购指南 - 品牌企业推荐师(官方)
  • 2026年电机微控制器MCU哪家好?五大主流品牌深度解析 - 资讯焦点
  • 2005-2025年中国全球投资追踪数据库
  • 2026学历提升机构红榜|高性价比推荐+避坑指南,小白秒上岸! - 品牌测评鉴赏家
  • 告别油塌,轻松拿捏氛围感发型|热门发泥实测 - 品牌测评鉴赏家
  • AI原生应用助力业务流程增强的实战指南
  • 强化学习在AI Agent交互式学习中的应用
  • 2026年2月GEO服务专业机构推荐:综合实力、技术壁垒与实效转化TOP7权威榜单深度评测 - 资讯焦点
  • 【金融项目实战】5_接口测试 _Jmeter功能脚本实现
  • 细软塌救星!5款持久定型蓬松水实测,高颅顶焊住一整天不扁塌 - 品牌测评鉴赏家
  • 2026年发泥大揭秘!优质品牌带你重塑发型魅力 - 品牌测评鉴赏家
  • 【金融项目实战】6_接口测试 _Jmeter自动化脚本实现(重点)
  • 财务姐姐偷偷求我的Python代码:3秒对账,10秒报税,1分钟搞定月报
  • 【年度妙题2】柯西不等式的巧妙应用
  • 干皮面霜推荐秋冬必备:从屏障修护到长效保湿的5款实力之选 - 资讯焦点
  • 2026年 无油空压机厂家实力推荐榜:旋齿/螺杆/涡旋全系列深度解析,医用与工业高效节能之选 - 品牌企业推荐师(官方)
  • 2026执业药师培训机构硬核推荐:高口碑TOP6避坑指南,备考党直接抄作业 - 品牌测评鉴赏家
  • 跨部门协作项目管理软件哪个好用?2026年五大优选工具深度解析 - 资讯焦点
  • 2026男士发泥封神榜!Tony私藏款,通勤约会帅到自带滤镜 - 品牌测评鉴赏家