当前位置: 首页 > news >正文

AI大模型应用简介 - 努力-

一、AI大模型简介

 

  2022年11月30日,OpenAI公司发布了GPT3.5模型,同时对外开放了ChatGPT产品。人工智能突然进入了普通人的生活中,各种AI应用如雨后春笋般出现。

 f0eb5881baa04177b14ca2324254a4ac

 

  不过,由于大模型研究的成本很高,大部分中小型企业只能望而却步,参与者有限,AI的发展也似乎陷入了瓶颈。

  2025年1月20日,位于杭州的DeepSeek公司正式发布了具有划时代意义的DeepSeek-R1模型,该模型在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,且训练成本仅为 560 万美元,远低于美国科技巨头的数亿美元乃至数十亿美元投入,这一突破彻底震惊了全球科技界。

  DeepSeek的出现像是向一潭死水的AI领域投入了一颗巨石,引起了巨大的波澜。特别是其低廉的训练成本,让中小型企业有了参与AI开发的资格。

  毫无疑问,接下来各行各业都将进入传统应用AI化、智能化的变革之中。Java更应该成为这场变革的引领者!

  要知道,全球有25亿+的Java应用正在运行,超过90的服务端应用都是采用Java语言!传统应用要向AI领域进军,最好的办法一定是使用Java语言。

二、 开放大模型服务


  通常发布大模型的官方、大多数的云平台都会提供开放的、公共的大模型服务。大模型官方前面讲过,我们不再赘述,这里我们看一些国内提供大模型服务的云平台:

  云平台 - 公司 - 地址
  阿里百炼 - 阿里巴巴 - https://bailian.console.aliyun.com
  腾讯TI平台 - 腾讯 - https://cloud.tencent.com/product/ti
  千帆平台 - 百度 - https://console.bce.baidu.com/qianfan/overview
  SiliconCloud - 硅基流动 - https://siliconflow.cn/zh-cn/siliconcloud
  火山方舟-火山引擎 -  字节跳动 - https://www.volcengine.com/product/ark

 


三、大模型与大模型应用


  我们熟知的大模型比如GPT、DeepSeek都是生成式模型,顾名思义,根据前文不断生成后文。

  不过,模型本身只具备生成后文的能力、基本推理能力。我们平常使用的AI对话产品除了生成和推理,还有会话记忆功能、联网功能等等。这些都是大模型不具备的。

  要想让大模型产生记忆,联网等功能,是需要通过额外的程序来实现的,也就是基于大模型开发应用

  所以,我们现在接触的AI对话产品其实都是基于大模型开发的应用,并不是大模型本身,这一点大家千万要区分清楚。

  下面我把常见的一些大模型对话产品及其模型的关系给大家罗列一下:

  大模型 - 对话产品 -  公司  - 地址
  Claude 3.5  - Claude AI  - Anthropic  - https://claude.ai/chats
  DeepSeek-R1 -  DeepSeek  - 深度求索 -  https://www.deepseek.com/
  文心大模型3.5  - 文心一言  - 百度  - https://yiyan.baidu.com/
  星火3.5  - 讯飞星火  - 科大讯飞 -  https://xinghuo.xfyun.cn/desk
  Qwen-Max -  通义千问 -  阿里巴巴 -  https://tongyi.aliyun.com/qianwen/
  Moonshoot  - Kimi  - 月之暗面 -  https://kimi.moonshot.cn/
  Yi-Large  - 零一万物 -  零一万物 -  https://platform.lingyiwanwu.com/

http://www.jsqmd.com/news/4018/

相关文章:

  • 完整教程:01_5分钟运行你的第一个LLM:Hugging Face入门
  • codeforces 1504 div3
  • React 基础核心概念(8 个)——从入门到能写业务组件(上)| 葡萄城技术团队
  • 2 day - when
  • 实用指南:轻松玩转Swagger API文档神器
  • 记录java调用eclipse cdt 解析c++文件
  • Chormium 密码管理器表单结构体说明(基于Chromium138)
  • 为什么人工智能选择Python?深入解析AI界的胶水语言
  • 1 day(20250925) - when
  • 12分钟讲解Python核心理念
  • 【重要】什么是 PEP 8 规范
  • 实用指南:华为坤灵:点燃中小企业智能化的星火
  • 阻止HTML input元素(type=number)中输入字母e的方法
  • 【Prompt学习技能树地图】利用GitHub-Prompt Engineering Guide进阶学习Prompt工程指南 - 指南
  • 深入解析:KRaft 运维从静态到动态 Controller
  • Windows时间同步列表注册表授时时间服务器
  • epub如何让标题在竖直方向居中
  • Apple Books 对 epub 支持的限定(未完待续)
  • 完整教程:区间dp,数据结构优化dp等6种dp,各种trick深度讲解
  • win10开机输入密码后一直转圈,很长时间才登录到桌面
  • Windows11 右键菜单管理
  • Mac 安装PDF2zh
  • 完整教程:leetcode (2)
  • 如何通过 Python + Selenium + BeautifulSoup 爬取动态加载的网页数据 - 教程
  • 实用指南:【连载6】 C# MVC 日志管理最佳实践:归档清理与多目标输出配置
  • 2025Unity必备知识——GUI(完整详细) - 指南
  • HBM之父:HBM的终点是HBF
  • 实用指南:40.应用层协议HTTP(三)
  • 【GitHub每日速递 250926】12 周 24 课,边学边练!微软 AI 初学者的通关秘籍
  • mcp-use mcp server 交互工具