当前位置: 首页 > news >正文

LangChain4j 开发Java Agent智能体- 阿里云百炼大模型平台接入以及Ollama简介以及安装和使用

大家好,我是Java1234_小锋老师,最近更新《2027版本 LangChain4j 开发Java Agent智能体 视频教程》专辑,感谢大家支持。


本课程主要介绍和讲解 LangChain4j 简介,阿里云百炼大模型平台接入,Ollama简介以及安装和使用,HelloWorld 实现,日志配置,集成SpringBoot,Ai Service 使用,对话与提示词工程(Prompt),结构化输出,会话记忆,工具调用(Function Calling),嵌入模型与向量数据库,RAG(检索增强生成),MCP(模型上下文协议),多模态支持

视频教程+课件+源码打包下载:

链接:https://pan.baidu.com/s/1o-zRfndo1HHrS_uFroOiCw?pwd=1234
提取码:0000

LangChain4j 开发Java Agent智能体- 阿里云百炼大模型平台接入以及Ollama简介以及安装和使用

阿里云百炼大模型平台接入

阿里云百炼平台简介

阿里云百炼平台是阿里云推出的一站式大模型开发与应用平台。它的核心目标是为企业和开发者提供从模型选择、训练调优到应用部署的全链路服务,降低AI应用的开发门槛和周期。

阿里云百炼平台官方

具体来说,它具备以下核心能力和特点:

  • 丰富的模型选择:平台集成了包括阿里通义系列在内的上百款国内外主流大模型,覆盖文本生成、多模态理解等多种场景。用户可以根据业务需求灵活选择。

  • 一站式模型定制:支持用户利用自己的数据,通过可视化界面进行模型的微调(SFT)、评估和部署,让模型更贴合特定业务场景。

  • 便捷的应用构建:提供低代码的开发环境,通过简单的流程编排和知识库集成,可以快速搭建如智能客服、AI助手等应用。它支持检索增强生成技术,让模型能结合企业私有知识进行回答。

  • 开放的生态与工具:首批上线了50多款主流的MCP服务(如高德、Notion等),让大模型能轻松连接和使用外部工具,实现更复杂的任务,比如构建一个能自动规划行程的智能体。

  • 灵活的成本与安全:采用按量付费模式,新用户通常有免费额度。同时,平台承诺不会将用户数据用于模型训练,并采用多重加密保障数据安全。

阿里云百炼大模型平台注册以及创建API key

打开阿里云百炼平台官方

我们用支付宝快捷登录。

官方默认给我们一些主流模型的试用100万 token额度,学习足够了,我们点“模型服务” -> "工作台" -> 模型用量",这里有个非常重要的注意点,大家一定要开启下“免费额度用完即停”。

接下来,我们要使用阿里云百炼平台接口的话,需要先创建API Key。

我们点“模型服务” -> "秘钥服务" ,点击“创建API Key”

弹出“创建API Key”窗体,选择归属账号,然后点“确定”即可

这样的话,我们就创建好了API Key

环境变量里面,我们要把API KEY配置上去,后面我们讲项目需要用到:

环境变量名:OPENAI_API_KEY

Ollama简介以及安装和使用

前面我们用阿里云百炼平台,是很方便,快捷,有免费额度,但是仅仅是部分模型有免费额度,而且额度也是有限制的。所以我们还有一种本地方案 - 使用Ollama部署蒸馏模型。

Ollama简介

Ollama官网

Ollama 是一个开源的本地大语言模型运行工具,它让用户能够轻松地在自己的电脑上部署和使用各种大型语言模型,无需联网也不需要昂贵的云服务。

核心特点

1. 简单易用

  • 一键安装,命令行操作

  • 几条命令就能下载和运行模型

  • 类似 Docker 的使用体验

2. 本地运行

  • 数据完全本地保存,保护隐私

  • 无需联网,随时随地可用

  • 没有 API 调用限制和费用

3. 模型支持

  • 支持 Llama 3、Phi 3、Mistral、Gemma 等主流开源模型

  • 可通过 Modelfile 自定义模型

  • 支持 GGUF 格式的模型导入

适用场景

  • 开发者本地测试和开发

  • 隐私敏感的数据处理

  • 离线环境使用

  • 学习和研究大模型

Ollama 极大地降低了普通人使用大语言模型的门槛,让任何人都能方便地在自己的电脑上体验先进的 AI 技术。

Ollama蒸馏模型介绍

蒸馏模型(Distilled Model)是通过知识蒸馏技术压缩后的小型模型,Ollama 支持运行这类轻量化模型,让普通电脑也能流畅运行 AI。

什么是知识蒸馏?

知识蒸馏就像一个师生学习过程

  • 教师模型:大型模型(如 700 亿参数的 Llama),知识丰富但运行慢

  • 学生模型:小型模型(如 70 亿参数),学习模仿教师模型的输出

  • 结果:学生模型体积小、速度快,同时保持接近教师模型的性能

Ollama 支持的蒸馏模型

1. Llama 3.2 系列(Meta)

  • 1B 和 3B 参数版本

  • 适合移动设备和低配置电脑

  • 保持较好的对话能力

2. Phi-3 系列(微软)

  • Mini(3.8B)、Small(7B)版本

  • 微软精心挑选训练数据

  • 小尺寸但推理能力强

3. Gemma 系列(Google)

  • 2B 和 7B 参数

  • 基于 Gemini 技术蒸馏而来

  • 开源免费商用

4. Qwen 系列(阿里)

  • 0.5B、1.8B、4B、7B 版本

  • 中英文能力均衡

  • 适合中文场景

蒸馏模型在 Ollama 中的优势

性能对比(以 Llama 3 为例):

模型参数内存需求速度适用设备
原版70B>140GB服务器
蒸馏版8B~16GB个人电脑
蒸馏版3B~6GB极快笔记本/RPi

实际好处

  • 普通电脑(8-16GB 内存)也能运行

  • 生成速度快 3-10 倍

  • 功耗低,适合长时间运行

  • 硬盘空间占用小

Ollama下载安装

ollama下载地址:

https://ollama.com/

点击 下载即可。

下载到本地后,我们双击安装:

出现下面这个界面,就说明安装好了

默认界面还是很简约的,提供了聊天对话框,以及右侧可以选择模型,我们可以搜索然后下载需要的模型

这里面每个模型后面都有多少b,比如4b,这个b就是10亿参数,4b就是40亿参数,我们根据当前机器的显卡显存大小来选择具体的参数模型,比如你电脑就4个G的显存,那就选个4b,如果是高配32G显存,那基本都能跑。

比如我们选择一个4b(40亿参数)的qwen模型,去提问“你是谁?”,那么Ollama先会自动下载模型,然后回答问题。

下载完后,就自动回答你的问题。

http://www.jsqmd.com/news/920479/

相关文章:

  • 用Python玩转模拟退火算法:从物理退火到TSP路径优化的保姆级实战
  • 工业语音识别:从降噪到领域自适应,攻克垂直行业落地挑战
  • 从理论到硅片:用Cadence 617深入分析差分放大器电流镜负载的‘隐形’性能瓶颈
  • 别再手动复制粘贴了!用EasyPoi 4.1.3搞定Word模板里的列表数据循环生成
  • PHP安全编码避坑指南:从BuyFlag靶场看is_numeric()与strcmp()的常见漏洞
  • MLU vs. GPU:从存储模型到编程范式,深度解析寒武纪Cambricon BANG的异构计算设计哲学
  • 别再只会用KNN了!手把手教你用sklearn的NearestNeighbors做推荐和异常检测
  • 别再只盯着USB硬盘盒了!用闲置电脑给群晖/威联通NAS扩容,打造高性价比‘分布式存储’
  • 如何在Windows上轻松处理PDF:Poppler for Windows完整指南
  • ChatGPT API成本深度解析:从Tokens到模型选型的实战定价指南
  • Hologres V2.1版本建表避坑指南:从‘能用’到‘好用’的五个关键配置
  • 别再到处搜了!高德/百度/ArcGIS地图瓦片URL参数详解与实战拼接指南
  • ENSP实验踩坑实录:USG5500防火墙安全策略配了却不生效?这5个检查点帮你快速排错
  • 如何高效使用AKShare金融数据接口:5个实用技巧指南
  • 别再死记硬背了!用Python实战拆解图机器学习中的三大传统特征(附NetworkX代码)
  • 【Gemini定价策略深度解密】:20年云AI商业分析师亲授Google最新定价逻辑与成本规避技巧
  • MDN接入Deno兼容性数据实战进阶第九篇
  • ROS节点设计模式:如何在C++类中优雅地管理多个NodeHandle(以发布订阅为例)
  • 别再只调学习率了!深入浅出图解目标检测四大IOU Loss的演进与坑点
  • 新手必看:用Pikachu靶场手把手复现XSS攻击(从弹窗到窃取Cookie实战)
  • LIDC-IDRI数据集XML标注解析实战:用Python和pydicom搞定肺结节ROI坐标提取
  • 避开BEVFusion安装的那些“坑”:spconv、mmcv、numpy版本冲突一站式解决指南
  • C166微控制器看门狗与MON166监控程序兼容性解决方案
  • 搞定RK3566安卓11的RTL8211F网卡后,别忘了用iperf3测速和点亮LED状态灯
  • 仿人机器人分层控制框架:ALIP与DSRB模型实践
  • 不止于画图:用GMT6.4的`grdtrack`和`project`命令玩转地形剖面分析与可视化
  • 2026年热门的昆明隐形车衣贴膜/昆明新车隐形车衣/昆明专业隐形车衣热销排行 - 品牌宣传支持者
  • 实测HCNR201A高速模拟隔离电路:从数据手册到面包板,手把手复现与性能验证
  • TCGA数据实战:用R语言DESeq2、edgeR、limma三大包搞定差异表达分析(附完整代码)
  • 别再只弹alert了!在Pikachu靶场中挖掘XSS的5种高级利用姿势