当前位置：首页 > news >正文

如何安装Ollama并使用Qwen模型

news 2026/7/10 9:42:46

qwen（通义千问）是阿里巴巴推出的一系列大语言模型。和codex一样，它本身不是一个可以直接在终端运行的.exe程序。你不能直接输入qwen来启动它。

要使用 Qwen 模型，通常有以下几种方式，请根据你的需求选择：

情况一：你想在本地运行 Qwen 模型（推荐用于开发/测试）

如果你想在本地电脑上运行 Qwen 模型（例如 Qwen2.5, Qwen-Max 等），你需要借助第三方工具来加载模型文件。目前最流行且简单的方法是使用Ollama或LM Studio。

方案 A：使用 Ollama（最简单，命令行友好）

下载并安装 Ollama:
访问 ollama.com 下载 Windows 版并安装。
拉取 Qwen 模型:
安装完成后，打开新的 PowerShell 窗口，运行以下命令下载 Qwen 模型（以最新的 Qwen2.5 为例）：
```
ollama run qwen2.5
```
注：第一次运行会自动下载模型文件，文件大小取决于版本（几GB到几十GB不等）。
开始对话:
下载完成后，你就可以直接在终端里和 Qwen 对话了。

方案 B：使用 Python 调用 (Transformers / vLLM)

既然你在E:\Project_Soft\Python\...目录下，你可能想用 Python 代码调用它：

安装依赖：

pip install transformers torch accelerate

编写 Python 脚本（例如run_qwen.py）来加载模型，而不是直接在终端输入qwen。

情况二：你想通过 API 使用云端的 Qwen

如果你不想本地部署，而是想调用阿里云的 API：

你需要去阿里云百炼平台获取 API Key。
安装阿里云的 SDK：
```
pip install dashscope
```
编写 Python 脚本来发送请求。同样，没有直接的qwen命令。

情况三：你是否记错了命令？

VS Code?再次确认，如果你是想打开编辑器，命令是code。
其他工具?是否有某个特定的、名字里带 “qwen” 的小众 CLI 工具是你之前听说过的？如果有，请告诉我它的全名或来源，我可以帮你查找具体的安装命令。

总结

直接输入qwen是行不通的。

如果你想立刻在终端体验：请安装Ollama然后运行ollama run qwen2.5。
如果你是开发者：请使用 Python (pip install dashscope或transformers) 编写代码来调用。

在 Windows 上安装 Ollama 并运行 Qwen2.5 模型非常简单。请按照以下步骤操作：

第一步：下载并安装 Ollama

访问官网：
打开浏览器，访问 Ollama 官方网站。
下载 Windows 版：
点击页面上的“Download”按钮（通常会自动识别为 Windows），或者直接进入下载页面下载安装包 (OllamaSetup.exe)。
运行安装程序：
- 双击下载好的OllamaSetup.exe。
- 安装过程中会提示是否将 Ollama 添加到用户环境变量，请务必确认安装成功（通常默认选项即可）。
- 安装完成后，Ollama 会在后台运行（你可以在任务栏右下角的托盘图标中看到它的小羊驼图标）。

第二步：验证安装

安装完成后，关闭当前的 PowerShell 窗口，重新打开一个新的 PowerShell 窗口（这一步很重要，为了让新的环境变量生效）。

输入以下命令检查版本：

ollama--version

如果显示了版本号（例如ollama version 0.x.x），说明安装成功。

第三步：下载并运行 Qwen2.5 模型

Ollama 的模型库中已经收录了阿里通义千问（Qwen）系列。你可以直接通过一条命令拉取并运行。

1. 运行最新版 Qwen2.5 (推荐)

在 PowerShell 中输入：

ollama run qwen2.5

首次运行：Ollama 会自动从网络下载 Qwen2.5 的默认版本（通常是 7B 参数量，约 4-5GB）。下载速度取决于你的网络环境。
下载完成后：终端会显示success，然后直接进入对话模式。你可以直接输入中文或英文与它交流。
- 尝试输入：你好，请用 Python 写一个快速排序算法。
- 退出对话：输入/bye或按Ctrl + D。

2. 运行特定大小的版本 (可选)

如果你的电脑显存（GPU VRAM）有限，或者想要更聪明的模型，可以选择不同参数量的版本：

轻量版 (适合低配电脑/纯CPU):

ollama run qwen2.5:1.5b# 或者ollama run qwen2.5:3b

高性能版 (需要较大显存，建议 16GB+ VRAM):
```
ollama run qwen2.5:14b# 或者ollama run qwen2.5:32b
```
代码专用版 (如果你主要用来写代码):
Qwen2.5-Coder 系列对编程优化更好：
```
ollama run qwen2.5-coder
```

第四步：常用管理命令

在安装和使用过程中，你可能需要用到以下命令：

查看已下载的模型：
```
ollama list
```
删除模型(如果空间不足)：
```
ollamarmqwen2.5
```
更新模型：
```
ollama pull qwen2.5
```

常见问题与优化

下载速度慢/失败：
Ollama 的模型托管在 Hugging Face 等服务器上，国内直接下载可能很慢或中断。
- 解决方法：配置镜像源。在运行ollama pull之前，设置环境变量：
```
$env:OLLAMA_HOST="http://127.0.0.1:11434"# 如果需要配置具体的镜像地址，通常需要修改 Ollama 的服务配置或使用代理工具
```
  更简单的做法：如果下载卡住，可以尝试使用科学上网工具，或者寻找国内的 Ollama 镜像站（如ollama.modelscope.cn，需配置OLLAMA_ORIGINS或直接替换下载源，具体视 Ollama 版本支持情况而定，目前最稳妥的方式仍是保持网络通畅或使用代理）。
运行速度慢：
- Qwen2.5 (7B) 模型建议至少有8GB 内存(纯 CPU 运行较慢) 或6GB 显存(NVIDIA GPU 运行飞快)。
- 如果只有 CPU，建议使用qwen2.5:1.5b或qwen2.5:3b版本。
- 确保你的显卡驱动是最新的。

如何在代码中使用？
安装好 Ollama 后，你可以使用 Python 轻松调用本地模型：

pipinstallollama

importollama response=ollama.chat(model='qwen2.5',messages=[{'role':'user','content':'为什么天空是蓝色的？',},])print(response['message']['content'])

现在，你可以试着在 PowerShell 中输入ollama run qwen2.5开始体验了！

查看全文

http://www.jsqmd.com/news/474018/

ncmdumpGUI：让NCM音乐文件重获自由的格式转换解决方案

EcomGPT-7B技术月刊：追踪AI与Claude Code等编程辅助工具的最新动态

保姆级教程：华硕ROG枪神7超竞版Ubuntu22.04双系统安装全记录

Qwen3.5-35B-A3B-AWQ-4bit从零开始教程：无需Python基础，Web界面完成图文问答全流程

ThinkPad散热革命：TPFanCtrl2如何让你的笔记本冷静高效

NxNandManager完全指南：Nintendo Switch系统安全管理工具从入门到精通

保姆级教程：手把手教你用双RTX 4090部署本地翻译大模型TranslateGemma

Xinference-v1.17.1 VLOOKUP智能升级：Excel数据处理新方案

DriverStore Explorer：Windows驱动管理效率工具的5大突破与实战指南

文档转换到演示文稿的高效解决方案：md2pptx开源工具全解析

openclaw skill--一键生成项目宣讲介绍网页及长截图

Phi-3-Mini-128K模型服务监控与调优：使用Prometheus与Grafana搭建看板

Ostrakon-VL-8B功能体验：不仅能识别商品，还能回答库存、价格等各种问题

Qwen-Image开箱即用：基于CSDN镜像，零配置开启AI绘画之旅

RMBG-2.0在科研绘图中的应用：论文插图中实验装置/细胞图像主体提取

基于RVC和微信公众号的互动游戏：语音猜角色小程序

ANIMATEDIFF PRO精彩案例：胶片颗粒感+暗角+色偏电影LUT风格渲染

Docker环境部署Qwen3-VL-WEBUI：图文AI快速启动，小白友好教程

小白友好！Z-Image-ComfyUI镜像部署指南：Jupyter启动，ComfyUI出图

DAMOYOLO-S模型数据库集成实践：检测结果的结构化存储与查询

Qwen-Image-2512像素艺术生成实操手册：触发词机制与风格控制详解

XHS-Downloader：高效无损采集小红书内容的3步法

STM32嵌入式设备上的轻量级应用：通过LiuJuan模型云端生成国风界面元素

【智能车心得5】独轮组姿态解算与PID调参实战：从零到稳的调试心法

文脉定序系统Anaconda环境快速搭建与依赖管理教程

7倍效率提升：抖音内容批量获取与管理全流程解决方案

3个无屏解决方案：Parsec VDD虚拟显示器从入门到精通

PP-DocLayoutV3应用场景：制药行业SOP文档解析——自动识别操作步骤、安全警示、责任人签名区

RK3288上如何用Gstreamer+OpenCV实现RTSP视频流硬解？保姆级教程