当前位置: 首页 > news >正文

本地部署AI

【前言】
一直以来,我都深耕于断网开发环境,与外界“绝缘”成了常态。也因此,始终没能真正拥抱AI浪潮,成为一名高频“吃Token”的开发者。趁着今天得闲,决定把本地部署AI的过程记录下来,算是给自己补上一课。

【为什么还要本地部署AI?】
先别急着说“没必要”——如今在线AI和各类桌面端应用已经足够成熟,ChatGPT、Copilot、Claude等随手可用,为什么还要“折腾”本地部署?

我个人的理解,主要有三点:

  1. 数据安全是第一刚需
    工作中涉及内部代码、敏感文档、未公开的算法逻辑,这些数据一旦上传云端,即使厂商承诺“不用于训练”,心理上的“数据出境感”仍然挥之不去。本地部署,数据不出机房,物理隔离,才是真正的“我的数据我做主”。

  2. 自主训练,定制专属模型
    在线大模型虽强,但它是“通用大脑”,不懂你的业务术语、代码规范、项目上下文。本地部署后,你可以用自有数据做微调(Fine-tuning)或RAG,让AI真正懂你的项目,成为专属“副驾驶”。

  3. 离线可用,永不掉线
    对于我这种长期断网环境的“原住民”,网络波动或断连是家常便饭。本地AI随叫随到,不受网络和API配额限制,开发体验更流畅,也无需为Token计费焦虑。

【记录本地部署AI过程】

  1. 一个好看的聊天界面
    我选择的是Ollama
    特别提醒!!! 选择安装的是时候千万不要直接点击进入安装程序
    通过cmd命令行进入安装程序,这样可以选择安装盘,要不然就会安装在C盘.
    例如你的安装包 在D盘file下面 OllamaSetup.exe,
    1打开cmd WIN+R 输入cmd 回车
    直接输入 D: && cd file 进入安装包目录
    2 输入 OllamaSetup.exe /DIR="D:\Ollama"
    等待一段时间安装好
    安装好之后,界面就是这样的下载链接:https://v4.gh-proxy.org/https://github.com/ollama/ollama/releases/latest/download/OllamaSetup.exe

  2. 选择模型
    可根据个人电脑配置选择,我这里选择的是deepseek-r1:7b。
    (本人电脑比较垃圾,勿喷!!!)
    在安装前进入Ollama界面 选择模型存放目录要不然就会默认C盘1打开cmd WIN+R 输入cmd 回车
    输入ollama pull deepseek-r1:7b 等待安装 大概4个多G
    安装好之后
    输入ollama run deepseek-r1:7b
    运行模型 就可以了

  3. 当然也可以在聊天界面 select a model 选择安装的模型

【结语】
当然,本地部署也有门槛——硬件成本、模型选型、推理优化都是挑战。但正如当年从物理机迁移到虚拟化一样,早踩坑,早受益。这篇文章就当作我的“本地AI折腾日志”,希望能给同样身处内网或对数据敏感的朋友一些参考。

http://www.jsqmd.com/news/1101764/

相关文章:

  • 2026能深度定制的日历应用推荐:天乙日历如何兼顾亲友提醒、个人历生成与个人化管理?
  • GitHub Copilot真能提升37%编码效率?一线工程师实测对比报告:从Setup到Daily Use全链路拆解
  • 人工智能(AI)领域中四个最核心的术语及其相互关系
  • 内存命名以及本质和记忆方法
  • 征集时间延期至7月31日 2026“星耀影都”全国微短剧创投季发布延期公告
  • uml中的泳道图一般干什么用
  • 3分钟掌握百度网盘提取码智能获取:免费工具终极指南
  • Fan Control终极指南:免费Windows风扇控制软件完整配置教程
  • 免费Windows网络测速神器:iperf3完整安装与使用终极指南
  • 为什么92%的资深开发者已弃用纯手动Debug?:AI辅助调试工具实战手册,3小时重构故障定位流程
  • 质检数据和财务系统之间,不该隔着一张纸质流转单
  • AutoDL下载解决办法——夸克云盘传输,附Cookie知识讲解
  • 终极指南:如何一键搞定网易云音乐插件管理,告别繁琐手动操作
  • 终极罗技PUBG压枪宏配置指南:5分钟告别后坐力烦恼
  • 【AI编程效率跃迁指南】:20年资深架构师亲授5大实战法则,90%程序员尚未掌握的提效黑科技
  • Ubuntu 18.04 + Docker Compose 快速部署 Eclipse Theia 云 IDE
  • 剪辑气口教程,2026年剪气口工作流,5款对比横评
  • 【C++】实现一个定时器
  • 从基材到成品:PCB材料制造工艺全流程详解
  • HC-SR501人体红外感应模块:从原理到实战的完整指南
  • 零代码实现卡纳达语手写数字识别:Monk框架实战
  • AI编排实战:MuleSoft与LangChain协同架构设计
  • 系统规划与管理师-矛盾论与实践论在系统规划与管理中的应用
  • AI写代码真能替代程序员?2024最新 benchmark 数据揭示:87%的业务场景已可自动化,但92%团队仍在错误使用
  • 程序员私藏的7个AI提效暗器(未公开文档/内部插件/定制Prompt库):腾讯、字节、微软工程师联合披露
  • GLM-5.1全档位开放:面向生产环境的编程意图理解引擎
  • GB28181协议栈架构设计:构建企业级视频监控平台的高可用解决方案
  • 为什么大厂CTO悄悄停用Copilot?2024最新AI编码工具安全审计报告(含代码泄露风险等级TOP3排名)
  • Windows网络性能测试终极指南:如何用iperf3精准测量你的网络带宽
  • 三步解锁Windows 11性能加速:Win11Debloat系统优化完全指南