当前位置: 首页 > news >正文

离线大模型的种类

下载离线大模型

在下载离线大模型前,要先在命令行执行下面的pip安装命令:

pip install modelscope

接着命令行通过cd命令进入Python工程的所在目录,再执行下面的模型下载命令:

modelscope download --model Qwen/Qwen1.5-1.8B-Chat --local_dir qwen1.5-1.8b-chat

上面下载命令的“--model”参数表示离线大模型为“Qwen/Qwen1.5-1.8B-Chat”,而“--local_dir”参数表示离线大模型的本地保存目录。

注意Qwen1.5-1.8B-Chat的总大小为3.69GB,下载过程较耗时,请耐心等待。下载完毕,即可在Python工程的目录下方找到qwen1.5-1.8b-chat文件夹,里面保存的便是Qwen1.5-1.8B-Chat的具体模型文件。

三、使用离线大模型输出摘要

接下来演示如何使用Qwen1.5-1.8B-Chat对一段文本生成摘要。在编写Python代码前,要先在命令行执行下面的pip安装命令:

pip install transformers

然后编写下面的Python摘要测试代码:

from transformers import AutoTokenizer, AutoModelForCausalLM model_path = "./qwen1.5-1.8b-chat" # 离线大模型的本地保存目录 def local_model_summary(text: str, max_new_tokens=256) -> str: """ 加载本地离线模型 Qwen1.5-1.8B-Chat 做摘要 【无需联网、无需下载、纯本地运行】 """ # 加载本地分词器 + 本地模型(完全离线) tokenizer = AutoTokenizer.from_pretrained( model_path, trust_remote_code=True # Qwen 必须加这个 ) model = AutoModelForCausalLM.from_pretrained( model_path, trust_remote_code=True, # Qwen 必须加这个 dtype="auto", device_map="auto" ).eval() # 构造 Qwen1.5 官方对话格式 messages = [ {"role": "system", "content": "请对用户输入的内容做精简摘要,摘要文字压缩在50字以内"}, {"role": "user", "content": text} ] # 官方模板构造 text_input = tokenizer.apply_chat_template( messages, tokenize=False, add_generation_prompt=True ) inputs = tokenizer( [text_input], return_tensors="pt", truncation=True ).to(model.device) # 离线生成摘要 outputs = model.generate( **inputs, max_new_tokens=max_new_tokens, # 返回文本最多占用多少Token temperature=0.3, top_p=0.7, do_sample=True, pad_token_id=tokenizer.eos_token_id ) # 提取摘要结果 response = outputs[0][len(inputs["input_ids"][0]):] summary = tokenizer.decode(response, skip_special_tokens=True) return summary.strip() if __name__ == "__main__": content = """ 火山方舟是火山引擎推出的大模型平台,提供模型训练、推理、评测、精调等全方位功能与服务。 平台支持多种主流大模型接入,具有稳定可靠、安全互信的特点。 企业可以通过火山方舟快速构建自己的AI应用,降低开发成本与技术门槛。 """ print("正在使用【本地离线模型】生成摘要...\n") result = local_model_summary(content, max_new_tokens=28) print("【离线摘要结果】") print("-", result)

运行上面的Python代码,输出日志结果如下:

http://www.jsqmd.com/news/1084841/

相关文章:

  • 5分钟掌握IDM永久激活:Windows下载加速神器免费使用终极指南
  • 5分钟快速解决MelonLoader加载问题:从新手到专家的完整指南
  • 为什么顶尖科技公司强制使用JetBrains全家桶?揭秘FAANG内部培训文档流出的8条黄金配置法则
  • 暗黑破坏神2存档编辑终极方案:5分钟掌握网页版角色修改器
  • centos官方镜像源(`mirrorlist.centos.org`)已经彻底关闭,无法访问
  • 3步轻松备份QQ空间:永久保存你的青春记忆 [特殊字符]
  • 5步搞定QQ空间完整备份:你的青春记忆永久保存终极指南
  • PyTorch实战:VGG-16调参技巧助力CIFAR-10分类准确率突破91%
  • 五大突破性功能解析:网盘直链下载解决方案的技术革命
  • MoeKoe Music完全手册:打造你的专属二次元音乐世界
  • 微信好友关系终极检测指南:三步发现谁悄悄删除了你
  • 如何让AI数字人成为你的24小时智能管家:Fay框架深度解析
  • AI动作捕捉:三步实现真人视频转3D虚拟角色动画的终极方案
  • Obsidian PDF++:如何实现沉浸式PDF阅读体验的3个核心设计
  • C++23新特性在CLion 2026.1中的实战体验:std::expected错误处理与协程优化深度评测
  • RA8D2 ADC16H高级调度:组优先级与同步操作实战指南
  • 技术实现:绝区零自动化工具架构设计与高性能算法解析
  • IntelliJ IDEA新建Spring Boot项目全流程拆解:从环境配置到Hello World的7个关键节点
  • FanControl:让Windows电脑风扇控制变得简单智能
  • Java毕设选题推荐:基于智能社区的生鲜团购管理平台的设计与实现 基于线上社区的生鲜团购下单系统的设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】
  • Obsidian Excel插件完整指南:5分钟实现笔记与表格的无缝整合
  • Navicat Premium试用重置终极指南:3步快速恢复14天免费试用期
  • IDEA 快速搭建 MyBatis-Spring Boot 项目(零配置+热加载+SQL监控一体化)
  • Steam创意工坊资源终极下载指南:WorkshopDL免账号下载完整教程
  • 学术写作效率飞跃!2026全能型AI论文平台推荐指南
  • 10分钟极速配置黑苹果:OpCore Simplify智能图形化工具完全指南
  • 不止于治疗:皓贝一口腔医院的预防理念
  • 鹤壁宴席烟酒备,不浪费又体面
  • 嵌入式安全启动实战:从密钥管理到固件加密的CLI工具深度解析
  • 绝区零自动化工具终极指南:5个技巧让你的游戏体验提升300%