当前位置: 首页 > news >正文

LM Studio使用MTP的qwen3.6-27B-以7840hs的780M为例

LM Studio使用MTP的qwen3.6-27B-以7840hs的780M为例

前言

体验了GPU卸载数拉高的好处:https://lizhiyong.blog.csdn.net/article/details/161386515

还有个更加惊喜的功能,那就是最近llama.cppMTP新特性。

更新版本

老版本肯定是不行的,需要更新LM Studio到新版本,7840hs的780M是基于Vulkan运行的,还需要把llama.cpp的依赖版本更新:

实测0.4.14(Build 4)的LM Studio和2.16.0的llama.cpp可运行MTP模型。

启用MTP配置

设置中的开发者模式必开!!!

模型要下载一个有MTP标签的,不然没有MTP开关配置!!!选使用人数更多的unsloth的版本就行。

带MTP的模型就可以启用开关,当然GPU卸载还是要拉满!!!96GB大内存跑30B级别的小模型不存在OOM。重启后配置会生效。

Chat

虎鲸是鱼嘛?

灰常好,GPU负载很高,CPU负载很低,且内存占用>30GB,显然核显开始发力了!!!

Think

思考过程只用了1min32s。

Here's a thinking process:AnalyzeUserInput:Question:虎鲸是鱼嘛?(Isan orca/killer whale a fish?)KeyEntity:虎鲸(Orca/KillerWhale)CoreQuestion:Isit a fish?(Classificationquestion)IdentifyKeyBiologicalFacts:Orca(Orcinusorca)is a marinemammal.ItbelongstothefamilyDelphinidae(oceanic dolphins).Mammalsvs.Fish:Mammalsbreathe airwithlungs,give birthtoliveyoung,nurse themwithmilk,are warm-blooded.Fishbreathe waterwithgills,typically lay eggs,are cold-blooded(mostly),have scales/fins.Therefore,orcas are definitelyNOTfish.FormulateResponse(MentalRefinementinChinese):Directanswer:不是,虎鲸不是鱼。Explainclassification:虎鲸是哺乳动物,属于鲸目海豚科。Keydifferences from fish:用肺呼吸(需要浮出水面换气) 胎生、哺乳 恒温动物 没有鳃和鳞片Addinteresting/contextual info(optional but helpful):虽然生活在海里,外形像鱼,但生物学分类上属于哺乳纲。常被误认为是鱼是因为“鲸”字带“鱼”旁(汉字构字特点),但实际与鱼类完全不同。Keepit concise andaccurate.DraftResponse(Chinese):不是,虎鲸不是鱼。 虎鲸是哺乳动物,属于鲸目海豚科。虽然它生活在海洋中、外形流线型像鱼,但和鱼类有本质区别: 🐋 用肺呼吸(必须定期浮出水面换气) 👶 胎生并用乳汁哺育幼崽 🌡️ 恒温动物(体温稳定) ❌ 没有鳃、鳞片或鱼鳍结构 中文里“鲸”字带“鱼”旁是汉字造字习惯,并不代表它是鱼类。生物学上,虎鲸和海豚、蓝鲸一样,都属于海洋哺乳动物。Self-Correction/Verification:Accuracy:Correct.Orcasare cetaceans(mammals),notfish.Clarity:Cleardistinction between mammals andfish.Language:NaturalChinese,appropriatetone.Structure:Directanswer first,then bullet pointsforkey differences,then etymologynote.Noovercomplication,stays focused on thequestion.Allfacts verified against standard biologicalknowledge.Ready.Outputmatches the draft.

Token生成速度

生成速度达到了6.71t/s。

对比情况

Mode无MTP启用MTP提升比例
Think1min49s1min32s15.6%
Answer3.5t/s6.71t/s91.71%

虽然Think阶段提升不是很大,但Answer阶段接近Double,在GPU卸载最大的情况下,7840hs的780M核显已经枯木逢春!!!本地私有化部署及内网开发从勉强能跑,到基本能用的伟大跃迁。

可以暂时不用急着换AI Max 395和128GB大内存了。

转载请注明出处:https://lizhiyong.blog.csdn.net/article/details/161387982

http://www.jsqmd.com/news/887365/

相关文章:

  • LLM推理优化:内核融合与动态批处理技术解析
  • DeepSeek总结的使用实体-组件-系统和基于存在性处理进行Python编程简介
  • 传统健身追求高强度运动,编写低负担轻健身规划程序,主动碎片化微运动,颠覆苦练健身观念。
  • 从零打造复古辉光管腕表:高压驱动、低功耗与微型化设计实战
  • 从Wi-Fi到蓝牙:DPSK差分相移键控在实际无线通信系统中的应用与MATLAB验证
  • 新手村任务:成为一个架构师需要哪些装备?
  • 航空发动机分布式控制系统关键技术【附代码】
  • 数组专项(二):二维数组、滑动窗口思想
  • 番茄小说下载器终极指南:三步构建你的离线阅读自由王国
  • 告别道路预测老套路:用ParkPredict+模型思路,解决停车场里的‘鬼探头’难题
  • 告别光秃秃的地形:用Unity Terrain Tools打造风格化森林与草地的进阶技巧(附素材资源推荐)
  • Python算法基础篇之分治算法原理与实战
  • 传统日程表塞满任务,编写留白日程规划程序,强制预留放空空白时段,拒绝时间被完全填满。
  • 动态目标跨镜无缝接力追踪技术在旅游景区客流疏导与异常预警场景中的应用白皮书
  • Python装饰器高级模式:从日志到AOP的完整实现
  • 凸优化理论导向的阵列天线方向图综合优化算法【附代码】
  • 基于边缘AI与LoRa的野外监测系统:从硬件设计到云端部署全解析
  • ssm电影网站(10097)
  • D3KeyHelper:暗黑3玩家的智能按键助手,告别重复操作疲劳
  • 基于MAX78000的离线语音控制RGB灯带:端侧AI全流程实践
  • Python自动连连看:计算机视觉如何实现游戏外挂的终极指南
  • 如何在5分钟内免费搭建你的第一个工业级虚拟PLC系统
  • 从社交关系到分子结构:图解GCN(图卷积网络)到底在‘看’什么?
  • 2026年5月正规的金山别墅平层大宅装修机构如何选厂家推荐榜,全案整装设计、全屋定制、别墅装修、旧房翻新厂家选择指南 - 海棠依旧大
  • 智能车竞赛实战:从传感器融合到控制算法的完整开发指南
  • 3步解锁音乐自由:ncmdump实现NCM转MP3的终极指南
  • 告别依赖地狱:用Anaconda虚拟环境一键搞定HiC-Pro 3.1.0安装(附细菌基因组实战配置)
  • 基于THAT1240芯片的平衡-非平衡音频转换器设计与实践
  • AI时代程序员职业发展与个人创业可行性研究报告
  • 2026年5月行业内江苏企业技术中心公司怎么选择厂家推荐榜,省级企业技术中心/国家级企业技术中心/市级企业技术中心认定辅导厂家选择指南 - 海棠依旧大