当前位置: 首页 > news >正文

人工智能案例运行为什么会出现卡死的状态?

两个问题一次性解决:警告解释 + 代码卡死原因 + 修复方案

我直接给你最清晰、最实用、能立刻解决问题的答案,不绕弯子。


一、先解释这个警告(不影响运行,只是提示)

The tied weights mapping and config for this model specifies to tie model.embed_tokens.weight to lm_head.weight, but both are present in the checkpoints, so we will NOT tie them. You should update the config with `tie_word_embeddings=False` to silence this warning

简单翻译

模型配置说要共享权重,但模型文件里已经有两套独立权重,所以库自动帮你关闭了共享。
你只需要加一句配置就能消除这个警告。


二、关键问题:为什么输入How many r's in strawberries?卡死

核心原因:

max_new_tokens=32768

你让模型最多生成 32768 个 token(≈2 万字)
Qwen3-1.7B 模型在 CPU / 普通显卡上生成这么长文本,会直接卡死、无响应

次要原因

模型生成时没有加eager_execution/use_cache等优化,小模型容易卡住。


三、立刻能跑的修复代码(复制即用)

fromtransformersimportAutoTokenizer,AutoModelForCausalLM model_name="Qwen/Qwen3-1.7B"tokenizer=AutoTokenizer.from_pretrained(model_name)# 修复警告 + 防止卡死model=AutoModelForCausalLM.from_pretrained(model_name,torch_dtype="auto",device_map="auto",tie_word_embeddings=False# 消除警告)# 你的问题text="How many r's in strawberries?"# 构造输入model_inputs=tokenizer([text],return_tensors="pt").to(model.device)# 生成:关键!把 max_new_tokens 改小!generated_ids=model.generate(**model_inputs,max_new_tokens=30,# 只生成30个token,超快!pad_token_id=tokenizer.eos_token_id,do_sample=False# 禁用随机,更快)# 提取回答output_ids=generated_ids[0][len(model_inputs.input_ids[0]):].tolist()response=tokenizer.decode(output_ids,skip_special_tokens=True)print("\n问题:",text)print("回答:",response)

四、关键修复点总结(必看)

  1. tie_word_embeddings=False
    消除警告,不影响模型效果。

  2. max_new_tokens=30
    从 32768 → 改成 30~100,立刻不卡死
    普通问题只需要几十 token 就回答完了。

  3. pad_token_id=tokenizer.eos_token_id
    防止生成时无限等待。

  4. do_sample=False
    用贪心搜索,生成速度最快,不卡顿。


五、运行后你会得到正确答案

How many r's in strawberries? There are 3 r's in the word strawberries.

最终总结

  • 警告:加tie_word_embeddings=False即可消除
  • 卡死:因为max_new_tokens=32768太大,改成 30~100 立刻解决
  • 上面的修复代码直接复制就能跑
http://www.jsqmd.com/news/503164/

相关文章:

  • 【嵌入式开发】keil5安装——兼容C51和STM32
  • 编程语言扩展与驱动交互
  • STM32WB55芯片被锁?3步搞定解锁(附STM32CubeProgrammer详细操作截图)
  • 移动开发中 RxSwift 的通知处理方案
  • 从开发到灾备:一文读懂软件部署的六大核心环境
  • 品牌推广方案怎么写?2026年附结构模板与KPI表
  • 开源硬件控制工具GHelper:华硕笔记本性能优化解决方案
  • AK/SK vs 公钥私钥:从原理到实战的深度解析(你真的懂了吗?)
  • 深入解析 Cloudflare 与 GitHub Pages 的 CDN 加速机制
  • AtlasOS系统性能优化终极指南:从瓶颈诊断到持续优化的完整方案
  • C++ SOCKET编程:同步阻塞与异步非阻塞通信服务端和客户端代码,支持多连接、断线重连及详...
  • 协同过滤算法黔醉酒业白酒销售系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • Axure原型设计进阶:用Echarts实现这5种高级数据可视化(附代码片段库)
  • 突破传统:用神经网络算子技术构建高效PDE求解器
  • Local Moondream2环境部署:解决transformers版本冲突的标准化容器方案
  • Spring Boot Actuator实战:5分钟搞定健康监控与自定义端点配置
  • 探索FancyZones:重新定义Windows数字工作坊的艺术
  • EmbeddingGemma-300m快速部署:Ollama一键安装与开箱即用教程
  • 暗黑4 d3d12.dll找不到解决方法:安全修复教程与工具对比
  • MRAM的挑战与机遇:为什么它还没完全取代DRAM和FLASH?
  • 手把手教你用雷池WAF打造企业级错误页面:自定义配色+品牌元素植入指南
  • 磁盘性能优化实战:从容量计算到寻址时间降低的5个技巧
  • ADB命令实战:5分钟搞定测试机短信、电话、定位模拟(附常用命令清单)
  • 安全修复暗黑4 d3d12.dll缺失:官方工具与系统修复步骤
  • 2026年东莞文创潮玩厂家哪家好?文创 IP 定制工厂、文创潮玩厂家、文创源头工厂选择指南 - 海棠依旧大
  • 为什么KAN+iTransformer在时间序列预测中表现优异?深入解析其核心机制
  • LiDAR与IMU联合标定实战——从点云到大地坐标系的精准转换
  • 3个生活化场景拆解,零技术也能懂Agent自动
  • AI Agent 落地实战系列 (一):腾讯混元 AI Agent vs EasyClaw 全维度技术实测与选型指南
  • 【MCP协议企业级落地白皮书】:20年架构师实测REST API吞吐量下降47%的真相与迁移决策清单