当前位置：首页 > news >正文

人工智能案例运行为什么会出现卡死的状态？

news 2026/7/7 0:22:09

两个问题一次性解决：警告解释 + 代码卡死原因 + 修复方案

我直接给你最清晰、最实用、能立刻解决问题的答案，不绕弯子。

一、先解释这个警告（不影响运行，只是提示）

The tied weights mapping and config for this model specifies to tie model.embed_tokens.weight to lm_head.weight, but both are present in the checkpoints, so we will NOT tie them. You should update the config with `tie_word_embeddings=False` to silence this warning

简单翻译

模型配置说要共享权重，但模型文件里已经有两套独立权重，所以库自动帮你关闭了共享。
你只需要加一句配置就能消除这个警告。

二、关键问题：为什么输入`How many r's in strawberries?`会卡死？

核心原因：

max_new_tokens=32768

你让模型最多生成 32768 个 token（≈2 万字）！
Qwen3-1.7B 模型在 CPU / 普通显卡上生成这么长文本，会直接卡死、无响应。

次要原因

模型生成时没有加eager_execution/use_cache等优化，小模型容易卡住。

三、立刻能跑的修复代码（复制即用）

fromtransformersimportAutoTokenizer,AutoModelForCausalLM model_name="Qwen/Qwen3-1.7B"tokenizer=AutoTokenizer.from_pretrained(model_name)# 修复警告 + 防止卡死model=AutoModelForCausalLM.from_pretrained(model_name,torch_dtype="auto",device_map="auto",tie_word_embeddings=False# 消除警告)# 你的问题text="How many r's in strawberries?"# 构造输入model_inputs=tokenizer([text],return_tensors="pt").to(model.device)# 生成：关键！把 max_new_tokens 改小！generated_ids=model.generate(**model_inputs,max_new_tokens=30,# 只生成30个token，超快！pad_token_id=tokenizer.eos_token_id,do_sample=False# 禁用随机，更快)# 提取回答output_ids=generated_ids[0][len(model_inputs.input_ids[0]):].tolist()response=tokenizer.decode(output_ids,skip_special_tokens=True)print("\n问题：",text)print("回答：",response)

四、关键修复点总结（必看）

tie_word_embeddings=False
消除警告，不影响模型效果。
max_new_tokens=30
从 32768 → 改成 30~100，立刻不卡死。
普通问题只需要几十 token 就回答完了。
pad_token_id=tokenizer.eos_token_id
防止生成时无限等待。
do_sample=False
用贪心搜索，生成速度最快，不卡顿。

五、运行后你会得到正确答案

How many r's in strawberries? There are 3 r's in the word strawberries.

最终总结

警告：加tie_word_embeddings=False即可消除
卡死：因为max_new_tokens=32768太大，改成 30~100 立刻解决
上面的修复代码直接复制就能跑

查看全文

http://www.jsqmd.com/news/503164/

【嵌入式开发】keil5安装——兼容C51和STM32

编程语言扩展与驱动交互

STM32WB55芯片被锁？3步搞定解锁（附STM32CubeProgrammer详细操作截图）

移动开发中 RxSwift 的通知处理方案

从开发到灾备：一文读懂软件部署的六大核心环境

品牌推广方案怎么写？2026年附结构模板与KPI表

开源硬件控制工具GHelper：华硕笔记本性能优化解决方案

AK/SK vs 公钥私钥：从原理到实战的深度解析（你真的懂了吗？）

深入解析 Cloudflare 与 GitHub Pages 的 CDN 加速机制

AtlasOS系统性能优化终极指南：从瓶颈诊断到持续优化的完整方案

C++ SOCKET编程：同步阻塞与异步非阻塞通信服务端和客户端代码，支持多连接、断线重连及详...

协同过滤算法黔醉酒业白酒销售系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】

Axure原型设计进阶：用Echarts实现这5种高级数据可视化（附代码片段库）

突破传统：用神经网络算子技术构建高效PDE求解器

Local Moondream2环境部署：解决transformers版本冲突的标准化容器方案

Spring Boot Actuator实战：5分钟搞定健康监控与自定义端点配置

探索FancyZones：重新定义Windows数字工作坊的艺术

EmbeddingGemma-300m快速部署：Ollama一键安装与开箱即用教程

暗黑4 d3d12.dll找不到解决方法：安全修复教程与工具对比

MRAM的挑战与机遇：为什么它还没完全取代DRAM和FLASH？

手把手教你用雷池WAF打造企业级错误页面：自定义配色+品牌元素植入指南

磁盘性能优化实战：从容量计算到寻址时间降低的5个技巧

ADB命令实战：5分钟搞定测试机短信、电话、定位模拟（附常用命令清单）

安全修复暗黑4 d3d12.dll缺失：官方工具与系统修复步骤

2026年东莞文创潮玩厂家哪家好？文创 IP 定制工厂、文创潮玩厂家、文创源头工厂选择指南 - 海棠依旧大

为什么KAN+iTransformer在时间序列预测中表现优异？深入解析其核心机制

LiDAR与IMU联合标定实战——从点云到大地坐标系的精准转换

3个生活化场景拆解，零技术也能懂Agent自动

AI Agent 落地实战系列 (一)：腾讯混元 AI Agent vs EasyClaw 全维度技术实测与选型指南

【MCP协议企业级落地白皮书】：20年架构师实测REST API吞吐量下降47%的真相与迁移决策清单