当前位置: 首页 > news >正文

QwenTTS 预设音色

import torch import soundfile as sf from qwen_tts import Qwen3TTSModel import os # ============ 1. 设置代理 (如果需要) ============ os.environ['HTTP_PROXY'] = 'http://127.0.0.1:7890' os.environ['HTTPS_PROXY'] = 'http://127.0.0.1:7890' # ============ 2. 定义你要保存模型的【指定文件夹】路径 ============ # 使用绝对路径,例如在D盘创建一个`my_tts_models`文件夹 TARGET_MODEL_DIR = r"D:\AI\short_video\tts\Qwen3-TTS-0.6B-CustomVoice" # 下载目录和导入目录都是要一个啊 # 我是用的github下载的 目录结构不变 git clone https://huggingface.co/Qwen/Qwen3-TTS-12Hz-0.6B-CustomVoic.git # ============ 3. 加载模型 (关键修正) ============ model = Qwen3TTSModel.from_pretrained( r"D:\AI\short_video\tts\Qwen3-TTS-12Hz-0.6B-CustomVoice", # 1. 必须用0.6B 2. 必须用CustomVoice cache_dir=TARGET_MODEL_DIR, # 关键参数:指定下载目录 device_map="cuda", # dtype=torch.float16, # 报错就关掉 # attn_implementation="flash_attention_2", # 如果没装flash-attn,先注释掉 ) # 强制清理GPU缓存并验证 import torch torch.cuda.empty_cache() print(f"当前显存占用: {torch.cuda.memory_allocated(0)/1024**3:.2f} GB") # 检查输入数据 print("模型加载完成,准备生成...") # ============ 4. 生成语音 (使用预设音色的纯TTS) ============ wavs, sr = model.generate_custom_voice( text="沈逸琛遭养子沈寒轩陷害被送精神病院,还被顶替作家身份。沈家逼他替婚石宕村姑娘,殊不知对方是首富千金叶婉晨。二人联手,在作家论坛戳穿沈寒轩真面目,又在招标会曝光其罪行与私生子身份。最终恶人落网,沈逸琛复仇成功,与叶婉晨终成眷属。", language="Chinese", speaker="Uncle_Fu", # 使用预设音色 instruct="用解说文案的语气", # 纯TTS,指令留空。或者直接省略此参数。 ) # ============ 5. 将生成的音频保存到【指定输出文件夹】 ============ TARGET_AUDIO_DIR = r"D:\AI\short_video\tts" # 定义你的音频输出文件夹 os.makedirs(TARGET_AUDIO_DIR, exist_ok=True) # 确保文件夹存在 output_path = os.path.join(TARGET_AUDIO_DIR, "output_custom_voice.wav") sf.write(output_path, wavs[0], sr) print(f"✅ 语音生成成功!模型已下载/加载至:{TARGET_MODEL_DIR}") print(f"✅ 音频文件已保存至:{output_path}")
SpeakerVoice DescriptionNative language
VivianBright, slightly edgy young female voice.Chinese
SerenaWarm, gentle young female voice.Chinese
Uncle_FuSeasoned male voice with a low, mellow timbre.Chinese
DylanYouthful Beijing male voice with a clear, natural timbre.Chinese (Beijing Dialect)
EricLively Chengdu male voice with a slightly husky brightness.Chinese (Sichuan Dialect)
RyanDynamic male voice with strong rhythmic drive.English
AidenSunny American male voice with a clear midrange.English
Ono_AnnaPlayful Japanese female voice with a light, nimble timbre.Japanese
SoheeWarm Korean female voice with rich emotion.Korean
http://www.jsqmd.com/news/299177/

相关文章:

  • MCP 进化:让静态 Tool 进化为具备“上下文感知”的远程 Skills
  • 大模型开发学习路径:从基础知识到工程实战的完整指南
  • 模型量化完全指南:从原理到实战加速大模型推理
  • 2026寒假集训第二周周记录
  • 生命的二元张力:弗洛伊德生的本能与死的本能理论解析
  • 多模态融合技术全解析:从传统架构到GPT-4o的演进之路
  • 大模型训练三阶段全解析:预训练、微调与对齐(程序员必看,建议收藏)
  • 【腾讯实习AI大模型岗位已Offer】大模型面试宝典:高频问题+答案解析,助你轻松通关,建议收藏!
  • Transformer模型详解:从入门到掌握大模型必备基础知识
  • tauri2应用添加系统托盘Tray
  • 大模型的数学工厂:揭秘GPU与TPU如何重塑AI计算架构
  • 大模型学习全攻略:35个核心问题解答+独家AGI-CSDN资料包_2026年AI大模型岗面试面经
  • 智能避障扫地机器人
  • 智能声光感应窗帘系统设计
  • 智能家居环境监测与自动调控系统设计
  • 智能环境测试仪设计
  • 智能环境监测系统设计
  • 智能货车集装箱系统
  • 深入解析:AI重塑就业格局:机遇、挑战与政策应对
  • timefd
  • 《穷查理宝典查理芒格的智慧箴言录》-20万字 最完整版
  • 贾子普世智慧公理(Kucius Axioms of Universal Wisdom)的深度研究与系统论述
  • Linux写sh开机启动脚本-bash报错的两种克服方法
  • VTK 类结构图
  • 基于Spring Boot的长春美食推荐管理系统的设计与实现(源码+论文+部署+安装)
  • 1-1 Java开发环境搭建
  • 本章节我们将讨论如何在 React 中使用表单DFS。
  • 看一遍就懂-大模型架构及encoder-decoder详细训练和推理计算过程
  • 完整教程:Android内核进阶之获取DMA地址snd_pcm_sgbuf_get_addr:用法实例(九十一)
  • CAD二次开发中关于非模态对话框的使用