当前位置：首页 > news >正文

【Python】免费的中文 AI 配音方案

news 2026/7/17 23:03:56

免费
高质量
免密钥
需联网

edge_tts是一个利用Microsoft Edge 浏览器在线 TTS（文本转语音）服务的非官方 Python 库。
它无需微软 API 密钥，即可调用 Edge 内置的高质量神经网络语音合成引擎，将文本转换为自然语音并保存为音频文件。

核心特点

特性	说明
免费无密钥	直接调用 Edge 的在线 TTS 接口，无需 Azure 订阅或 API Key
语音质量高	基于微软最新的神经网络 TTS，中文（如 Xiaoxiao、Yunyang）发音自然流畅
支持 SSML	可使用语音合成标记语言精细控制语速、音调、停顿、多语音切换
多种输出格式	支持 MP3、WEBM、OGG 等格式（实际为流媒体封装）
异步设计	基于`asyncio`和`aiohttp`，适合批量处理或集成到异步应用

安装

pipinstalledge-tts

依赖极少，主要需要aiohttp（会自动安装）。

基础用法

1. 命令行快速使用（无需写代码）

安装后自带edge-tts和edge-playback命令：

# 查看所有可用语音edge-tts --list-voices# 中文语音合成并保存edge-tts--voicezh-CN-XiaoxiaoNeural--text"你好，这是微软 Edge 的文本转语音演示。"--write-media output.mp3# 调整语速（+50%）和音量（+10%）edge-tts--voicezh-CN-YunyangNeural--rate+50%--volume+10%--text"加速播放测试"--write-media fast.mp3

2. Python 代码使用

importasyncioimportedge_tts TEXT="你好，欢迎使用 edge_tts 库。这是由微软 Edge 提供的高质量中文语音合成。"VOICE="zh-CN-XiaoxiaoNeural"# 中文女声OUTPUT_FILE="test.mp3"asyncdefmain():communicate=edge_tts.Communicate(TEXT,VOICE)awaitcommunicate.save(OUTPUT_FILE)if__name__=="__main__":asyncio.run(main())

进阶功能

使用 SSML 精细控制

SSML（Speech Synthesis Markup Language）可以控制停顿、语气、多角色对话：

importasyncioimportedge_tts SSML=""" <<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="zh-CN"> <voice name="zh-CN-XiaoxiaoNeural"> 你好，<<break time="500ms"/> 这是带停顿的语音。 <prosody rate="slow" pitch="+10%">这句话语速较慢，音调较高。</prosody> </voice> </speak> """asyncdefmain():communicate=edge_tts.Communicate(SSML,voice="zh-CN-XiaoxiaoNeural")awaitcommunicate.save("ssml_output.mp3")asyncio.run(main())

流式获取音频数据

适合边下载边播放，无需等待完整文件：

importasyncioimportedge_ttsasyncdefstream_tts():communicate=edge_tts.Communicate("流式播放测试","zh-CN-YunyangNeural")asyncforchunkincommunicate.stream():ifchunk["type"]=="audio":# chunk["data"] 是音频字节流，可实时写入播放器print(f"收到音频块:{len(chunk['data'])}bytes")elifchunk["type"]=="WordBoundary":# 获取每个词的时间边界信息，可用于字幕同步print(f"词:{chunk['text']}, 偏移:{chunk['offset']}ms")asyncio.run(stream_tts())

批量处理与语音切换

importasyncioimportedge_tts voices=["zh-CN-XiaoxiaoNeural","zh-CN-YunyangNeural","zh-CN-XiaohanNeural"]text="同样的文本，不同的声音。"asyncdefbatch():tasks=[]forvoiceinvoices:communicate=edge_tts.Communicate(text,voice)tasks.append(communicate.save(f"{voice}.mp3"))awaitasyncio.gather(*tasks)asyncio.run(batch())

常用中文语音列表

语音 ID	性别/风格	特点
`zh-CN-XiaoxiaoNeural`	女	自然、温暖，最常用
`zh-CN-YunyangNeural`	男	新闻播报风格，沉稳
`zh-CN-XiaohanNeural`	女	抒情风格，柔和
`zh-CN-XiaomoNeural`	女	多种情感风格可选
`zh-CN-YunxiNeural`	男	年轻、活泼
`zh-CN-XiaoruiNeural`	女	成熟、专业
`zh-CN-YunjianNeural`	男	老年、叙事风格