当前位置: 首页 > news >正文

Minimax WebSocket TTS 文档里 bitrate / sample_rate 的真实取值

结论:MiniMax 不支持bitrate=24000,但支持sample_rate=24000

你这里的“24K”要分清两个概念:

参数含义MiniMax 是否支持 24K
bitrate=2400024 kbps 码率不支持
sample_rate=2400024 kHz 采样率支持

MiniMax 官方参数里,sample_rate支持[8000, 16000, 22050, 24000, 32000, 44100],但bitrate只支持[32000, 64000, 128000, 256000],并且bitrate只对mp3生效。WebSocket 示例里也是sample_rate: 32000bitrate: 128000format: mp3。(MiniMax API Docs)

xiaozhi-esp32-server里说的 24K,本质上是24 kHz 采样率的 Opus 音频,不是 MiniMax 输出 24 kbps。项目默认协议配置是:

xiaozhi: audio_params: format: opus sample_rate: 24000 channels: 1 frame_duration: 60

也就是设备端收的是Opus / 24kHz / 单声道 / 60ms帧。(GitHub)

具体到 MiniMax TTS 实现,项目里的minimax_httpstream.py默认设置是:

"sample_rate": 24000, "bitrate": 128000, "format": "pcm", "channel": 1

注意这里是format: pcm,不是mp3,所以bitrate实际不是关键参数;关键是sample_rate=24000。项目还会在打开音频通道时把 MiniMax 的sample_rate更新为连接里的conn.sample_rate。(GitHub)

它的实际链路是:

文本 ↓ MiniMax TTS ↓ 输出 24kHz PCM ↓ xiaozhi-esp32-server 收到 PCM hex ↓ 服务器端重新编码为 Opus ↓ 发送给 ESP32

代码里可以看到,它从 MiniMax 返回数据里取audio_hex,转成 PCM bytes,然后调用opus_encoder.encode_pcm_to_opus_stream()编成 Opus 发给设备。父类也会按conn.sample_rate创建 Opus 编码器。(GitHub)

所以你要这样理解:

MiniMax 不支持 24kbps MP3 但 MiniMax 支持 24kHz PCM xiaozhi 项目再把 24kHz PCM 转成 24kHz Opus

建议 MiniMax 配置保持这样:

"audio_setting": { "sample_rate": 24000, "bitrate": 128000, "format": "pcm", "channel": 1 }

不要写:

"bitrate": 24000

如果你最终想控制的是网络传输码率 24kbps 左右,应该改的是Opus 编码器码率参数,不是 MiniMax 的bitrate。MiniMax 这边只负责输出 24kHz PCM,后面压缩率由服务器 Opus 编码决定。

http://www.jsqmd.com/news/863985/

相关文章:

  • 告别编译焦虑:手把手教你用瑞芯微原厂脚本编译RK3568 Android11镜像(附环境配置避坑指南)
  • 2026沈阳钻石变现好去处,多家正规门店实力客观对比 - 李宏哲1
  • Rainmeter系统监控技术解析:网络带宽与硬件性能监控的实用指南
  • 免费开源字幕编辑器的终极指南:从零基础到专业制作的完整解决方案
  • [研发提效] 2026深度技术展望:制造业新品研发智能化有哪些核心技术方向?
  • 别再死记硬背了!用Spark实战电影评分分析,手把手教你搞定Join操作与数据清洗
  • 深度优先搜索(DFS)框架精讲:一网打尽岛屿系列算法题
  • 2026年无锡黄金变现去哪?这 5 家正规回收店,手镯项链金条都收 - 奢侈品回收测评
  • 广东鸿胜金属设备回收:汕头废旧金属回收排名哪家好 - LYL仔仔
  • 魔兽争霸3现代化兼容助手:让经典游戏在新系统上完美运行
  • [深度洞察] 制造业竞品动态实时监控,未来将实现哪些智能化突破? | 2026企业级Agent技术解析
  • STC8A8K64S4A12单片机PWM调速实战:手把手教你搞定循迹小车的电机驱动与速度控制
  • 2026学习机哪个牌子好?公认好用机型深度解析与选购全攻略 - 博客万
  • 蛋白质结构预测模型的量化优化与硬件加速
  • 如何快速使用R3nzSkin国服换肤工具:免费解锁英雄联盟全皮肤终极教程
  • 上海景丰泰再生资源回收:上海废旧电脑液晶显示屏回收公司 - LYL仔仔
  • JSON数据处理难点解析与实战案例
  • 从‘废弃信号’到规范DBC:避坑指南教你清理Vector CANdb++自动生成的0xC0000000报文
  • 【信息科学与工程学】计算机科学与自动化———第六十四篇 内存 系列一 内存算法06
  • 避坑指南:STM32F407的DAC输出Buffer为啥会导致0V?ADC连续转换模式与DMA配置的细节解析
  • 【深度洞察】2026年制造业招投标智能化全流程的最新发展趋势?企业级Agent解决方案全解析
  • 3d交互拆件 通俗易懂的学习笔记
  • 高效解锁B站视频下载:bilibili-downloader智能工具完整指南
  • Claude Code 用户应对访问限制的备选方案与 Taotoken 接入价值
  • Amphenol ICC ND9ACA2B0A 线束组件应用与替代方案解析
  • Agent_Skills_万千应用_第03篇_PPT 生成 Skill:从资料到可演示幻灯片
  • 7步掌握思源宋体TTF:从零基础到专业应用全攻略
  • 5月最新10款降AI神器实测:哪个能降知网维普AI率,从99.5%降至3.8%可信吗?
  • scalar参数在顶层接口中综合说明
  • 别再手动调图了!用LaTeX的subcaption包搞定论文子图排版(附完整代码)