阶跃星辰发布实时语音大模型 StepAudio 2.5 Realtime,打造更具“活人感”的 AI 聊天搭子
阶跃星辰正式发布了新一代实时语音大模型 StepAudio 2.5 Realtime,其目标是打造更有“活人感”的 AI 聊天搭子。该模型拥有顶级副语言能力,能精准捕捉对话中文字之外的微妙细节,还能以丰富的方式“表达”,成为鲜活、拟人的存在。
副语言是情感传递的主要载体,此模型通过解读语调、语速、停顿等,处理的不仅是表层信息,更是对话者的情绪状态与潜在意图,从而实现真正的自然对话,大幅降低交互成本。
StepAudio 2.5 Realtime 在对话智商与情商方面实现了双重提升。它不仅能深度理解复杂语义、极致抛梗,还能灵活调用多领域知识,提供有深度有洞见的对话体验,甚至能化身专业 HR 帮用户模拟面试。
用户可以通过 API 进行人设自定义,从性格特质、背景经历到语言习惯与对话边界都能精细调节,同时官方也提供 5 个预设人设供用户选择体验。
在定价方面,输入 10 元 / 1M tokens,输出 70 元 / 1M tokens,Step Plan 用户可直接使用,额度复用现有体系。
接入方面,该模型支持国内及海外,上线内容包括开放平台 API、Step Plan、阶跃 AI web 语音体验中心、阶跃 AI 打电话功能。
与主流竞品横向对比,在 step_chat_au 维度(副语言理解)StepAudio 2.5 Realtime 得分 82.18,step_chat_spqa(音频提问 - 音频回答,含 11 种音频理解任务)得分 79.8,显示出其在副语言理解方面的优势。
编辑观点:StepAudio 2.5 Realtime 凭借其独特的副语言能力和双商提升,在实时语音大模型市场具有竞争力,自定义人设也增加了产品的吸引力,未来有望在国内外市场取得不错成绩。
