当前位置: 首页 > news >正文

阶跃星辰发布实时语音大模型 StepAudio 2.5 Realtime,打造更具“活人感”的 AI 聊天搭子

StepAudio 2.5 Realtime:打造鲜活拟人的 AI 聊天搭子

阶跃星辰正式发布了新一代实时语音大模型 StepAudio 2.5 Realtime,其目标是打造更有“活人感”的 AI 聊天搭子。该模型拥有顶级副语言能力,能精准捕捉对话中文字之外的微妙细节,还能以丰富的方式“表达”,成为鲜活、拟人的存在。

副语言是情感传递的主要载体,此模型通过解读语调、语速、停顿等,处理的不仅是表层信息,更是对话者的情绪状态与潜在意图,从而实现真正的自然对话,大幅降低交互成本。

双商提升与自定义人设:丰富对话体验

StepAudio 2.5 Realtime 在对话智商与情商方面实现了双重提升。它不仅能深度理解复杂语义、极致抛梗,还能灵活调用多领域知识,提供有深度有洞见的对话体验,甚至能化身专业 HR 帮用户模拟面试。

用户可以通过 API 进行人设自定义,从性格特质、背景经历到语言习惯与对话边界都能精细调节,同时官方也提供 5 个预设人设供用户选择体验。

定价与接入:覆盖国内外市场

在定价方面,输入 10 元 / 1M tokens,输出 70 元 / 1M tokens,Step Plan 用户可直接使用,额度复用现有体系。

接入方面,该模型支持国内及海外,上线内容包括开放平台 API、Step Plan、阶跃 AI web 语音体验中心、阶跃 AI 打电话功能。

与竞品对比:副语言理解优势明显

与主流竞品横向对比,在 step_chat_au 维度(副语言理解)StepAudio 2.5 Realtime 得分 82.18,step_chat_spqa(音频提问 - 音频回答,含 11 种音频理解任务)得分 79.8,显示出其在副语言理解方面的优势。

编辑观点:StepAudio 2.5 Realtime 凭借其独特的副语言能力和双商提升,在实时语音大模型市场具有竞争力,自定义人设也增加了产品的吸引力,未来有望在国内外市场取得不错成绩。

http://www.jsqmd.com/news/786076/

相关文章:

  • 告别手工调格式!Python批量生成Word/PPT,HR和行政同事都惊呆了
  • 小红书无水印下载工具终极指南:5分钟快速上手的完整教程
  • 结构化设计模块—计算机等级—软件设计师考前备忘录—东方仙盟
  • 在敏捷开发中快速集成 AI 能力并控制试错成本
  • 【Gartner×MIT联合验证】:2026年AI落地成功率将暴跌41%——除非你掌握这7个合规性前置设计法则
  • AIUI开源语音对话平台:从架构设计到本地部署的完整指南
  • Google Chrome 静默推送 4GB Gemini Nano 模型,引发隐私合规与气候成本双重担忧
  • Claude for Financial Services
  • CANN ops-cv变更日志
  • 企业内如何通过Taotoken实现AI API的访问控制与审计
  • VR+AI赋能科学发现:从量子光学到沉浸式数据探索
  • AI驱动蛋白质工程:从语言模型与拓扑数据分析到高效工作流构建
  • AI驱动的混合动力公交调度与能耗优化:从理论到工程实践
  • 蚂蚁百灵发布万亿级旗舰思考模型 Ring-2.6-1T,限时免费体验,测评成绩亮眼!
  • Java面试八股文+大厂面试真题!目前最全的IT行业总结,包含所有Java岗位面试干货内容!
  • 多模型聚合平台如何助力提升数据处理任务的稳定性
  • 前端AI集成实战:从gpt4free.js看LLM客户端架构与流式响应处理
  • 多领域生态环境影响评价技术应用与典型案例解析——从农业到水利工程的实践
  • 2026年香港留学服务口碑好的机构:五家优选评测 - 科技焦点
  • CANN/catlass TLA张量详解
  • 火车采集器Google谷歌翻译插件 领取及使用方法
  • 常用接口保护电路设计-ESD浪涌防护
  • 量子人工智能融合:从原理到NISQ时代的混合算法实践
  • gentoo下安装refind
  • 基于聚类与成熟度模型的城市碳排放报告绩效评估方法与实践
  • 如何挑选性价比高的双梁桥式起重机厂家?
  • AI赋能垂直农业:机器学习、计算机视觉与物联网的融合实践
  • 生成式AI驱动智慧车联网:从电池管理到电网调度的四层应用实践
  • 医疗影像AI公平性:合成数据技术如何解决算法偏见
  • 人工做种草 vs AI 做种草|为什么你的 IP 矩阵总做不起来?