当前位置: 首页 > news >正文

谷歌翻译在 Gemini 获得了重大升级,APP 翻译更实时

谷歌正在为其 Gemini 音频模型推出一次重大更新,为谷歌翻译(Google Translate)应用带来强大的实时语音到语音翻译功能。此次升级采用了改进后的 Gemini 2.5 Flash Native Audio 模型,专为处理复杂的语音交互而设计。

这项全新的实时语音翻译功能专为耳机用户打造,让你能实时听到周围世界被翻译成你所理解的语言。这一测试版功能现已在谷歌翻译应用中上线。无论你是在旅行途中,还是需要跨越语言障碍进行沟通,这项功能都可能彻底改变你与母语不同的人交流的方式。

该功能分为两种模式。第一种是“持续聆听”模式,非常适合听讲座或参与多人对话等场景。人工智能可同时识别多种语言,并将它们全部转换为你设定的目标语言。你只需戴上耳机,就能直接听到被翻译后的内容。第二种是“双向对话”模式。

该模式支持两种特定语言之间的实时互译,并能根据说话人自动切换翻译语言。例如,如果你说英语,而对面的人说印地语,你将在耳机中即时听到英语翻译;当你回应时,你的手机会立即将你说的话翻译成印地语并播放出来。

让这项功能真正脱颖而出的细节在于“风格迁移”技术。它能让用户听到人类语音中的细微差别 —— 系统会模仿说话者的真实声音,匹配其语速和语调,使翻译听起来不再机械生硬。此外,系统还具备强大的降噪能力,即使身处嘈杂的户外环境,你也能轻松顺畅地进行对话。

翻译覆盖范围极为广泛,支持70多种语言、超过2,000种语言组合。如此广泛的语种支持得益于 Gemini 强大的音频处理能力与其庞大的语言数据库的结合。

另一项关键特性是多语言输入与自动检测功能。系统可在单次会话中同时识别多种语言,你无需手动调整设置,甚至不需要知道对方说的是哪种语言 —— 应用会自动识别并立即开始翻译。

这一切背后的核心是全新升级的 Gemini 2.5 Flash Native Audio 模型,该模型同时也为谷歌多个产品中的实时语音助手提供支持。谷歌在三个关键技术领域对该模型进行了优化,从而为用户带来更迅捷流畅的体验。

首先,模型现在具备更精准的函数调用能力,这意味着当系统需要连接外部工具时更加可靠。例如,在你说话的同时,它能实时获取最新数据,而不会中断或打断对话流程。谷歌表示,新版本对开发者指令的遵循率已达到 90%,高于此前版本的 84%。

其次,对话本身也变得更加连贯。模型能够记住你在聊天早期说过的内容,从而更好地保持话题一致性,避免出现支离破碎的对话体验。可以说,这种多轮对话质量的提升,正是任何语音助手实现稳定性的关键所在。

这些改进不仅限于谷歌翻译应用。新的 Gemini 2.5 Flash Native Audio 模型正逐步集成到谷歌的多个产品中,包括 Google AI Studio、Vertex AI、Gemini Live 以及 Search Live。用户未来在使用 Gemini Live 进行头脑风暴,或在Search Live中获取实时帮助时,都将获得更高效、更智能的体验。

如果你想亲自体验这项实时翻译功能,测试版即日起已在谷歌翻译应用中推出。只需将耳机连接到设备,点击“实时翻译”即可开始使用。目前该功能仅在美国、墨西哥和印度的 Android 设备上可用,iOS 版本及更多地区的支持将很快推出。

http://www.jsqmd.com/news/94767/

相关文章:

  • 基于博途1200plc的堆垛立体车库设计:IO分配表、电气接线图、PLC程序、组态界面程序与动画仿真
  • 【沈阳航空航天大学】C++Qt小型宿舍管理软件[2025-12-15]
  • 警惕Vibe Coding ,Agentic Coding认知升级与实践避坑指南
  • SQL语句执行很慢,如何分析呢?
  • AI大模型:重构产业生态的核心引擎
  • 最近在搞风光储联合发电系统的仿真,发现直驱风机和光伏逆变器的配合特别有意思。今天就跟大伙儿唠唠这个模型搭建时遇到的坑,顺便分享几个关键模块的调参心得
  • 测试框架选型指南:哪种最适合你?
  • Word生成PPT好不好用?2025年自动转换工具真实体验评测
  • 基于MPPT控制的光伏混合储能系统仿真模型:电池连续供电+超级电容瞬时响应,Boost与双向B...
  • 敏捷第15讲:需求变更控制——迭代做了一半老板突然要加“春节红包”,接还是不接?
  • 基于MATLAB Simulink的电动汽车ABS模型搭建与解析:包含制动力与滑移率计算等详尽...
  • iOS In-App Purchase 自动续订订阅完整实现指南
  • 在路径规划的世界里,A星算法和人工势场法(APF)是两个经典的选手。今天,我们就来聊聊如何将这两个算法进行改进,并结合起来,实现更高效的路径规划
  • Hutool工具库实战:8大核心工具类深度解析
  • 构建高效性能自动化监控体系的五大核心策略
  • 基于开源AI智能名片链动2+1模式的S商城小程序在银发族旅拍消费中的创新应用研究
  • 回归单体架构到底是不是技术倒退
  • 两级套筒共源共栅全差分放大器实战手记
  • MATLAB代码:含先进绝热压缩空气储能系统的综合能源系统优化调度 关键词:先进绝热压缩空气储...
  • WebRTC 架构概览(整体框架篇)
  • 转动惯量和阻尼系数协同自适应控制策略。 建立 VSG 的数学模型,分析各参数对系统输出特性的影响
  • Python设计模式:访问者模式详解
  • iOS 组件化:模块拆分、依赖反转、解耦实践
  • 【Linux网络编程】UDP Socket
  • 别再迷信Agent了! Claude大佬一语道破:Agent太“聪明”反而不专业,真正的未来是“Skills”!
  • 31、Linux进程管理实战:回收机制、exec族函数与路径操作
  • 测试数据管理的自动化解决方案
  • 风储联合调频+光伏变压减载的Simulink仿真模型:‘风机虚拟惯量调频‘、‘储能下垂控制联合...
  • 信捷XDPLC与台达DT330温控器:多设备通讯启停控制程序及实用指南
  • 如何利用智能客服大脑提升服务效率?