当前位置：首页 > news >正文

语音技术助力非标准语音人群沟通

news 2026/7/10 4:51:41

Voiceitt将语音革命延伸至非标准语音人群

根据某机构的数据，美国约有750万人存在语音使用障碍。随着计算机技术从基于文本转向基于语音的界面，非标准语音人群面临着被边缘化的风险。

Voiceitt致力于确保这种情况不会发生。通过Voiceitt，客户可以训练适应其语音模式的个性化语音识别模型，使他们能够与语音控制设备或其他人进行交流。

应用程序功能

Voiceitt的界面是一个iOS移动应用程序，具有两种模式：

对话模式：让客户使用合成语音和手机扬声器与他人交流
智能家居模式：让客户与语音助手互动

每种模式都有一套语音类别。对话模式的类别包括交通、购物和医疗就诊等场景；智能家居模式则是语音助手功能，如灯光、音乐和电视控制。

非标准语音建模技术

识别非标准语音与普通语音识别在一些基本方面存在差异。当训练数据稀疏时，自动语音识别(ASR)的常见方法是流水线方法。在这种方法中，声学模型将声学数据转换为音素；"词典"提供音素的候选词级解释；语言模型通过考虑每种可能性来裁决可能的词级解释。

Voiceitt没有使用循环神经网络，而是使用卷积神经网络，该网络将更大块的声学信号作为输入。卷积神经网络最初设计用于在图像中寻找特定像素模式，同样可以在信号中寻找关键声学模式。

"只要客户的发音保持一致，这就给了我们利用这种一致性的机会，"Voiceitt语音识别团队负责人表示。"发音不必遵循标准词典。"

持续学习与未来规划

当客户训练他们的自定义模型时，Voiceitt使用他们录制的语音进行训练和测试。一旦模型的输出置信度超过某个阈值，该短语就被"解锁"，客户可以开始使用它来控制语音助手或与他人交流。

但训练并不会停止。每次客户使用短语时，都会为模型提供更多训练数据，Voiceitt表示会持续更新模型以提高性能。

目前，Voiceitt有限的操作菜单意味着可以为每个客户学习并存储单独的模型。但Voiceitt计划显著扩展服务规模，因此研究人员正在研究更有效的训练和存储模型的方法。
更多精彩内容请关注我的个人公众号公众号（办公AI智能小助手）或者我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号（网络安全技术点滴分享）

公众号二维码

公众号二维码