当前位置: 首页 > news >正文

AI里面的ASR NLU TTS都是什么意思

一、三个缩写全称+大白话解释

1. ASR

全称:Automatic Speech Recognition 自动语音识别
作用:把声音 → 文字
例子:对着麦克风说话,软件把你的语音转换成文本。
一句话总结:听声音,转成字

2. NLU

全称:Natural Language Understanding 自然语言理解
作用:读懂文字的意图。
拿到ASR转出来的文字,AI要明白你想干什么:
比如你说“明天早上7点叫我起床”,NLU识别出:意图=设置闹钟,时间=早7点。
一句话总结:读懂这句话想干什么

3. TTS

全称:Text To Speech 文本转语音
作用:把文字 → 人声音频
AI想好回答文案,再把文字朗读成语音播放出来。
一句话总结:把文字念出声


二、完整对话链路(智能音箱/语音助手标准流程)

  1. 你开口说话 →ASR:语音转文字
  2. 拿到文字句子 →NLU:解析你的指令意图
  3. 后台业务逻辑生成回复文本
  4. 回复文字 →TTS:合成人声播放给你

整条流水线:
语音 → ASR文字 → NLU理解意图 → 生成回答 → TTS语音播报


三、通俗类比

  • ASR = 耳朵,负责听见并写成字
  • NLU = 大脑,负责听懂你的诉求
  • TTS = 嘴巴,负责把答案说出来

http://www.jsqmd.com/news/1103512/

相关文章:

  • 亲测有效!Flutter/OC项目4.3a拒审零套路通关指南✅ 无代过纯干货
  • 【毕业设计】基于 SpringBoot 的大学生勤工助学服务平台的设计与实现 基于 SpringBoot 的校园兼职岗位发布与审核系统(源码+文档+远程调试,全bao定制等)
  • C++23新特性全方位详解|CLion适配、实战代码、性能优化、工程迁移指南
  • 从项目管理看企业活动策划:如何把一场发布会拆解为可交付系统
  • 终极免费RPA神器:taskt零代码自动化完整指南
  • 缓解模型关系幻觉(关系感知视觉增强)
  • BOM清单:SMT贴片产线上被低估的“指挥中枢”
  • 【真能学会】小鼠新生表皮角质形成细胞(NEK)原代细胞的分离、培养和鉴定protocol
  • 如何用Python命令行工具打造你的终极个人音乐库:netease-cloud-music-dl完全指南
  • UVA340 猜数字游戏的提示 Master-Mind Hints
  • Windows驱动管理终极指南:Driver Store Explorer完全使用教程
  • CR2032电池供应商有哪些?国内外主要CR2032生产厂家盘点
  • 租车系统源码:一个源码级租车创业解决方案
  • 2026 TCL华星光电标杆研学参访|全球显示科技智能制造考察预约指南
  • 30+平台文档一键保存:kill-doc如何让免费文档下载变得如此简单
  • WarcraftHelper终极指南:3步搞定魔兽争霸3所有历史兼容性问题
  • 2026深度实测|适合团队的编程助手权威推荐,AI技术债治理落地全方案
  • 如何用novelWriter实现高效小说创作:从零到完整作品的完整指南
  • Parsec虚拟显示器:为Windows系统打造完美的屏幕扩展解决方案
  • 罗技PUBG压枪宏:5分钟快速配置终极指南,告别后坐力烦恼
  • 如何在3小时内构建企业级可视化工作流平台:RuoYi-Flowable-Plus完整指南
  • 工业品短视频获客/自然流量锐减询盘下滑?工业品短视频获客本地推完整投放方案
  • 物联网安全连接实战:A5000与STM32F412ZG的TLS协议实现
  • 告别黑屏切换:Borderless Gaming如何重新定义Windows游戏体验
  • WarcraftHelper完整指南:彻底解决魔兽争霸3兼容性问题的终极免费工具
  • 收藏!大模型入门必知核心知识,小白程序员快速上手指南
  • 2026年AI聚合API中转站横评实测:六大平台横向对比,企业级生产环境下该怎么选择API聚合平台?
  • 拆解开题写作全流程:paperxie 分层式智能开题功能,打通科研起步卡点
  • 大模型驱动软件工程:小白也能学会的AI研发新范式(收藏版)
  • 基于PLC的信号交通灯(西门子S7-1200 PLC;串行通信;15000字;高质量;组态设计)