当前位置: 首页 > news >正文

【语音】笔记

1 傅里叶变换

单帧信号x1 -> 基信号1(频率f1) -> 映射到同频率正余弦函数 -> 得到复数向量a[1] + b[1]j -> 计算绝对值得到|X[1]| 基信号2(频率f2) -> 映射到同频率正余弦函数 -> 得到复数向量a[2] + b[2]j -> 计算绝对值得到|X[2]| ... 基信号i(频率fi) -> 映射到同频率正余弦函数 -> 得到复数向量a[i] + b[i]j -> 计算绝对值得到|X[i]| 单帧信号x2 -> 基信号(频率f1) -> 映射到同频率正余弦函数 基信号(频率f2) -> 映射到同频率正余弦函数 ... 基信号(频率fi) -> 映射到同频率正余弦函数 ...

其中,复数的实部a[i]表示对于该基信号分量在余弦波上的投影强度,虚部b[i]对应于在正弦波上的投影强度。对复数计算绝对值得到该基信号的幅度|X[i]| = 根号下a[i]²+b[i]²

这些|X[i]|结合起来形成幅度谱|X|,可以表示各个基信号分量占单帧信号的幅值强度。

1 离散傅里叶变换(DFT)

1.1 是什么

离散的数字信号(比如录音采样后的数字序列)从“时间领域”转换到“频率领域”。

  • 输入:一串随时间变化的数字(比如每秒采样44100次的音频数据)。
  • 输出:一串代表不同频率强度的数字(比如低音有多少、中音有多少、高音有多少)。

1.2 怎么工作

用各种不同频率的“正弦波”去匹配你的信号

  • 它尝试用低频正弦波去拟合,看匹配程度;
  • 再试中频、高频……
  • 最后告诉你:“你的信号里,低频成分占30%,中频占50%,高频占20%。”

2 快速傅里叶变换(FFT)

2.1 是什么

计算结果与DFT一样,但效率高。

2.2 怎么工作

假设你要计算 8 个点的 DFT:

  • DFT 做法:老老实实算 8×8 = 64 次运算。
  • FFT 做法
    1. 把 8 个点分成两组:偶数位置的点 和 奇数位置的点。
    2. 分别计算这两组 4 个点的 DFT。
    3. 再把结果巧妙合并。
    4. 继续递归拆分……直到变成最简单的 2 点 DFT。

这样,计算量从降到了N log₂N

http://www.jsqmd.com/news/913522/

相关文章:

  • 保姆级教程:用MIM搞定MMSegmentation v1.1.0 + MMCV 2.0.0rc4的完整安装流程(附CUDA 11.1环境检查)
  • 明穆宗 朱载坖
  • MindSpore Transformers 断点续训功能原理
  • 旅游管理毕设实战包:SpringBoot后端+Vue前端,含可运行源码、万字论文文档、部署教程与答辩PPT
  • 双FA自动耦合:从技术原理到量产效能飞跃
  • 儿童电动车辅助开关与PVC支撑框架改装指南:为特殊需求儿童打造专属座驾
  • 为什么我的频谱图纵坐标是负的?从dB/Hz单位聊聊信号处理中的对数变换
  • Claude用户手册制作(含可复用的Figma交互原型+Notion自动化工作流)
  • 安达发|电线电缆行业aps自动排产:从人工排程之困到智能驱动之变
  • sd卡的照片在电脑上删除之后能还原吗,介绍6种恢复技巧和视频演示,让你的数据轻松找回!
  • 视频教程|云端CAE实战 —— HyperMesh 管道配件仿真前处理
  • Claude产品需求文档实战模板(含可下载Figma+Notion双版本)
  • Linux 文件权限超详细详解(读懂权限标识、数字权限、特殊权限、chmod/chown)
  • MongoDB副本集配置
  • 2026年广东数据中心建设正当时,这些宝藏建设公司不容错过!
  • 《冰雪重制版》热血 165/166 区开服公告 福利活动指南
  • Copy Fail、Dirty Frag 、Fragnesia、ptrace ,kernel linux提权 信创解决方案
  • 【Claude企业落地风险白皮书】:基于137家客户审计数据的87%误用场景归因分析
  • 口碑靠谱卤水冻豆腐厂家怎么选?行业资深解析优选实力厂商,豆卷/素鸡/素肚/干豆腐/豆制品深加工,卤水冻豆腐厂商哪家专业 - 品牌推荐师
  • Linux 环境变量超详细入门到精通(零基础完整版)
  • 体验专题—1688商家版如何解决困扰用户的白屏问题
  • 剑与翼 - 经典复刻 1.03:老玩家实测,原汁原味的魔幻情怀回归
  • 中文学术论文语义检索实战工程:Milvus向量库+ERNIE编码+SimCSE与IBN联合训练+Cross-Encoder精排
  • Claude文档生成准确率从68%跃升至94.7%:我们如何用RAG+领域微调+人工反馈闭环重构提示链
  • 【MySQL】 索引核心知识点:索引下推、索引失效、联合索引、使用规范
  • 3分钟完全指南:使用qmc-decoder免费解锁QQ音乐加密文件
  • Hello HarmonyOS:搭建DevEco Studio开发环境与第一个应用运行(1)
  • 为什么92%的Claude企业用错画像标签?深度解析行为埋点偏差、冷启动陷阱与动态衰减曲线
  • Vue3旅游网站源码包:含首页/景点/线路/海报/关于我们/登录注册等9大功能页
  • Claude合同条款审查实操手册:5步精准定位AI服务隐性风险,90%企业已踩坑