当前位置：首页 > news >正文

从耳膜振动到大脑解码：用Python模拟声音感知的物理与心理过程

news 2026/6/5 22:10:59

从耳膜振动到大脑解码：用Python模拟声音感知的物理与心理过程

当你在安静的房间里听到一根针掉落的声音，或是被交响乐的低音提琴震得胸腔共鸣，这些体验背后隐藏着一套精密的生物声学系统。从外耳捕捉声波到大脑解码情感，每一步都蕴含着物理与心理的奇妙转换。本文将用Python代码拆解这个过程，你会看到如何用librosa分析音高变化，用matplotlib可视化基底膜频率映射，甚至模拟出人耳"脑补"不存在的谐波的神奇现象。

1. 声学物理基础：从氧分子振动到耳蜗编码

声音的旅程始于空气分子的微小振动。当声波引起耳膜位移达到氧分子直径（约0.3纳米）的十分之一时，我们的听觉系统就开始工作了。用Python可以直观展示这个微观尺度：

import numpy as np oxygen_diameter = 0.3 # 纳米 eardrum_displacement = oxygen_diameter / 10 print(f"人类听觉阈值位移：{eardrum_displacement}纳米")

中耳的听小骨系统将这种微小振动放大80倍以上。这个机械放大过程可以用杠杆原理模拟：

# 中耳压力放大计算 pressure_gain = 35 * 2 * 1.15 print(f"中耳系统总压力增益：{pressure_gain:.1f}倍")

1.1 外耳与耳道的声学特性

外耳不仅是声音收集器，其特殊结构还创造了2000-4000Hz的共振峰。用以下代码模拟耳道共振效应：

import matplotlib.pyplot as plt from scipy import signal fs = 44100 # 采样率 t = np.linspace(0, 1, fs, endpoint=False) freqs = np.arange(100, 8000, 100) gains = [15 if 2000 <= f <= 4000 else 0 for f in freqs] plt.figure(figsize=(10,4)) plt.plot(freqs, gains) plt.title("耳道频率响应特性") plt.xlabel("频率(Hz)"); plt.ylabel("增益(dB)") plt.grid()

2. 基底膜频率拓扑：Python实现音高位置映射

耳蜗中的基底膜就像一台生物傅里叶分析仪，不同位置对应不同频率。Von Békésy的研究表明这种映射是非线性的：

def cochlear_position(freq): """根据频率计算基底膜对应位置(0=base,1=apex)""" return (1/0.06) * np.log10(freq/165.4 + 0.88) frequencies = np.logspace(np.log10(20), np.log10(20000), 50) positions = [cochlear_position(f) for f in frequencies] plt.figure(figsize=(10,4)) plt.semilogx(frequencies, positions) plt.title("基底膜频率-位置映射") plt.xlabel("频率(Hz)"); plt.ylabel("标准化位置") plt.grid(which='both')

2.1 可辨音差阈值的听觉心理学模拟

人耳对音高的分辨能力遵循韦伯定律，约1%的频率差。用Python生成可听辨测试：

def generate_pitch_discrimination_test(base_freq=440, delta=0.01): from IPython.display import Audio dur = 0.5 # 秒 t = np.linspace(0, dur, int(dur*fs), False) tone1 = 0.5 * np.sin(2 * np.pi * base_freq * t) tone2 = 0.5 * np.sin(2 * np.pi * base_freq * (1+delta) * t) return Audio(np.hstack([tone1, np.zeros(1000), tone2]), rate=fs) # 生成1%频率差测试(通常可辨) generate_pitch_discrimination_test(delta=0.01)

3. 音色感知的数字信号处理实现

音色识别依赖于声音的瞬态特征和频谱包络。用librosa分析乐器起音阶段：

import librosa, librosa.display y, sr = librosa.load(librosa.ex('trumpet')) onset_frames = librosa.onset.onset_detect(y=y, sr=sr) D = librosa.amplitude_to_db(np.abs(librosa.stft(y)), ref=np.max) plt.figure(figsize=(12,6)) librosa.display.specshow(D, y_axis='log', x_axis='time') plt.vlines(librosa.frames_to_time(onset_frames), 0, sr/2, color='r') plt.title('小号音色的起音特征检测') plt.colorbar(format='%+2.0f dB')

3.1 结合音的心理声学模拟

人耳会"脑补"出物理上不存在的低频差音。用非线性失真模拟这个现象：

def generate_combination_tones(f1=1000, f2=1200): t = np.linspace(0, 3, 3*fs) # 添加非线性失真模拟耳蜗处理 signal = np.sin(2*np.pi*f1*t) + np.sin(2*np.pi*f2*t) distorted = signal + 0.3 * signal**2 + 0.1 * signal**3 return t, distorted t, combo = generate_combination_tones() plt.figure(figsize=(10,4)) plt.specgram(combo, Fs=fs, NFFT=1024) plt.title("结合音现象频谱图(含200Hz差音)") plt.xlabel("时间(s)"); plt.ylabel("频率(Hz)")

4. 听觉场景分析：从物理声学到心理感知

音乐感知涉及多维度心理量转换。下表展示了物理量与心理量的对应关系：

物理特征	心理感知	Python分析工具
频率(Hz)	音高	`librosa.piptrack`
振幅(Pa)	响度	`librosa.amplitude_to_db`
频谱包络	音色	`librosa.feature.spectral_centroid`
时间结构	时值	`librosa.onset.onset_detect`

4.1 协和感知的计算模型

音程协和度可以用频率比的最小公倍数来量化：

def consonance_score(f1, f2): from math import gcd ratio = f1/gcd(int(f1),int(f2))/f2 return 1/np.log(ratio) intervals = {'八度':2, '五度':3/2, '三度':5/4, '小二度':16/15} for name, ratio in intervals.items(): print(f"{name}协和度得分：{consonance_score(ratio,1):.2f}")

在Jupyter Notebook中运行这些代码时，你会看到声音如何从物理振动转化为心理体验。比如修改generate_combination_tones()函数的频率参数，可以验证当两音频率差小于30Hz时会产生拍音现象，而大于30Hz时则感知为独立音高。

查看全文

http://www.jsqmd.com/news/610666/