当前位置：首页 > news >正文

ColdFire DSP库实战：IIR滤波器在嵌入式传感器信号处理中的应用

news 2026/6/23 5:45:01

1. 项目概述

在嵌入式传感器应用里，处理原始信号一直是个既基础又头疼的活儿。你从加速度计、麦克风或者温度传感器里读出来的数据，往往掺杂着各种高频噪声、工频干扰，甚至电路本身的底噪。早年做项目，要么是外挂一颗专用的DSP芯片，成本上去了；要么就是在MCU里用C语言写个简单的移动平均滤波，效果又不太够用，陡峭的截止频率？想都别想。后来接触到ColdFire系列微控制器，发现它内置了MAC（乘加单元），就琢磨着能不能把一些经典的DSP算法搬上去，在资源受限的环境里也能实现不错的实时滤波。

这就是ColdFire DSP库，特别是其中IIR滤波器部分诞生的背景。它不是什么高深莫测的新理论，而是把数字信号处理教科书里的IIR滤波器，用高度优化的汇编代码实现，并封装成简洁的C语言接口。库的核心价值在于“开箱即用”：它提供了一大堆预先设计、测试好的巴特沃斯（Butterworth）型IIR滤波器配置（从2阶到6阶，涵盖低通、高通、带通、陷波）。你不需要从头推导差分方程、计算那些复杂的滤波器系数，更不用担心定点数量化带来的稳定性问题。你需要做的，就是根据你的采样率和想要的截止频率，从库里选一个现成的配置，初始化一个数据结构，然后在你的ADC采样中断里调用对应的汇编函数。对于需要快速实现传感器信号降噪、频率提取或工频抑制的工程师来说，这能省下大量调试和验证的时间。

简单来说，这个库瞄准的就是那些用ColdFire MCU做产品，需要处理模拟传感器信号，但又没有预算或空间添加独立DSP处理器的场景。它让一个通用的微控制器，获得了一些专属的数字信号处理能力。

2. 核心原理：为什么是IIR？为什么用定点？

2.1 模拟与数字滤波的鸿沟

在深入代码之前，得先理清一个根本概念：我们为什么非得在数字域做滤波？很多工程师的第一个想法可能是用运放、电阻、电容搭一个模拟滤波器。这没错，在信号进入ADC之前，一个简单的RC无源低通滤波作为抗混叠滤波器几乎是必须的。但模拟滤波器有几个硬伤：一是精度受制于元器件公差和温漂，今天调好的截止频率，明天温度一变可能就偏了；二是灵活性极差，要想改变滤波特性（比如从低通改成高通），就得动手换元件；三是难以实现复杂的频率响应，比如一个陡峭的、纹波小的低通滤波器，模拟电路实现起来体积和成本都不菲。

数字滤波器则完全颠覆了这个逻辑。它处理的不是连续的电压信号，而是ADC采样后得到的一串离散数字序列。滤波的过程，本质上是一套数学运算（差分方程）。它的所有特性——截止频率、滚降斜率、通带纹波——都完全由一组存储在内存中的“系数”决定。要改变滤波特性？只需在程序里换一组系数，甚至动态计算、加载新系数。它没有温漂，不受元器件老化影响，一致性极好。更重要的是，数字频率是“相对”的。一个数字截止频率为0.2的低通滤波器，当你的采样率是1000 Hz时，它对应100 Hz的模拟截止频率；当采样率改为2000 Hz时，它对应的模拟截止频率就变成了200 Hz。同一套代码和系数，通过改变采样率就能适配不同带宽的信号，这个优势是模拟电路无法比拟的。

2.2 IIR与FIR的取舍：效率优先

数字滤波器主要有两大类：有限脉冲响应（FIR）和无限脉冲响应（IIR）。ColdFire DSP库选择了IIR，这是一个在嵌入式场景下非常务实甚至可以说是必然的选择。

FIR滤波器的输出只与当前及过去的输入有关，结构上是没有反馈的横向滤波器。它的最大优点是绝对稳定（因为没反馈），并且可以实现严格的线性相位（这意味着所有频率分量通过滤波器后的时间延迟是一样的，不会造成信号波形畸变）。但它的代价很高：要达到一个比较陡峭的衰减特性，需要的阶数（N）往往非常高，有时是同等性能IIR滤波器的5到10倍。每一阶都意味着一次乘法和加法。对于一个实时采样系统，每个采样点都要进行N次乘加运算，这对MCU的计算能力是巨大的考验。

IIR滤波器则引入了反馈，当前的输出不仅取决于输入，还取决于过去的输出。它的传递函数是递归的。正是这个反馈结构，让IIR能用很少的阶数（比如4阶、6阶）就实现非常陡峭的滚降。换句话说，用更少的计算量，换来更强的滤波能力。这对于主频可能只有几十MHz、还要处理其他任务的ColdFire MCU来说，是决定性的优势。

当然，IIR的反馈也带来了两个潜在问题：一是可能不稳定（如果系数设计不当，输出可能会发散）；二是非线性相位（不同频率的信号延迟不同）。但在大多数传感器信号处理的场合，比如振动监测、声音触发、温度采集，我们更关心的是把特定频率的噪声幅度降下来，对信号相位是否线性并不敏感。至于稳定性，这正是这个库提供的“预配置”价值的核心——库里的每一组IIR系数都经过了严格的硬件测试，确保了在规定的输入范围内绝对稳定，你直接拿来用，根本不需要担心系统会震荡。

2.3 定点数的艺术：拥抱MAC，告别浮点

嵌入式MCU，尤其是像ColdFire这样的经典架构，通常没有硬件浮点运算单元（FPU）。做浮点数乘除，速度慢得无法忍受。因此，这个DSP库的整个数据通路都基于16位有符号整数（int16）。

这里有几个关键设计点：

匹配ADC：大多数用于传感器的ADC分辨率是12位或更低。16位的动态范围（-32768 到 +32767）足以无损地容纳ADC的原始数据，并且留有充足的余量进行中间运算。
发挥MAC威力：ColdFire的MAC单元是为16位x16位的乘加运算量身定制的，单周期就能完成一次乘法并将结果累加到累加器（ACC）。用整型运算能最大化发挥这颗硬件的性能。
定标（Scaling）的智慧：滤波器系数通常是小于1的小数。在定点数世界，我们通过“定标因子”把它们放大成整数。比如系数0.123，用定标因子2^10（即1024）放大，就变成了整数126。运算完成后，再通过移位操作变回原来的量级。库中的每个滤波器系数数组都配有两个定标因子：分子定标因子（num_sf）和分母定标因子（den_sf）。它们决定了系数在定点运算中的精度和动态范围。
数据格式的强制转换：库函数严格要求输入输出数据是二进制补码格式的有符号16位整数。如果你的ADC输出是0-3.3V对应的0-4095（无符号12位），你必须手动减去一个偏移（比如2048），将其转换为-2048~+2047的有符号数，否则运算结果会完全错误。

这种纯定点、整型运算的设计，是嵌入式DSP实现实时性的基石。它要求开发者必须对数据范围、溢出和定标有清晰的认识，但换来的却是毫秒甚至微秒级的滤波延迟，这对于实时控制来说是必须的。

3. 库架构与核心数据结构解析

3.1 软件架构：汇编的芯，C语言的脸

这个库的架构体现了经典的嵌入式优化思想：核心算法用汇编追求极致效率，对外接口用C语言保证易用性。

汇编内核：每一种阶数（2到6阶）的IIR滤波器，都有独立编写的汇编函数（如iir2_asm.s）。这些函数充分利用了ColdFire的地址寄存器、数据寄存器和MAC指令，对乘加循环、内存访问进行了手工优化，确保了最小的指令周期数。查看性能表可以看到，一个2阶IIR滤波仅需126个时钟周期，即使在50MHz的主频下，处理一个采样点也仅需2.5微秒，留出了充裕的时间给其他任务。
C语言封装：没有人愿意在应用层直接调用汇编。库为每个汇编函数配套了：
1. 专用的数据结构（Struct）：用于保存滤波器的状态（历史输入/输出）、系数指针、定标因子等所有运行所需信息。
2. 初始化函数（Init Function）：用于填充上述数据结构，将用户提供的系数指针、定标因子等“配置”信息写入结构体，并清零历史状态缓冲区。
3. C语言函数原型声明：使得在应用程序中，你可以像调用普通C函数一样调用iir2_init()和iir2_asm()。

这种设计达成了完美的平衡：算法工程师享受了汇编的速度，应用工程师则获得了像调用API一样的简便性。

3.2 核心数据结构：IIRN_STRUCT

理解这个数据结构，是正确使用库的关键。我们以IIR4_STRUCT（4阶IIR）为例，拆解其每个字段。它在内存中是紧密排列的，汇编函数会按照固定的偏移量来访问它们，因此绝对不可以修改结构体字段的顺序或类型。

// 以4阶IIR为例，其数据结构在内存中的布局 typedef struct { int16 output; // 偏移量0: 本次滤波的输出结果 uint8 diff_sf; // 偏移量2: (分子定标因子 - 分母定标因子)，用于结果补偿 uint8 den_sf; // 偏移量3: 分母系数的定标因子 int16* input; // 偏移量4: 指向输入数据的指针（注意是指针！） uint32 flags; // 偏移量8: 保留字段，未使用 int32* coef; // 偏移量12: 指向滤波器系数数组的指针 uint32 order; // 偏移量16: 滤波器的阶数，此处固定为4 int16 buffer[8]; // 偏移量20: 历史数据缓冲区，大小=2*阶数 } IIR4_STRUCT;

关键字段深度解读：

input(指针)：这是整个设计中最精妙的地方之一。它不是一个数据副本，而是一个指针。这意味着：
- 串联滤波：你可以将滤波器A的output变量的地址，赋值给滤波器B的input指针。这样，A的输出直接作为B的输入，轻松实现高阶滤波（如一个4阶+一个2阶，等效6阶）或复合滤波（如低通后接高通）。
- 实时更新：在中断服务程序中，你只需要更新ADC采样值到input指针所指的内存位置，所有以此为输入的滤波器都会自动获取到新值。
coef(指针)：指向滤波器系数数组。数组的排列顺序是固定的：[b0, b1, ..., bN, a1, a2, ..., aN]。其中b是前向系数（分子），a是反馈系数（分母）。注意a0通常为1，不存储。这些系数和定标因子都由库预定义，你只需要在初始化时传入对应的全局数组名（如butter4_lp_0_25_coef）。
buffer[2N]：这是滤波器的“记忆体”。它交替存储了过去的N个输入和N个输出值。例如对于一个4阶滤波器，buffer数组里可能是[x[n-1], y[n-1], x[n-2], y[n-2], x[n-3], y[n-3], x[n-4], y[n-4]]。每次调用iirN_asm()，汇编代码会从这里读取历史值，计算新输出，然后更新这个缓冲区（将最新的x和y移入，最老的移出）。初始化时必须清零，否则滤波器会从一个随机的历史状态开始，导致初始输出异常。
diff_sf：这是一个为了优化计算而存在的字段。在定点运算中，分子和分母系数可能使用不同的定标因子来保持精度。最终输出需要补偿这个定标差异。diff_sf = num_sf - den_sf，在汇编运算的最后，会对累加器结果进行相应移位，将其转换到正确的输出尺度上。

3.3 初始化与执行流程

使用一个IIR滤波器，必须遵循严格的“初始化-循环执行”两步流程，绝不能混淆。

第一步：一次性初始化

// 以初始化一个4阶、数字截止频率为0.25的巴特沃斯低通滤波器为例 IIR4_STRUCT my_filter; // 在全局或静态区域声明结构体，确保生命周期 int16 adc_raw_value; // 假设这是你的ADC采样变量 // 调用初始化函数 iir4_init(&my_filter, // 你的滤波器结构体指针 &adc_raw_value, // 输入数据指针，指向ADC变量 butter4_lp_0_25_coef, // 预定义的系数数组 butter4_lp_0_25_num_sf, // 预定义的分子定标因子 butter4_lp_0_25_den_sf, // 预定义的分母定标因子 4); // 阶数，固定为4

这个函数会做三件事：1) 将input指针指向你的ADC变量；2) 将coef指针指向预定义的系数数组；3) 计算并存储diff_sf和den_sf；4) 将buffer数组全部清零。这个过程通常只在系统启动时执行一次。

第二步：在中断中循环执行

// 在你的定时器或ADC转换完成中断服务程序（ISR）中 void ADC_ISR(void) { adc_raw_value = ADC_DR; // 1. 读取ADC硬件寄存器的最新采样值 iir4_asm(&my_filter); // 2. 调用汇编滤波函数，核心计算在此发生 int16 filtered_value = my_filter.output; // 3. 从结构体中获取滤波结果 // ... 后续使用 filtered_value 进行显示、判断或控制 }

每次采样到来，只需调用一次iirN_asm()。函数内部会：

通过input指针读取最新的adc_raw_value。
结合coef指针指向的系数和buffer中的历史数据，按照IIR差分方程进行计算。
将计算结果存入output字段。
更新buffer，为下一次计算做好准备。

4. 滤波器选型与配置实战

4.1 如何选择你的滤波器：形状、阶数与截止频率

库提供了丰富的预配置，选择时主要依据三个维度，对应表7-1中的决策参数：

形状（Shape）：你想让什么频率的信号通过？
- 低通（Lowpass, LP）：最常用。滤除高频噪声，保留低频信号。例如，加速度计信号中的高频振动噪声，温度传感器中的快速波动。
- 高通（Highpass, HP）：滤除低频直流偏移或漂移，保留高频变化。例如，去除声音信号中的环境底噪（偏向低频），保留语音；在振动信号中去除重力加速度的恒定分量。
- 带通（Bandpass, BP）：只允许特定频带通过。例如，从心电信号（ECG）中提取特定频率范围的心跳成分。
- 陷波（Notch, NT）：强烈衰减某个狭窄频带的信号。典型应用是滤除50/60Hz的工频干扰，对于从交流供电环境中采集的传感器信号非常有效。
阶数（Order）：你需要多陡的滚降？
- 阶数越高，滤波器在截止频率附近的衰减斜率越陡峭，过渡带越窄，性能越接近理想的“砖墙”滤波器。
- 代价是：计算量增加（看表9-1，6阶比2阶多约20个周期），并且对定点数误差更敏感。高阶滤波器在非常低或非常高的截止频率下，可能因为系数量化误差而性能下降甚至不稳定，因此库中高阶滤波器的可用截止频率范围会稍窄一些（例如6阶低通只提供0.25到0.75）。
- 经验法则：在满足性能要求的前提下，优先使用低阶滤波器。例如，对于一般的去噪，2阶或4阶巴特沃斯通常就足够了。除非你对阻带衰减有极端要求（例如需要80dB以上的衰减），否则不必追求6阶。
数字截止频率（Digital Cutoff Frequency, f_digital）：这是最关键也最容易出错的参数。
- 它不是以Hz为单位的模拟频率！它是一个归一化的相对值，范围通常在0到1之间（本库中多为0.2到0.8），代表相对于奈奎斯特频率（采样频率的一半）的比例。
- 计算公式：f_digital = f_analog / f_Nyquist = f_analog / (f_sample / 2) = (2 * f_analog) / f_sample
- 举例：你的传感器信号有用成分最高为100Hz，采样率设为500Hz。那么奈奎斯特频率是250Hz。如果你想设计一个截止频率为100Hz的低通滤波器，那么对应的数字截止频率应为100Hz / 250Hz = 0.4。你应在库中选择一个最接近0.4的配置，例如butter4_lp_0_40。

重要提示：选择数字截止频率时，必须确保它小于1。如果f_analog大于f_Nyquist，计算出的f_digital会大于1，这超出了库的支持范围，也违背了采样定理，意味着你需要先提高采样率。

4.2 配置速查与命名规则

库的预定义滤波器都遵循清晰的命名规则，方便查找：butter[阶数]_[形状]_[截止频率]_coef/num_sf/den_sf/order

阶数: 2, 3, 4, 5, 6
形状:lp(低通),hp(高通),bp(带通),nt(陷波)
截止频率: 对于低通/高通，是一个两位小数的数字，如0_25。对于带通/陷波，是两个由下划线连接的频率，表示通带/阻带的上下边界，如0_20_0_25。

你需要为初始化函数准备四个参数，它们都来自同一个“配置”：

// 例子：使用一个4阶，数字截止频率为0.3的巴特沃斯陷波滤波器 extern const int32 butter4_nt_0_30_0_35_coef[]; // 系数数组，在iir_filters.c中定义 extern const uint8 butter4_nt_0_30_0_35_num_sf; // 分子定标因子 extern const uint8 butter4_nt_0_30_0_35_den_sf; // 分母定标因子 extern const uint8 butter4_nt_0_30_0_35_order; // 阶数，恒为4 // 在你的初始化代码中直接使用这些全局变量名 iir4_init(&my_notch_filter, &adc_value, butter4_nt_0_30_0_35_coef, butter4_nt_0_30_0_35_num_sf, butter4_nt_0_30_0_35_den_sf, butter4_nt_0_30_0_35_order);

4.3 实战配置案例：加速度计数据去噪

场景：使用一个MMA8451Q三轴加速度计（I2C接口，12位输出），测量设备的倾斜角度。加速度计数据中混杂了大约200Hz以上的高频机械振动噪声。MCU通过定时器以1kHz的频率读取加速度计数据并滤波。

步骤：

确定模拟需求：需要滤除200Hz以上的噪声。有用信号（倾斜变化）通常低于10Hz。
计算数字频率：采样率f_sample = 1000 Hz，奈奎斯特频率f_Nyquist = 500 Hz。截止频率f_analog = 200 Hz。f_digital = 200 / 500 = 0.4。
选择滤波器：需要一个低通滤波器，截止频率0.4。为了保证足够的阻带衰减，选择4阶巴特沃斯。查表7-2，4阶低通支持0.25到0.8的截止频率，0.4在范围内。因此选择butter4_lp_0_40这个配置。

配置代码：

// 定义滤波器和数据变量 IIR4_STRUCT accel_x_filter, accel_y_filter, accel_z_filter; int16 accel_x_raw, accel_y_raw, accel_z_raw; int16 accel_x_filtered, accel_y_filtered, accel_z_filtered; // 初始化（在main函数开始处执行一次） iir4_init(&accel_x_filter, &accel_x_raw, butter4_lp_0_40_coef, butter4_lp_0_40_num_sf, butter4_lp_0_40_den_sf, 4); iir4_init(&accel_y_filter, &accel_y_raw, butter4_lp_0_40_coef, butter4_lp_0_40_num_sf, butter4_lp_0_40_den_sf, 4); iir4_init(&accel_z_filter, &accel_z_raw, butter4_lp_0_40_coef, butter4_lp_0_40_num_sf, butter4_lp_0_40_den_sf, 4); // 在1kHz定时器中断中 void TIMER_ISR(void) { // 1. 从I2C读取加速度计原始数据（假设已转换为有符号16位，例如0g对应0，±2g对应±16384） accel_x_raw = read_accel_x(); accel_y_raw = read_accel_y(); accel_z_raw = read_accel_z(); // 2. 执行滤波 iir4_asm(&accel_x_filter); iir4_asm(&accel_y_filter); iir4_asm(&accel_z_filter); // 3. 获取滤波后数据 accel_x_filtered = accel_x_filter.output; accel_y_filtered = accel_y_filter.output; accel_z_filtered = accel_z_filter.output; // 4. 现在可以使用平滑后的数据计算倾角了 // float angle_x = atan2(accel_y_filtered, accel_z_filtered) * 180 / PI; ... }

5. 性能优化与内存管理实战要点

5.1 理解性能数据与优化策略

表9-1提供了最直接的性能参考。以M52221DEMO板为例，一个2阶IIR滤波耗时126周期。假设你的ColdFire芯片运行在50MHz，那么处理一个点需要2.52微秒。这意味着理论上，单通道的最高采样率可以接近400kHz（1/2.52us）。但这只是理论值，实际还要考虑ADC转换时间、中断开销、数据读取等。

多通道滤波的两种策略：

顺序处理：在同一个中断里依次调用多个滤波器的asm函数。这是最简单的方式。如果处理3轴加速度计数据（3个滤波器），总耗时约3*126=378周期，在50MHz下约7.56微秒，对应132kHz的采样率，对于大多数惯性测量应用绰绰有余。
并行处理与流水线：对于更高采样率的需求，可以考虑使用DMA将ADC数据自动搬运到内存数组，主循环中再批量处理。或者，如果MCU有多个内核或更高级的DSP指令，可以探索更优的并行计算。但对于本库，顺序处理在绝大多数场景下已足够。

关键优化提示：

将汇编代码放入SRAM：如手册所述，将iirN_asm.s等汇编文件产生的代码段链接到SRAM中执行，可以避免从较慢的Flash读取指令带来的延迟，尤其在高主频下效果明显。这需要在链接器脚本（.ld文件）中做相应配置。
注意中断上下文：汇编函数会使用MAC单元（ACCx, MACSR寄存器），但不保存和恢复它们的状态。如果你的主循环或其他中断也使用了MAC，必须在进入DSP滤波中断时，手动保存这些寄存器的值，并在退出前恢复，否则会导致计算错误。

5.2 内存占用分析与管理

内存占用分为两部分：代码空间（Flash）和数据空间（RAM）。

代码空间：每个阶数的汇编函数大小在142-176字节之间。如果你只使用2阶和4阶滤波器，那么只会链接iir2_asm和iir4_asm的代码，占用约300字节。非常节省。
数据空间：这是需要重点规划的部分。每个滤波器实例的数据结构大小是20 + 4*N字节（N为阶数）。例如：
- 一个2阶滤波器：28字节。
- 一个4阶滤波器：36字节。
- 一个6阶滤波器：44字节。

此外，还有系数数组。每个预定义滤波器配置的系数数组是全局常量，存储在Flash中。系数数量为2*N + 1个（b0到bN，a1到aN），每个系数是int32（4字节）。一个4阶滤波器的系数数组约占(2*4+1)*4 = 36字节Flash。

管理建议：

实例化在静态存储区：将IIRN_STRUCT变量定义为全局或静态局部变量，确保其生命周期贯穿整个应用，并且地址固定。避免在栈上分配，以防栈溢出或地址变化。

复用系数数组：如果你有多个相同配置的滤波器（如三轴加速度计），它们可以共享同一个系数数组指针，无需在内存中复制多份系数。

// 好的做法：共享系数，节省RAM指针空间（但系数本身在Flash，不占RAM） iir4_init(&filter1, &input1, butter4_lp_0_40_coef, ...); iir4_init(&filter2, &input2, butter4_lp_0_40_coef, ...); // 使用同一个coef指针

警惕堆碎片：绝对不要使用malloc动态创建滤波器实例。在资源受限的嵌入式系统中，这可能导致堆碎片，最终内存分配失败。

5.3 输入范围与溢出防护

手册第7节末尾提到了一个关键限制：为防止累加器饱和导致非线性失真，建议输入幅度对于4-6阶滤波器不超过12位（即绝对值小于4096），对于2-3阶滤波器不超过13位（绝对值小于8192）。这个“位”指的是有效数据位，不是ADC的物理位数。

如何保证？

理解你的信号：如果你的ADC是12位，测量0-3.3V，那么原始数据范围是0-4095。转换为有符号数时，你可能会减去2048，得到范围-2048~+2047。这个范围完全在12位限制内，安全。

前级缩放：如果信号可能偶尔出现大尖峰（例如冲击），可以在送入IIR滤波器之前，先做一个简单的限幅或比例缩放。

#define ADC_MAX 4095 #define OFFSET 2048 #define SCALE_DOWN 2 // 如果担心溢出，可以除以2 int16 raw_adc = read_adc(); // 转换为有符号，并预缩放 int16 input_to_iir = ((int16)raw_adc - OFFSET) / SCALE_DOWN; // 然后将 input_to_iir 的地址传给滤波器

后级检查：在关键应用中，可以在读取filter.output后，检查其值是否在一个合理的范围内，如果出现极端值（如接近-32768或32767），则可能是内部溢出，可以丢弃该点数据或用上一个有效值代替。

一个常见的误区：认为用了16位整型，就可以满幅（-32768~32767）输入。对于高阶IIR滤波器，其内部的乘加链可能会产生非常大的中间值，即使输入很小，经过多次反馈累加也可能溢出。因此，遵守手册的输入范围建议是保证滤波器性能线性的重要前提。

6. 常见问题、调试技巧与避坑指南

在实际项目中集成这个库，你几乎一定会遇到下面这些问题。这里是我踩过坑后总结出的经验。

6.1 滤波器毫无效果或输出全零

症状：滤波后的输出output字段始终为0，或者完全跟随输入没有滤波效果。
排查步骤：
1. 检查初始化是否被调用：确保iirN_init()在进入主循环或中断前已经被执行。把它放在main()函数的开始，而不是某个可能不执行的条件分支里。
2. 检查输入指针：这是最常见的问题。iirN_init()的第二个参数需要的是一个int16*类型，即变量的地址。如果你传入了变量名，应该用取地址符&。确保这个指针指向的内存位置，在每次中断时都被更新了。
```
// 错误：传入了变量值 iir4_init(&filt, adc_value, ...); // 正确：传入变量地址 iir4_init(&filt, &adc_value, ...);
```
3. 检查系数指针：确认传入的系数数组名正确，并且该数组在链接时被正确包含到了项目中。如果链接器找不到这个符号，指针可能是NULL或指向错误地址。
4. 检查数据格式：确认你的ADC原始数据已经转换成了有符号16位整数（int16）。如果你的ADC输出是无符号的，必须手动减去一个偏移量（如adc_raw - 2048）。
5. 单步调试：在初始化后和第一次调用asm函数前，查看滤波器结构体my_filter的内存内容。确认input指针的值正确，coef指针指向非零的系数数组，buffer数组已清零。

6.2 滤波器输出不稳定或发散

症状：输出值越来越大，最终饱和在最大值或最小值，或者出现规律的振荡。
原因与解决：
1. 历史缓冲区未清零：这是导致滤波器启动时发散的主要原因。iirN_init()函数会帮你清零缓冲区。但如果你是自己声明结构体并手动赋值，务必记得将buffer数组全部赋值为0。
2. 采样率与截止频率不匹配：你选择的数字截止频率f_digital对应的模拟截止频率f_analog可能太接近或超过了你的采样率的一半。重新计算f_digital = 2 * f_analog / f_sample，确保其值在库支持的范围内（例如0.2-0.8）。
3. 输入信号幅度过大：违反了输入幅度限制。用示波器或逻辑分析仪查看ADC原始数据，确保其转换到有符号16位后的绝对值，对于高阶滤波器不超过4096。考虑增加前级硬件衰减或软件缩放。
4. 错误地复用了结构体：如果你将同一个滤波器结构体用于两个完全不同的信号源，或者中途改变了input指针但未重新初始化buffer，历史状态会混乱。每个独立的信号流应使用独立的滤波器实例。

6.3 如何验证滤波器性能？

在硬件上验证滤波器是否按预期工作，不能只靠“感觉”，需要一些方法：

频响测试（离线）：
- 在PC上用Python或MATLAB按照库提供的系数，搭建一个同规格的定点IIR滤波器模型。
- 生成一个扫频信号（从低频到奈奎斯特频率），作为测试向量。
- 将测试向量保存为数组，导入到你的嵌入式程序中，作为模拟的ADC输入。
- 运行滤波器，将输出记录下来，传回PC。
- 在PC上对比输入和输出的幅度，绘制幅频特性曲线。这可以最准确地验证滤波器的截止频率和衰减特性。
阶跃响应测试（在线）：
- 这是一个简单的时域测试。在程序中，将滤波器输入从一个固定值（如0）突然切换到另一个固定值（如1000）。
- 记录滤波器的输出值。一个稳定的低通滤波器，其输出应该是一条平滑的指数曲线，逐渐逼近1000。通过观察曲线的上升时间，可以定性判断截止频率（上升时间越短，截止频率越高）。
- 如果输出出现振荡或超调，可能意味着滤波器不稳定或参数不匹配。
正弦波测试（在线）：
- 使用信号发生器，向你的传感器前端注入一个纯净的正弦波。
- 在远低于截止频率时，输出正弦波幅度应基本不变；在截止频率附近，幅度开始衰减；在远高于截止频率时，幅度应被显著衰减。
- 通过改变输入正弦波的频率，可以大致标定出滤波器的-3dB点。

6.4 高级技巧：串联与并联

库的设计允许灵活的滤波器组合：

串联（级联）实现更高阶：库最高只提供6阶单滤波器。如果你需要更陡峭的滚降（如12阶），可以将两个6阶滤波器串联。

// 假设两个6阶低通滤波器，相同截止频率 IIR6_STRUCT stage1, stage2; int16 raw, intermediate, final; iir6_init(&stage1, &raw, butter6_lp_0_30_coef, ...); iir6_init(&stage2, &intermediate, butter6_lp_0_30_coef, ...); // 注意，这里指向 intermediate // 在中断中 void ISR() { raw = read_adc(); iir6_asm(&stage1); intermediate = stage1.output; // 第一级输出 iir6_asm(&stage2); // 第二级以第一级输出为输入 final = stage2.output; }

注意：串联时，两级滤波器的总延迟会增加，并且需要注意中间变量intermediate的动态范围，防止溢出。

并联实现特殊响应：理论上，你可以将相同输入分别送入一个低通和一个高通滤波器，然后将输出相加，可以得到一个全通或带阻特性。但这需要精确的系数设计和幅度匹配，库没有直接提供这类预配置，需要深厚的DSP理论知识，不推荐初学者尝试。

6.5 从模拟到数字：抗混叠滤波器不可省略

最后强调一个贯穿始终的基本原则：数字滤波器再强大，也无法消除混叠噪声。混叠发生在ADC采样的那一刻，一旦高频信号被误采样为低频，后续任何数字滤波都无能为力。

因此，在ADC输入端之前，必须有一个模拟抗混叠滤波器，通常是一个简单的RC低通滤波器，其截止频率应略高于你关心的最高信号频率，但必须低于奈奎斯特频率。例如，你关心100Hz以下的信号，采样率为1kHz（奈奎斯特频率500Hz），那么可以在ADC前端设计一个截止频率在150-200Hz左右的RC低通。它的作用是将高于200Hz的噪声大幅衰减，使其在采样时不会混叠到0-500Hz的有效频带内。

这个模拟滤波器不需要很精确，性能也不需要很陡峭（因为数字滤波器会负责主要的滤波任务），但它是一道必要的“防火墙”。很多数字滤波效果不佳的案例，根源都在于忽略了这道模拟防线。

查看全文

http://www.jsqmd.com/news/1065665/