当前位置：首页 > news >正文

STM32H7 SPI双机通信实战：DMA配置避坑与SRAM4缓存一致性处理

news 2026/7/24 8:48:38

STM32H7 SPI双机通信实战：DMA配置避坑与SRAM4缓存一致性处理

在嵌入式系统开发中，SPI总线因其高速、全双工的特性，成为双机通信的首选方案之一。而STM32H7系列微控制器凭借其强大的DMA控制器和丰富的内存架构，为SPI通信提供了硬件加速的可能。本文将深入探讨STM32H7 SPI DMA双机通信中一个关键但常被忽视的技术细节——Cache一致性问题，特别是当DMA缓冲区位于SRAM4区域时的处理策略。

1. STM32H7内存架构与DMA访问限制

STM32H7系列微控制器采用了复杂的多总线矩阵内存架构，包含多种内存类型：

DTCM (Data Tightly Coupled Memory)：零等待周期的高速内存，但DMA1/DMA2无法访问
SRAM1/SRAM2/SRAM3：通用SRAM，可由DMA访问
SRAM4：位于D3域的SRAM，专为DMA设计
AXI SRAM：大容量高速内存

// STM32H7内存区域地址映射 #define DTCM_RAM_BASE 0x20000000UL #define SRAM1_BASE 0x24000000UL #define SRAM2_BASE 0x30000000UL #define SRAM4_BASE 0x38000000UL

关键限制：当主程序使用DTCM作为主要RAM时，DMA缓冲区必须放置在其它内存区域（如SRAM4），因为通用DMA控制器无法访问DTCM。

2. SPI DMA双机通信基础配置

2.1 硬件连接建议

推荐的全双工SPI主从机连接方式：

主机引脚	从机引脚	描述
MOSI	MOSI	主机输出从机输入
MISO	MISO	主机输入从机输出
SCK	SCK	时钟信号
NSS	NSS	硬件片选信号（关键）

提示：务必使用硬件NSS引脚而非软件控制，可避免上电顺序导致的时钟同步问题。

2.2 SPI主机初始化关键代码

void bsp_InitSPIParam(uint32_t _BaudRatePrescaler, uint32_t _CLKPhase, uint32_t _CLKPolarity) { hspi.Instance = SPIx; hspi.Init.BaudRatePrescaler = _BaudRatePrescaler; hspi.Init.Direction = SPI_DIRECTION_2LINES; // 全双工模式 hspi.Init.CLKPhase = _CLKPhase; hspi.Init.CLKPolarity = _CLKPolarity; hspi.Init.DataSize = SPI_DATASIZE_8BIT; hspi.Init.FirstBit = SPI_FIRSTBIT_MSB; hspi.Init.NSS = SPI_NSS_HARD_OUTPUT; // 硬件NSS hspi.Init.Mode = SPI_MODE_MASTER; // 主机模式 HAL_SPI_Init(&hspi); }

3. DMA配置与内存选择策略

3.1 DMA缓冲区位置选择

在STM32H7中，DMA缓冲区的选择需要考虑以下因素：

可访问性：DMA控制器能否访问该内存区域
性能：内存的访问速度
Cache一致性：是否需要特殊处理

推荐方案：将DMA缓冲区放在SRAM4区域（0x38000000），原因如下：

专为DMA设计，确保可访问性
独立于主内存总线，减少总线竞争
可单独配置MPU属性

3.2 DMA缓冲区定义方法

不同编译器的定义方式：

/* IAR编译器 */ #pragma location = ".RAM_D3" uint8_t g_spiTxBuf[SPI_BUFFER_SIZE]; /* Keil MDK */ __attribute__((section (".RAM_D3"))) uint8_t g_spiRxBuf[SPI_BUFFER_SIZE];

对应的分散加载文件配置：

LR1 0x24000000 { ; DTCM ER1 0x24000000 0x00020000 { *.o (RESET, +First) *(InRoot$$Sections) .ANY (+RO +RW +ZI) } } LR2 0x38000000 { ; SRAM4 ER2 0x38000000 0x00010000 { .ANY (RAM_D3) } }

4. Cache一致性问题深度解析

4.1 问题现象与根源

当出现以下现象时，很可能遇到了Cache一致性问题：

数据传输不完整或错乱
接收数据与发送数据不符
间歇性通信失败

根本原因：STM32H7的Cache控制器与DMA控制器独立工作，当CPU和DMA同时访问同一内存区域时：

CPU写入的数据可能暂存在Cache中而未更新到物理内存
DMA直接从物理内存读取/写入，绕过Cache
导致双方看到的数据不一致

4.2 解决方案对比

方案	优点	缺点
手动Cache维护	精确控制	增加代码复杂度
关闭全局Cache	简单直接	严重降低系统性能
MPU配置Non-cacheable	性能与一致性平衡	需要理解MPU配置

推荐方案：通过MPU将SRAM4区域配置为Non-cacheable。

4.3 MPU配置详解

void MPU_Config(void) { MPU_Region_InitTypeDef MPU_InitStruct = {0}; HAL_MPU_Disable(); /* 配置SRAM4为Non-cacheable */ MPU_InitStruct.Enable = MPU_REGION_ENABLE; MPU_InitStruct.BaseAddress = 0x38000000; MPU_InitStruct.Size = MPU_REGION_SIZE_64KB; MPU_InitStruct.AccessPermission = MPU_REGION_FULL_ACCESS; MPU_InitStruct.IsBufferable = MPU_ACCESS_NOT_BUFFERABLE; MPU_InitStruct.IsCacheable = MPU_ACCESS_NOT_CACHEABLE; // 关键配置 MPU_InitStruct.IsShareable = MPU_ACCESS_NOT_SHAREABLE; MPU_InitStruct.Number = MPU_REGION_NUMBER2; HAL_MPU_ConfigRegion(&MPU_InitStruct); HAL_MPU_Enable(MPU_PRIVILEGED_DEFAULT); }

关键参数说明：

IsCacheable：设置为MPU_ACCESS_NOT_CACHEABLE，禁止缓存
IsBufferable：建议NOT_BUFFERABLE，避免写缓冲导致问题
Size：根据实际使用的SRAM4大小配置

5. 完整通信流程实现

5.1 主机端数据传输

void DemoSpiMaster(void) { uint8_t count = 0; while(1) { if (按键按下) { // 准备发送数据 g_spiTxBuf[0] = count++; g_spiTxBuf[1] = count++; g_spiLen = 2; // 启动DMA传输 HAL_SPI_TransmitReceive_DMA(&hspi, g_spiTxBuf, g_spiRxBuf, g_spiLen); // 等待传输完成 while(传输未完成) { /* 可加入超时处理 */ } // 处理接收数据 printf("Received: %d, %d\n", g_spiRxBuf[0], g_spiRxBuf[1]); } } }

5.2 从机端实现要点

从机配置与主机类似，但需注意：

设置SPI为从机模式：
```
hspi.Init.Mode = SPI_MODE_SLAVE;
```
从机NSS配置：
```
hspi.Init.NSS = SPI_NSS_HARD_INPUT;
```

从机应预先准备数据缓冲区：

// 上电初始化后立即准备接收 g_spiTxBuf[0] = 0xAA; g_spiTxBuf[1] = 0x55; HAL_SPI_TransmitReceive_DMA(&hspi, g_spiTxBuf, g_spiRxBuf, 2);

6. 性能优化与调试技巧

6.1 时钟配置建议

主机时钟：根据布线质量选择，一般可达25-50MHz
从机时钟：可配置为高于主机时钟（提高容错性）
时钟极性和相位：主从机必须一致

6.2 常见问题排查表

现象	可能原因	解决方案
数据错位	时钟相位/极性不匹配	检查主从机SPI配置
间歇性通信失败	NSS信号问题	使用硬件NSS并检查连接
DMA传输不启动	缓冲区位于不可访问区域	确认缓冲区在SRAM4
数据不一致	Cache一致性问题	正确配置MPU
从机无响应	上电顺序导致	增加从机复位电路或软件同步

6.3 调试输出建议

在开发阶段，可添加以下调试信息：

printf("TX: "); for(int i=0; i<g_spiLen; i++) printf("%02X ", g_spiTxBuf[i]); printf("\nRX: "); for(int i=0; i<g_spiLen; i++) printf("%02X ", g_spiRxBuf[i]); printf("\n");

7. 高级应用：双缓冲与大数据量传输

对于需要高速、连续传输的场景，可考虑以下优化：

双缓冲技术：
- 准备两个缓冲区：当DMA使用缓冲区A传输时，CPU处理缓冲区B的数据
- 通过DMA传输完成中断切换缓冲区
分散-聚集DMA：
- 使用DMA的链表模式处理不连续的数据块
- 减少CPU介入，提高吞吐量

DMA与CPU协作：

// 示例：双缓冲初始化 #define BUF_SIZE 256 __attribute__((section(".RAM_D3"))) uint8_t bufA[BUF_SIZE]; __attribute__((section(".RAM_D3"))) uint8_t bufB[BUF_SIZE]; volatile uint8_t *activeBuf = bufA; // DMA完成中断中切换缓冲区 void SPIx_DMA_RX_IRQHandler(void) { if(activeBuf == bufA) { processData(bufB); // 处理非活动缓冲区 activeBuf = bufB; } else { processData(bufA); activeBuf = bufA; } // 重新启动DMA传输 HAL_SPI_TransmitReceive_DMA(&hspi, activeBuf, activeBuf, BUF_SIZE); }

在实际项目中，SPI DMA双机通信的稳定性和性能很大程度上取决于对内存架构和Cache机制的深入理解。通过合理配置MPU、选择适当的内存区域以及优化数据传输流程，可以构建出高效可靠的双机通信系统。

查看全文

http://www.jsqmd.com/news/831147/