当前位置：首页 > news >正文

FPGA--Verilog 实现乒乓操作：从原理到工程实践（附完整代码）

news 2026/4/19 22:08:47

1. 什么是乒乓操作？

乒乓操作是FPGA设计中一种经典的数据缓冲技术，它的核心思想就像打乒乓球一样，两个存储单元轮流接收和输出数据。想象一下有两个水桶，当一个水桶在接水时，另一个水桶在倒水，如此反复交替。这种设计最大的优势在于可以实现数据的无缝连续处理，特别适合高速数据流场景。

在实际工程中，我们经常会遇到这样的需求：数据输入是连续的，但处理模块需要一定时间才能完成计算。如果直接让处理模块实时处理输入数据，很容易造成数据丢失或处理不完整。乒乓操作通过双缓冲机制完美解决了这个问题，让数据处理模块始终有完整的数据块可以处理，而不会影响新数据的接收。

2. 乒乓操作的核心原理

2.1 基本架构解析

一个标准的乒乓操作架构包含以下几个关键组件：

双存储单元：通常是两个RAM模块，分别标记为RAM1和RAM2
输入选择器：决定当前数据写入哪个RAM
输出选择器：决定从哪个RAM读取数据
控制逻辑：协调整个系统的时序和切换

工作流程可以这样理解：

第一阶段：数据写入RAM1，同时从RAM2读取数据
第二阶段：数据写入RAM2，同时从RAM1读取数据
如此循环往复，形成"乒乓"效果

2.2 时序控制要点

时序控制是乒乓操作的关键难点。我们需要确保：

读写切换的时机要精准
避免读写冲突
保证数据完整性

通常我们会使用一个计数器来管理切换时机。比如设置计数器从0到255循环计数，0-127时操作RAM1，128-255时操作RAM2。这种设计简单可靠，在实际项目中经过验证效果很好。

3. Verilog实现详解

3.1 顶层模块设计

让我们先看顶层模块的结构：

module dpram_pingpang_top( input clk, input rst_n, input [15:0] i_data, output [15:0] o_data, // 测试信号 output [7:0] o_addr, output [7:0] o_addw ); // 控制信号 wire mux1_en; wire mux2_en; // 实例化控制器 controller controller_m1( .clk(clk), .rst_n(rst_n), .mux1_en(mux1_en), .mux2_en(mux2_en) ); // 写入使能信号 wire wr_en1; wire wr_en2; // 输入选择器 mux21 mux21_m1( .clk(clk), .rst_n(rst_n), .en1(mux1_en), .wr_en1(wr_en1), .wr_en2(wr_en2) ); // RAM1实例 wire [15:0] o_data1; DRAM DRAM_m1( .clk(clk), .rst_n(rst_n), .data(i_data), .wr_en(wr_en1), .o_data(o_data1), .o_addr(o_addr), .o_addw(o_addw) ); // RAM2实例 wire [15:0] o_data2; DRAM DRAM_m2( .clk(clk), .rst_n(rst_n), .data(i_data), .wr_en(wr_en2), .o_data(o_data2) ); // 输出选择器 mux22 mux22_m1( .clk(clk), .rst_n(rst_n), .wr_en(mux1_en), .o_data1(o_data1), .o_data2(o_data2), .o_data(o_data) ); endmodule

这个顶层模块清晰地展现了整个系统的数据流向和控制关系。我在实际项目中发现，良好的模块划分可以大大降低后期调试的难度。

3.2 控制模块实现

控制模块是系统的大脑，负责生成关键的切换信号：

module controller( input clk, input rst_n, output reg mux1_en, output reg mux2_en ); reg [7:0] cnt; // 0-255计数器 always@(posedge clk or negedge rst_n) begin if(rst_n == 1'b0) cnt <= 'd0; else if(cnt == 'd255) cnt <= 'd0; else cnt <= cnt + 'd1; end always@(posedge clk or negedge rst_n) begin if(rst_n == 1'b0) begin mux1_en <= 'd0; mux2_en <= 'd0; end else if(cnt < 'd128) begin mux1_en <= 'd1; mux2_en <= 'd0; end else if(cnt > 'd127 && cnt < 'd256) begin mux1_en <= 'd0; mux2_en <= 'd1; end end endmodule

这里使用了一个8位计数器来实现周期性的切换。我建议在实际项目中可以根据数据量调整计数器位宽，确保每个缓冲阶段有足够的时间完成处理。

3.3 存储模块设计

存储模块是系统的核心，这里我们使用简单的双端口RAM实现：

module DRAM( input clk, input rst_n, input [15:0] data, input wr_en, output reg [15:0] o_data, output reg [7:0] o_addr, output reg [7:0] o_addw ); always@(posedge clk or negedge rst_n) begin if(rst_n == 1'b0) begin o_addr <= 'd0; o_addw <= 'd0; end else if(wr_en) begin o_addw <= o_addw + 'd1; o_addr <= 'd0; end else if(!wr_en) begin o_addr <= o_addr + 'd1; o_addw <= 'd0; end end reg [15:0] aRAM[127:0]; // 128x16位存储阵列 integer i; always@(posedge clk or negedge rst_n) begin if(rst_n == 1'b0) begin o_data <= 'd0; for(i=0; i<=127; i=i+1) aRAM[i] <= 'd0; end else if(wr_en) begin aRAM[o_addw] <= data; o_data <= 'd0; end else if(!wr_en) begin o_data <= aRAM[o_addr]; end end endmodule

在实际项目中，存储深度需要根据具体需求调整。我曾经在一个图像处理项目中使用深度为1024的缓冲，效果很好。