当前位置：首页 > news >正文

Fast-DDS Benchmark 参考结果与验收目标

news 2026/7/12 11:36:31

Fast-DDS 自带LatencyTest和ThroughputTest性能测试工具，位于test/performance/latency和test/performance/throughput。当前仓库中可以看到 SHM、UDP、TCP、reliable、best effort 等 profile，例如：

latency_interprocess_best_effort_shm_profile.xml
latency_interprocess_reliable_shm_profile.xml
latency_interprocess_best_effort_udp_profile.xml
latency_interprocess_reliable_udp_profile.xml
throughput_interprocess_best_effort_shm_profile.xml
throughput_interprocess_reliable_shm_profile.xml
throughput_interprocess_best_effort_udp_profile.xml
throughput_interprocess_reliable_udp_profile.xml

因此，设计上可以明确分成两类测试：

同机测试：两个进程在同一台机器上运行，启用 SHM transport、data sharing 和可选 zero-copy / loaned sample。
跨机器测试：publisher 和 subscriber 分别运行在两台机器上，关闭 shared memory，使用 UDP 或 TCP transport。

需要注意：Fast-DDS 官方 benchmark 文档中的数值是测试工具示例或官方 CI/benchmark 方法下的参考量级，不等同于项目目标硬件、目标内核、目标网络的最终结果。项目实时性验收必须在目标控制器上复测。

官方 LatencyTest 示例结果

Fast-DDSLatencyTest示例表给出的往返延迟结果如下，单位为微秒。该测试一次发送一个 sample，等待对端 echo 后统计 round-trip latency。

Payload	Samples	Mean	Min	50%	90%	99%	99.99%	Max
16 B	10000	1.279	1.106	1.263	1.358	2.509	6.932	7.261
1 KB	10000	1.678	1.078	1.145	2.399	2.538	17.373	17.862
63 KB	10000	5.641	4.574	4.744	7.574	12.189	31.385	45.567
1 MB	10000	69.110	58.913	62.671	82.916	140.723	447.954	458.905

这些数据说明，在 Fast-DDS benchmark 的理想路径中，小数据包延迟可以达到数微秒级，大块 1 MB 数据的 99% 延迟也在百微秒量级。对于项目变量访问场景，普通标量变量和小结构体通常落在 16 B 到 1 KB 范围，理论上适合放入同机 SHM / data sharing 路径；大数组、波形、结构体快照应尽量使用 bounded plain type + loaned sample / zero-copy。

官方 ThroughputTest 示例结果

Fast-DDSThroughputTest示例表给出的 1 KB payload 吞吐结果如下：

Payload	Demand	Recovery	Subscriber samples/s	Subscriber throughput	Lost samples
1 KB	10000	5 ms	401129 samples/s	3286.052 Mb/s	0

官方自动化 benchmark 文档中的吞吐汇总示例还展示了更高的数据通路能力，典型片段如下：

Payload	Demand	Recovery	Subscriber samples/s	Subscriber throughput
16 B	30000	0 ms	1825238 samples/s	233.631 Mb/s
128 B	30000	0 ms	1810586 samples/s	1854.041 Mb/s
1 KB	50000	20 ms	1706558 samples/s	13980.126 Mb/s
2 KB	50000	0 ms	1628671 samples/s	26684.149 Mb/s
4 KB	1000	0 ms	1420534 samples/s	46548.068 Mb/s
8 KB	50000	20 ms	992278 samples/s	65029.970 Mb/s

这些吞吐数字已经超过普通物理网卡能力，通常只能理解为同机内存路径、intra-process、SHM 或>同机 SHM 的预期实时性

基于上述 benchmark 量级，同机 shared memory / data sharing 路径可作为实时数据面的首选方案。

建议本项目验收目标如下：

场景	Payload	QoS	建议验收目标
标量变量帧	16 B 到 256 B	Best effort, keep last 1	P99 延迟小于 10 us
小型变量组	1 KB	Best effort, keep last 1	P99 延迟小于 20 us
中型结构体/数组	64 KB	Best effort 或 reliable	P99 延迟小于 100 us
大块波形/快照	1 MB	Best effort 或 reliable + zero-copy	P99 延迟小于 500 us
1 KB 高频吞吐	1 KB	Best effort	大于 300k samples/s，0 丢包

如果运行在 PREEMPT_RT、CPU 绑定、内存锁定、DDS 预分配和 zero-copy 配置完整的目标控制器上，上述目标有机会达到；如果运行在普通 Linux 调度策略、系统负载较高或仍使用 Variant/string 动态分配，P99 和最大延迟会明显变差。

跨机器 UDP/TCP 的预期实时性

跨机器通信不能使用 SHM transport 或 data sharing，实际结果主要受物理链路、交换机、网卡驱动、中断绑定、MTU、QoS、组播策略和网络负载影响。Fast-DDS 可以用 UDP/TCP transport 统一数据模型和 QoS，但跨机器实时性不可能达到同机 SHM 的微秒级结果。

建议项目按目标网络给出验收目标：

网络	Payload	Transport/QoS	建议验收目标
千兆以太网直连或工业交换机	16 B 到 256 B	UDP best effort, keep last 1	P99 延迟小于 1 ms
千兆以太网直连或工业交换机	1 KB	UDP best effort, keep last 1	P99 延迟小于 1 ms，吞吐大于 500 Mb/s
千兆以太网直连或工业交换机	64 KB	UDP best effort 或 reliable	P99 延迟小于 5 ms
千兆以太网，可靠命令	小命令帧	UDP/TCP reliable	请求响应 P99 小于 10 ms
百兆以太网	1 KB	UDP best effort	吞吐目标按链路上限降至 60 到 90 Mb/s

跨机器场景下，高频实时变量建议只发布必要变量组，不发布全量点表；全量在线变量、历史数据、波形数据应单独 Topic、单独 QoS、单独限流，避免挤占控制数据。

项目推荐 benchmark 命令

编译 Fast-DDS 性能测试工具：

colcon build --cmake-args-DPERFORMANCE_TESTS=ON

同机 SHM 延迟测试：

LatencyTest subscriber--domain10--reliability=besteffort--shared_memory=on--data_sharing=on--echo=true LatencyTest publisher--domain10--reliability=besteffort--shared_memory=on--data_sharing=on--samples=10000--file=payloads.csv

同机 SHM + loaned sample 吞吐测试：

ThroughputTest subscriber--domain11--reliability=besteffort--shared_memory=on--data_sharing=on--data_loadThroughputTest publisher--domain11--reliability=besteffort--shared_memory=on--data_sharing=on--data_load--time=10--recovery_time=0--demand=10000--msg_size=1024

跨机器 UDP 延迟测试：

# 机器 ALatencyTest subscriber--domain12--reliability=besteffort--shared_memory=off--echo=true# 机器 BLatencyTest publisher--domain12--reliability=besteffort--shared_memory=off--samples=10000--file=payloads.csv

跨机器 UDP 吞吐测试：

# 机器 AThroughputTest subscriber--domain13--reliability=besteffort--shared_memory=off# 机器 BThroughputTest publisher--domain13--reliability=besteffort--shared_memory=off--time=10--recovery_time=0--demand=10000--msg_size=1024