当前位置：首页 > news >正文

Linux下JMeter压测调优全指南：从命令行到分布式实战

news 2026/7/18 6:22:11

1. 为什么非得在Linux下跑Jmeter压测？——别再被Windows拖垮TPS了

很多人第一次用Jmeter做压测，习惯性点开Windows上的GUI界面，加线程组、写HTTP请求、配监听器，看着绿色小箭头“运行”一下，本地localhost响应时间200ms，心里一乐：“稳了”。结果一上生产环境，刚起500并发就报错Connection refused，监控一看服务器CPU才30%，网卡队列却堆到2000+。我去年帮一个电商团队排查大促前压测瓶颈，他们就是这么干的——在Windows笔记本上模拟8000用户，结果Jmeter自身内存溢出OOM，根本没把压力发出去，反而误判后端接口扛不住。真相是：Jmeter本质是个Java程序，而Windows GUI模式会吃掉大量资源做图形渲染、事件监听和实时图表绘制，真正能分配给压测逻辑的堆内存可能不到总配置的40%。Linux服务器则完全不同：无GUI、无桌面环境、进程调度更轻量，同样8G内存的机器，Linux下可稳定支撑2万+虚拟用户（VU），而Windows下连5000都卡顿。这不是玄学，是内核调度机制决定的——Linux的CFS（完全公平调度器）对长时间运行的Java进程更友好，而Windows的抢占式调度在高线程数下会产生大量上下文切换开销。更关键的是，真实压测场景中，你不可能只用一台机器发压；集群压测必须依赖Linux服务器作为压测节点，通过jmeter-server启动分布式服务，再由Windows控制机协调。所以，“Linux下运行Jmeter压测”不是可选项，而是压测工程化的起点。本文覆盖从单机命令行压测、参数调优、日志诊断，到多节点分布式部署、结果聚合分析的全链路，所有步骤均基于CentOS 7.9 + OpenJDK 11 + Jmeter 5.6实测验证，不讲虚的，只说你明天就能抄作业的操作。

2. 环境准备与核心参数调优——别让默认配置毁掉你的压测数据

2.1 JDK版本选择与JVM参数精调：为什么OpenJDK 11比8更稳？

Jmeter对JVM非常敏感，尤其在高并发场景下。很多人直接装JDK 8，认为“老版本更稳定”，结果在1万并发时频繁GC，吞吐量波动剧烈。我实测过三组对比：JDK 8u292、JDK 11.0.18、JDK 17.0.6，在相同Jmeter 5.6配置下压测一个简单Nginx静态页（200字节响应体），持续5分钟，结果如下：

JDK版本	平均TPS	GC次数/分钟	Full GC次数	内存占用峰值
JDK 8u292	12,400	86	3	7.2G
JDK 11.0.18	14,800	22	0	5.9G
JDK 17.0.6	15,100	18	0	5.7G

JDK 11起默认启用G1垃圾收集器，相比JDK 8的Parallel GC，G1在大堆内存下停顿时间更可控，且能主动避免Full GC。更重要的是，JDK 11修复了JDK 8中一个影响Jmeter线程池调度的bug（JDK-8199452），该bug会导致高并发下部分线程长期处于WAITING状态，实际并发数远低于设置值。因此，强烈建议使用JDK 11或17，且必须关闭JIT编译器的分层编译（TieredStopAtLevel=1）以减少启动阶段的性能抖动。具体配置如下：

# /opt/jmeter/bin/jmeter.sh 中修改 JVM_ARGS 行（注意：不是 user.properties） JVM_ARGS="-Xms4g -Xmx4g -XX:+UseG1GC -XX:MaxGCPauseMillis=200 -XX:G1HeapRegionSize=2M -XX:InitiatingOccupancyPercent=35 -XX:G1ReservePercent=15 -XX:G1HeapWastePercent=5 -XX:G1MixedGCCountTarget=8 -XX:G1OldCSetRegionThresholdPercent=10 -XX:G1NewSizePercent=20 -XX:G1MaxNewSizePercent=40 -XX:G1MixedGCLiveThresholdPercent=85 -XX:G1OldCSetRegionThresholdPercent=10 -XX:-TieredStopAtLevel=1"

提示：-Xms和-Xmx必须设为相同值，避免堆内存动态伸缩带来的GC压力；-XX:G1HeapRegionSize=2M针对大堆（>4G）优化，防止Region碎片化；-XX:InitiatingOccupancyPercent=35提前触发混合GC，避免Old区突然填满。

2.2 Jmeter自身配置文件深度定制：user.properties才是压测稳定性的命门

Jmeter的user.properties文件常被忽略，但它控制着压测行为的底层逻辑。默认配置在高并发下极易出问题。以下是我在生产环境强制修改的6项关键参数：

线程生命周期管理：jmeterengine.startdelay=0（取消启动延迟，避免分布式节点不同步）；jmeterengine.nongui.port=4444（指定非GUI通信端口，避免端口冲突）；
采样器超时控制：httpclient4.time_to_live=60000（连接池空闲连接存活时间，单位毫秒，设为60秒防长连接堆积）；httpsampler.max.connections.per.host=200（单主机最大连接数，避免端口耗尽）；
结果写入策略：jmeter.save.saveservice.output_format=csv（强制CSV格式，比XML轻量10倍，写入速度提升3倍）；jmeter.save.saveservice.response_data=false（禁用响应体保存，除非调试需要，否则磁盘IO成瓶颈）；
日志级别降级：log_level.jmeter=INFO（默认DEBUG会刷屏，INFO足够定位问题）；log_level.jmeter.threads=WARN（线程相关日志仅报错）；
DNS缓存优化：sun.net.inetaddr.ttl=60（JVM级DNS缓存60秒，避免每次请求都查DNS）；
SSL握手复用：https.default.protocol=TLSv1.2（强制TLS 1.2，兼容性与性能平衡）；javax.net.debug=ssl:handshake（仅调试时开启，查看SSL握手细节）。

这些参数不是凭空写的。比如httpsampler.max.connections.per.host=200，我曾遇到一个压测任务，目标域名解析出3个IP（DNS轮询），但默认max.connections.per.host=100，导致每个IP最多100连接，300并发时只有300连接可用，而实际需要支持5000并发，必须调高。又如jmeter.save.saveservice.output_format=csv，某次压测生成了12GB XML结果文件，写入耗时占总压测时间37%，换成CSV后降至4%，且后续用Python pandas读取速度提升8倍。

2.3 Linux系统级调优：内核参数才是压测吞吐量的天花板

即使JVM和Jmeter配置完美，Linux内核限制仍可能成为瓶颈。以下是我每台压测机必改的5项内核参数，全部写入/etc/sysctl.conf并执行sysctl -p生效：

# 1. 扩大文件描述符上限（Jmeter每个线程至少占用2个fd） fs.file-max = 2097152 # 2. 优化TIME_WAIT连接回收（高并发短连接必备） net.ipv4.tcp_tw_reuse = 1 net.ipv4.tcp_fin_timeout = 30 # 3. 提升网络栈缓冲区（应对突发流量） net.core.rmem_max = 16777216 net.core.wmem_max = 16777216 net.ipv4.tcp_rmem = 4096 262144 16777216 net.ipv4.tcp_wmem = 4096 262144 16777216 # 4. 关闭反向路径过滤（避免分布式压测时回包被丢弃） net.ipv4.conf.all.rp_filter = 0 net.ipv4.conf.default.rp_filter = 0

注意：net.ipv4.tcp_tw_reuse = 1允许将TIME_WAIT状态的socket用于新的OUTBOUND连接，但仅对客户端有效（即Jmeter作为客户端时）。这能将TIME_WAIT连接复用率从0%提升至95%以上，实测在1万并发短连接压测中，端口耗尽错误从每分钟23次降至0次。

此外，必须调整用户级限制：编辑/etc/security/limits.conf，添加：

jmeter soft nofile 1048576 jmeter hard nofile 1048576 jmeter soft nproc 65536 jmeter hard nproc 65536

然后确保Jmeter以jmeter用户身份运行（sudo -u jmeter ./jmeter.sh ...）。否则ulimit -n看到的仍是root的默认值（通常1024），压测到2000并发就会报“Too many open files”。

3. 命令行压测全流程实操——从.jmx到.csv结果的每一步拆解

3.1 压测脚本预处理：为什么GUI里调好的脚本一到Linux就报错？

这是新手最常踩的坑：在Windows上用GUI设计好脚本，导出.jmx文件，扔到Linux服务器上一跑，立刻报错java.lang.NoClassDefFoundError: org/apache/jmeter/visualizers/ViewResultsFullVisualizer。原因很简单：GUI模式下Jmeter会加载大量可视化类（如ViewResultsFullVisualizer、AggregateReport），而这些类在非GUI模式下默认不打包进classpath。解决方案只有两个：要么彻底删除脚本中所有监听器（推荐），要么手动添加缺失jar包。我选前者，因为监听器在命令行压测中毫无意义——它们只消耗CPU和内存，不产生任何压测价值。

操作步骤：

在Windows GUI中打开脚本，右键点击“线程组” → “Remove All Listeners”（注意：不是禁用，是彻底删除）；
检查“工作台”（WorkBench）是否为空，如有“View Results Tree”等组件，全部删除；
保存.jmx文件，用文本编辑器打开，搜索<stringProp name="filename">，确认所有监听器的filename属性为空（即未配置结果保存路径）；
最关键一步：检查HTTP请求下的“高级”选项卡，确认“Use KeepAlive”已勾选（复用TCP连接），且“Implementation”设为HttpClient4（比Java内置实现稳定）。

实操心得：我曾帮一个团队排查一个诡异问题——压测脚本在Linux下TPS始终只有GUI的1/3。最后发现是HTTP请求头里写了Connection: close，强制关闭连接，导致每次请求都要三次握手+四次挥手。删掉这行头，TPS立刻翻倍。记住：压测脚本里所有人为添加的Header，必须经过验证，否则就是性能杀手。

3.2 核心命令详解：jmeter.sh背后的12个关键参数

Jmeter命令行模式的核心是jmeter.sh（Linux）或jmeter.bat（Windows），但真正驱动压测的是其后的参数组合。以下是最常用且必须掌握的12个参数，按使用频率排序：

参数	示例值	作用说明	必填性	经验提示
`-n`	（无值）	启用非GUI模式（必须！）	★★★★★	不加此参数，Jmeter会尝试启动GUI，Linux无X11环境直接崩溃
`-t`	`/opt/jmeter/test.jmx`	指定测试计划文件路径	★★★★★	路径必须绝对路径，相对路径在crontab中易出错
`-l`	`/opt/jmeter/results.csv`	指定结果输出文件（CSV格式）	★★★★★	文件名建议含时间戳，如`results_$(date +%Y%m%d_%H%M%S).csv`
`-e`	（无值）	启用结果报告生成（需配合`-o`）	★★★★☆	仅当需要HTML报告时启用，否则增加IO负担
`-o`	`/opt/jmeter/report`	指定HTML报告输出目录	★★★★☆	目录必须为空，否则报错
`-j`	`/opt/jmeter/jmeter.log`	指定Jmeter运行日志路径	★★★★☆	日志是排错唯一依据，务必保留
`-d`	`/opt/jmeter/data`	指定数据文件根目录（供CSV Data Set Config使用）	★★★☆☆	若脚本中用了CSV数据源，必须指定此路径
`-R`	`192.168.1.10,192.168.1.11`	指定远程压测节点IP列表（分布式）	★★★☆☆	IP间用英文逗号，无空格
`-r`	（无值）	运行本地jmeter-server（分布式时主控机用）	★★☆☆☆	通常与`-R`配合，主控机不加`-r`，只加`-R`
`-G`	`threads=5000`	向远程节点传递全局属性（如线程数）	★★☆☆☆	分布式时统一控制各节点线程数，避免手工修改.jmx
`-D`	`server.rmi.ssl.disable=true`	设置JVM系统属性（如禁用RMI SSL）	★★☆☆☆	分布式跨网段时必加，否则RMI握手失败
`-J`	`host=prod-api.example.com`	设置Jmeter属性（覆盖脚本中__P()函数）	★★★★☆	动态切换压测环境，比改.jmx安全高效

一个典型生产压测命令如下：

nohup /opt/jmeter/bin/jmeter.sh \ -n -t /opt/jmeter/scripts/api_login.jmx \ -l /opt/jmeter/results/api_login_$(date +%Y%m%d_%H%M%S).csv \ -j /opt/jmeter/logs/api_login_$(date +%Y%m%d_%H%M%S).log \ -d /opt/jmeter/data \ -Jhost=api-prod.example.com \ -Jport=443 \ -Jprotocol=https \ > /dev/null 2>&1 & echo $! > /var/run/jmeter_api_login.pid

注意：nohup和&确保进程后台运行；> /dev/null 2>&1重定向stdout/stderr避免日志文件爆炸；echo $! > pidfile记录进程ID便于后续kill。我见过太多人直接前台运行，SSH断开后压测中断，还误以为是脚本问题。

3.3 结果文件结构解析：读懂CSV里的每一列意味着什么

Jmeter默认CSV结果文件包含13列（取决于user.properties中saveservice配置），但真正影响分析的只有7列。以下是以jmeter.save.saveservice.output_format=csv且启用了关键字段后的标准列说明（按顺序）：

timeStamp：请求开始时间戳（毫秒级，自1970-01-01），是计算响应时间的基准；
elapsed：响应时间（毫秒），即从发送请求到收到最后一个字节的时间，这是SLA考核的核心指标；
label：取样器名称（如“Login_API”），用于区分不同接口；
responseCode：HTTP状态码（如200、401、503），非2xx/3xx需单独统计错误率；
responseMessage：响应消息（如“OK”、“Service Unavailable”），调试时快速定位错误类型；
threadName：线程组名称+编号（如“Login-ThreadGroup 1-15”），用于分析线程分布；
dataType：数据类型（通常为空，JSON/XML时可能有值）；
success：布尔值（true/false），标识请求是否成功（基于响应码和断言）；
failureMessage：断言失败时的错误信息（如“Response code != 200”）；
bytes：响应体字节数（不含Header），用于计算带宽消耗；
sentBytes：请求体字节数（不含Header），评估请求负载；
grpThreads：当前线程组中活跃线程数；
allThreads：所有线程组中活跃线程总数。

关键洞察：elapsed列不是简单的平均值。例如，一个5000并发压测，若elapsed平均值是800ms，但95%线的值是2200ms，说明25%的请求严重超时，此时平均值会掩盖问题。因此，必须用-e -o生成HTML报告，或用Python脚本计算百分位数。我写了一个极简的awk命令，直接从CSV提取90%线：

awk -F, 'NR>1 {print $2}' results.csv | sort -n | awk 'BEGIN{c=0} {a[++c]=$1} END{print a[int(c*0.9)]}'

这条命令跳过首行（标题），提取第2列（elapsed），排序后取第90%位置的值，10秒内出结果，比等HTML报告快得多。

4. 分布式压测实战：如何让10台服务器协同发出5万并发

4.1 分布式架构原理：为什么不能简单用`-R`就完事？

分布式压测不是“多台机器同时跑同一个脚本”这么简单。Jmeter分布式模式采用主从（Master-Slave）架构：主控机（Master）负责解析.jmx脚本、分发测试逻辑、聚合结果；从节点（Slave）只执行压测任务，不参与脚本解析。整个过程依赖RMI（Remote Method Invocation）协议通信，而RMI在Linux防火墙、NAT、SELinux环境下极易失败。我曾在一个金融客户现场，配置完所有节点，-R命令一执行就报java.rmi.ConnectException: Connection refused to host，折腾3小时才发现是SELinux阻止了RMI端口（默认1099）。

RMI通信流程如下：

主控机启动jmeter-server，监听1099端口（RMI registry）和一个随机端口（RMI server）；
从节点启动jmeter-server，向主控机1099端口注册自身地址和随机端口；
主控机通过从节点注册的随机端口发送测试指令；
从节点执行后，将结果（CSV片段）通过同一随机端口回传给主控机。

因此，必须开放两个端口：1099（RMI registry）和一个范围端口（如40000-41000）用于RMI server。在firewalld中执行：

sudo firewall-cmd --permanent --add-port=1099/tcp sudo firewall-cmd --permanent --add-port=40000-41000/tcp sudo firewall-cmd --reload

4.2 从节点配置标准化：一份脚本走天下

所有从节点配置必须完全一致，否则会出现“部分节点压测正常，部分节点报错”的诡异现象。我的标准化流程如下：

统一JDK/Jmeter版本：在所有节点执行java -version和/opt/jmeter/bin/jmeter.sh -v，确保完全一致；
禁用GUI相关插件：删除/opt/jmeter/lib/ext/下所有JMeterPlugins-*开头的jar包（如JMeterPlugins-Standard.jar），这些插件在非GUI模式下会引发ClassNotFoundException；
配置rmi.server.hostname：编辑/opt/jmeter/bin/jmeter.properties，添加：
```
# 强制RMI使用本机IP，而非hostname（避免DNS解析失败） server.rmi.localport=40000 server.rmi.port=1099 server.rmi.ssl.disable=true
```
然后在/opt/jmeter/bin/jmeter-server中找到RMI_HOST_DEF行，改为：
```
RMI_HOST_DEF="-Djava.rmi.server.hostname=$(hostname -I | awk '{print $1}')"
```
这确保RMI注册的IP是实际网卡IP，而非localhost或hostname；

启动从节点服务：

# 后台启动，日志重定向 nohup /opt/jmeter/bin/jmeter-server \ -Djava.rmi.server.hostname=$(hostname -I | awk '{print $1}') \ -Dserver.rmi.ssl.disable=true \ -Dserver.rmi.localport=40000 \ -Dserver.rmi.port=1099 \ > /opt/jmeter/logs/jmeter-server.log 2>&1 & echo $! > /var/run/jmeter-server.pid

踩坑实录：某次压测，3台从节点中只有1台成功注册到主控机。排查发现，那台成功的节点hostname -I返回的是内网IP（192.168.1.10），而另两台返回的是Docker网桥IP（172.17.0.1）。根源是hostname -I会返回所有网卡IP，而awk '{print $1}'只取第一个。解决方案是明确指定网卡：ip -4 addr show eth0 \| grep -oP '(?<=inet\s)\d+(\.\d+){3}'。

4.3 主控机压测命令与结果聚合：如何避免“假并发”

主控机命令看似简单，但参数组合直接影响结果真实性。一个典型命令：

/opt/jmeter/bin/jmeter.sh \ -n \ -t /opt/jmeter/scripts/order_submit.jmx \ -l /opt/jmeter/results/order_submit.csv \ -R 192.168.1.10,192.168.1.11,192.168.1.12 \ -G threads=1500 \ -Jhost=order-prod.example.com \ -Jenv=prod \ -e -o /opt/jmeter/report/order_submit_$(date +%Y%m%d_%H%M%S)

这里的关键是-G threads=1500：它告诉每个从节点启动1500个线程，3个节点总计4500并发。但要注意，Jmeter的“并发数”是线程数，不是请求数/秒（TPS）。若一个请求平均耗时2秒，则1500线程的理论TPS是750（1500/2）。因此，要达到5000 TPS，需根据预估响应时间反推线程数：线程数 = TPS × 平均响应时间（秒）。

更危险的是“假并发”陷阱：当从节点网络延迟高或CPU不足时，线程无法及时发起新请求，实际并发数远低于设置值。验证方法是在主控机日志中搜索Starting thread，统计每秒启动线程数；或在从节点执行watch -n1 'ps -ef \| grep jmeter \| wc -l'，观察Java进程数是否稳定在预期值。

结果聚合时，-l指定的CSV文件是主控机生成的汇总文件，但它只包含各节点回传的结果片段，不包含节点自身的系统指标（CPU、内存）。因此，必须在压测同时，用sar或nmon采集从节点系统数据。我习惯在每台从节点执行：

# 压测开始前启动 sar -u 1 3600 > /opt/jmeter/logs/sar_cpu_$(date +%Y%m%d_%H%M%S).log & sar -r 1 3600 > /opt/jmeter/logs/sar_mem_$(date +%Y%m%d_%H%M%S).log & # 压测结束后kill kill $(pgrep sar)

这样，压测报告就能关联“TPS突增时CPU是否打满”“内存使用率是否线性上升”等关键结论。

5. 压测结果深度分析与常见故障定位——从数据看懂系统瓶颈

5.1 HTML报告解读：不只是看平均值，更要盯住百分位和异常点

Jmeter生成的HTML报告（-e -o）是分析入口，但多数人只看Summary Report里的“Average”和“90% Line”。这远远不够。一个完整的分析应关注以下5个维度：

响应时间分布（Response Time Distribution）：直方图显示不同响应区间（如0-500ms、500-1000ms）的请求数占比。若80%请求落在0-500ms，但剩余20%集中在5000-10000ms，说明存在偶发性长尾延迟，需检查数据库慢查询或锁竞争；
活动线程数（Active Threads Over Time）：曲线应平滑上升至目标值后保持稳定。若出现锯齿状波动，表明线程创建/销毁频繁，可能是Thread Group中“Ramp-Up Period”设置过短，或JVM内存不足触发GC；
每秒事务数（Transactions per Second）：TPS曲线应随并发数线性增长。若并发从1000增至2000，TPS只从800增至1000，说明系统已达瓶颈，需结合后端监控定位（如DB CPU、Redis连接数）；
错误率（Errors per Second）：错误率突增点往往对应系统崩溃点。例如，TPS达3000时错误率从0%飙升至15%，此时应立即停止压测，检查后端日志中的OutOfMemoryError或Connection reset；
响应时间百分位（Response Time Percentiles）：重点看95%和99%线。若平均响应时间800ms，但99%线是5000ms，说明1%的用户正在忍受5秒等待，这比平均值更能反映用户体验。

实操技巧：HTML报告默认只显示前10个取样器。若脚本中有50个API，需在/opt/jmeter/bin/jmeter.properties中修改jmeter.reportgenerator.exporter.html.series_filter=^(Login|Order|Payment).*，用正则匹配需要展示的标签。

5.2 日志文件排错链路：从jmeter.log到系统日志的完整追踪

当压测失败或结果异常时，jmeter.log是第一手线索。但它的信息量极大，需按优先级排查：

第一优先级：搜索ERROR和Exception

grep -i "error\|exception" /opt/jmeter/logs/api_login_20231001_100000.log | head -20

常见错误及根因：

java.net.BindException: Address already in use：端口耗尽，需调高net.ipv4.ip_local_port_range；
java.lang.OutOfMemoryError: Java heap space：JVM堆内存不足，需增大-Xmx并检查脚本中是否有大对象（如未关闭的InputStream）；
java.rmi.ConnectException: Connection refused：RMI通信失败，检查防火墙、SELinux、rmi.server.hostname配置。

第二优先级：检查线程启动日志搜索Starting thread，确认线程是否按预期启动：

grep "Starting thread" /opt/jmeter/logs/api_login_20231001_100000.log | wc -l # 应等于 线程组数 × 线程数 × 循环次数

若数量远少于预期，说明脚本解析失败或setUp Thread Group中存在阻塞逻辑。

第三优先级：关联系统日志若Jmeter日志无明显错误，但TPS上不去，需检查系统级瓶颈：

dmesg -T | tail -50：查看内核OOM Killer是否杀死了Jmeter进程；
cat /proc/$(pgrep -f jmeter)/status \| grep -E "VmRSS|Threads"：确认Jmeter进程实际内存占用和线程数；
ss -s：查看socket统计，若memory字段显示used接近limit，说明网络缓冲区耗尽。

5.3 典型故障场景与修复方案：来自127次压测的真实案例

场景1：压测进行到30分钟，TPS突然归零，Jmeter日志无报错

现象：TPS曲线从2000直线跌至0，jmeter.log最后一条是Finished Test，但压测未到设定时长；
根因：jmeter-server进程被OOM Killer杀死。dmesg显示Out of memory: Kill process 12345 (java) score 892 or sacrifice child；
修复：降低单节点并发数，或升级服务器内存；在/etc/sysctl.conf中添加vm.swappiness=1，减少swap使用；
预防：压测前执行echo 1 > /proc/sys/vm/oom_kill_disable（临时禁用OOM Killer，仅测试环境）。

场景2：分布式压测中，部分节点TPS为0，其他节点正常

现象：3台从节点，A、B节点TPS各1500，C节点TPS恒为0，jmeter-server.log无错误；
根因：C节点/etc/hosts中将本机hostname解析到了127.0.0.1，导致RMI注册IP为localhost，主控机无法连接；
修复：vi /etc/hosts，将127.0.0.1 hostname行注释，确保hostname解析到真实IP；
验证：ping $(hostname)应返回真实IP，而非127.0.0.1。

场景3：CSV结果文件中，大量请求的elapsed为0

现象：结果文件中约30%请求elapsed=0，responseCode为0，success=false；
根因：Jmeter线程在发送请求前被中断（如JVM GC停顿过长，或Linux OOM Killer介入）；
修复：增大JVM堆内存，调优GC参数；检查/var/log/messages中是否有OOM记录；
数据清洗：用Python脚本过滤elapsed=0的行，避免污染统计结果。

最后分享一个小技巧：压测脚本中，所有HTTP请求的“超时”设置必须显式配置。默认情况下，Jmeter的HTTP超时是无限的，一旦后端挂死，线程会永远等待，导致并发数虚高。在HTTP请求的“Advanced”选项卡中，勾选“Connect Timeout”和“Response Timeout”，分别设为3000和5000毫秒。这样，超时请求会被标记为失败，TPS统计更真实。

我在实际压测中发现，一个配置完善的Linux Jmeter环境，单台16核32G服务器可稳定支撑1.2万并发，TPS波动小于±3%。这背后不是靠堆硬件，而是对JVM、内核、网络栈、Jmeter自身参数的层层穿透式理解。压测不是“跑起来就行”，而是用数据说话的工程实践——每一个参数的调整，都该有明确的物理意义和可观测的验证结果。

查看全文

http://www.jsqmd.com/news/882558/