当前位置：首页 > news >正文

Wireshark解密SSH流量实战：获取会话密钥四步法

news 2026/7/14 0:36:31

1. 为什么你看到的SSH抓包永远是“看不懂的乱码”——先破除一个普遍误解

Wireshark能抓到SSH流量，但绝大多数人打开后只看到一长串无法解析的TCP流，连登录用户名都看不到。这不是Wireshark不行，而是你默认把它当成了HTTP或DNS那样的明文协议分析器。SSH从设计第一天起就拒绝被“裸看”——它不是“没加密”，而是在TCP层之上、应用层之下，构建了一整套独立的加密信道协商与密钥派生机制。很多人卡在第一步：以为只要装上Wireshark、开启监听、连上服务器，就能像看curl请求一样逐行读取SSH交互。结果抓下来全是Encrypted packet、Unknown record type、Invalid SSH version string这类报错。我第一次在客户现场调试跳板机超时问题时也这样，抓了20分钟包，反复过滤ssh和tcp.port == 22，最后发现连SSH协议握手阶段的SSH-2.0-OpenSSH_9.2p1版本标识都没成功解出来。根本原因在于：Wireshark默认不参与密钥交换过程，它只负责“录屏”，不负责“解密密钥”。而SSH的密钥是在客户端与服务端内存中动态生成、仅短暂存在的——你既不能从服务端硬盘里直接导出，也不能靠逆向客户端二进制文件稳定获取。所以，真正能解密SSH会话的唯一可靠路径，是让Wireshark获得客户端在内存中使用的会话密钥（session key）。这个密钥不是密码，不是私钥，而是一次性生成的对称密钥，生命周期仅限于本次连接。本文要讲的，就是如何在不修改任何生产环境配置、不重启服务、不安装额外代理的前提下，通过OpenSSH客户端自身的调试机制，把这把“一次性钥匙”安全、可控、可复现地交到Wireshark手上。适合所有需要深度排查SSH连接延迟、认证失败、隧道中断、SFTP卡顿等问题的运维工程师、安全研究员和开发人员。你不需要懂椭圆曲线数学，但得会改一行环境变量；你不需要编译OpenSSH，但得知道-E参数怎么用；你不需要成为密码学专家，但得明白为什么/tmp/ssh_keys.log必须设为600权限。

2. 解密的前提：理解SSH协议栈的真实分层与密钥生命周期

要让Wireshark读懂SSH，必须先扔掉“SSH=端口22+密码登录”的简化模型。真实SSH协议栈是三层嵌套结构：最底层是TCP传输（三次握手建立可靠通道），中间层是SSH传输层（Transport Layer），最上层才是用户看到的认证、通道、SFTP等业务逻辑。而Wireshark默认只识别到第二层——它能准确标出SSH Protocol: SSH-2.0，也能解析出KEXINIT（密钥交换初始化）、NEWKEYS（新密钥启用）这些关键报文类型，但它完全不知道这些报文中协商出来的加密算法、MAC算法、密钥长度，更不知道最终生成的会话密钥是什么。这就导致它只能显示“Encrypted packet”，却无法进一步拆解成SSH_MSG_CHANNEL_DATA或SSH_MSG_USERAUTH_REQUEST这样的语义化消息。我们来拆解一次典型SSH连接中密钥的实际生成路径：

TCP三次握手完成：客户端与服务端建立TCP连接，端口22就绪；
协议版本交换：双方发送SSH-2.0-xxx字符串，确认支持SSH-2协议；
KEXINIT协商启动：客户端发送支持的密钥交换算法列表（如curve25519-sha256,diffie-hellman-group16-sha384），服务端选择其一；
密钥交换执行：以curve25519-sha256为例，双方各自生成临时私钥，计算公钥并交换，再用对方公钥+自己私钥算出共享密钥（shared secret）；
会话密钥派生：将共享密钥、双方随机数（client's and server's random bytes）、算法名等输入HKDF或SHA256哈希函数，派生出6个独立密钥：客户端→服务端加密密钥、服务端→客户端加密密钥、客户端→服务端MAC密钥、服务端→客户端MAC密钥、客户端→服务端加密IV、服务端→客户端加密IV；
NEWKEYS指令生效：双方发送NEWKEYS报文，通知对方“从此刻起，后续所有数据均使用上述6个密钥加解密”。

整个过程在毫秒级内完成，所有密钥均驻留在进程内存中，从不写入磁盘。OpenSSH客户端（ssh命令）在完成第5步后，会把这6个密钥以明文形式暂存到内存，直到连接关闭。而Wireshark解密机制的突破口，就在于让OpenSSH在生成这些密钥后，主动把它们以标准格式（RFC 5656定义的SSH Key Exchange Log Format）输出到指定文件。这个文件不是密钥本身，而是包含密钥、算法名、随机数等完整上下文的结构化日志，Wireshark能据此完全重建解密流程。注意：这里输出的是session key，不是你的私钥（id_rsa），也不是服务端的/etc/ssh/ssh_host_rsa_key。前者泄露只会危及本次连接，后者泄露则等于交出整台服务器的控制权。这也是为什么该方法被官方文档明确列为“安全调试手段”，而非“后门”。

3. 实操四步法：从零开始抓取并解密一次完整SSH会话

现在进入纯实操环节。整个流程分为四个不可跳过的步骤，每一步都有明确目的和验证点。我建议你在测试机上严格按顺序操作，不要合并步骤，否则极易因环境变量未生效或日志权限错误导致解密失败。

3.1 步骤一：准备Wireshark并配置SSL/TLS解密首选项（实际用于SSH）

Wireshark虽名为“网络封包分析器”，但其解密引擎底层复用的是TLS/SSL解密模块。因此，我们必须先在Wireshark中启用并配置该模块，即使我们处理的是SSH流量。打开Wireshark →Edit→Preferences→ 左侧导航栏展开Protocols→ 找到SSH（注意：不是SSL，是独立的SSH条目）。勾选Enable SSH protocol dissection，然后在下方RSA keys list区域点击Edit按钮。此时弹出的窗口看似要求填RSA私钥，实则是个误导——SSH解密不依赖私钥，而是依赖我们即将生成的session key log file。因此，此处留空不填任何内容，直接关闭窗口。接着，在同一SSH设置页，找到Key log filename字段，点击右侧文件夹图标，选择一个你有完全写入权限的路径，例如/tmp/ssh_key_log.txt。这个路径将作为后续OpenSSH输出密钥日志的目标位置。> 提示：务必确保该文件路径在Wireshark启动前就已存在且权限正确。我曾因/tmp/ssh_key_log.txt被其他进程占用导致Wireshark静默失败，排查了两小时才发现是另一个脚本在轮询写入同名文件。

3.2 步骤二：配置OpenSSH客户端启用密钥日志输出

这是整个流程的核心动作。OpenSSH自7.6版本起（2017年发布）引入了SSH_KEY_LOG_FILE环境变量支持，允许客户端将协商出的会话密钥写入指定文件。你需要在启动ssh命令前，通过shell环境变量将其激活。执行以下命令（以bash/zsh为例）：

export SSH_KEY_LOG_FILE="/tmp/ssh_key_log.txt" ssh -o "LogLevel=DEBUG3" -o "StrictHostKeyChecking=no" user@target-server.com

其中-o "LogLevel=DEBUG3"至关重要：它强制OpenSSH在连接过程中输出最详细的调试信息，包括密钥协商各阶段的随机数、共享密钥摘要、最终派生的6个密钥的十六进制值。这些信息会同时写入终端和SSH_KEY_LOG_FILE指定的文件。注意：StrictHostKeyChecking=no仅用于测试环境，生产环境请务必保留默认的ask或yes，避免中间人攻击。如果你使用的是macOS系统，请确认你安装的是Homebrew版OpenSSH（brew install openssh），因为系统自带的/usr/bin/ssh版本过低（通常为8.1p1但缺少完整密钥日志支持），会导致SSH_KEY_LOG_FILE被忽略。验证是否生效的方法很简单：连接建立后，立即执行ls -l /tmp/ssh_key_log.txt，你应该看到一个非零字节的文件；再执行head -n 5 /tmp/ssh_key_log.txt，输出应类似：

# SSL/TLS secrets log file, generated by OpenSSH # This file is intended for use with Wireshark, tshark, etc. # The format is defined in RFC 5656, section 4.3. CLIENT_RANDOM 3e8a...f1b2 00112233445566778899aabbccddeeff... # KEYLOGFILE client_to_server_encryption_key: 0102030405060708090a0b0c0d0e0f10...

如果文件为空或不存在，说明环境变量未被OpenSSH读取，检查是否在ssh命令前执行了export，或是否使用了错误的ssh二进制路径。

3.3 步骤三：在Wireshark中加载密钥日志并验证解密状态

现在切换回Wireshark界面。确保你已在步骤一中正确设置了Key log filename指向/tmp/ssh_key_log.txt。然后开始抓包：在Wireshark主界面顶部工具栏，选择正确的网卡（通常是en0或eth0），点击红色圆形“开始捕获”按钮。接着，在另一终端窗口执行步骤二中的ssh命令，完成一次完整登录（例如输入密码后进入shell，再输入exit退出）。等待SSH连接彻底关闭后，回到Wireshark，点击红色方形“停止捕获”按钮。此时，Wireshark会自动尝试加载/tmp/ssh_key_log.txt并匹配捕获到的SSH流量。验证是否成功解密，最直接的方法是：在过滤栏输入ssh && ssh.msg_type == 1（即筛选SSH_MSG_DISCONNECT断开消息），如果能看到明文的reason code和description（如11: Connection lost），说明解密已生效。更进一步，右键任意一条SSH Protocol数据包 →Decode As...→ 在弹出窗口中Protocol列选择SSH，点击OK。此时，原本灰色的Encrypted packet字段应变为可展开的树状结构，你能清晰看到Packet Length、Padding Length、Payload（已解密的原始数据）等字段。如果仍显示Encrypted packet，请检查：1）/tmp/ssh_key_log.txt时间戳是否晚于抓包开始时间；2）Wireshark是否以与ssh命令相同的用户权限运行（避免因权限不足无法读取日志文件）；3）OpenSSH版本是否≥7.6（执行ssh -V确认）。

3.4 步骤四：深度解析一次SSH会话的完整生命周期

现在我们拥有了完整的、可解密的SSH流量视图。以一次典型的ssh user@server.com登录为例，Wireshark中可清晰追踪以下12个关键阶段（按时间顺序）：

时间戳	报文类型	关键字段	解密后含义	排查价值
T+0.001s	TCP SYN	Seq=0, Ack=0	客户端发起连接	网络层连通性验证
T+0.002s	TCP SYN-ACK	Seq=0, Ack=1	服务端响应	服务端端口监听状态
T+0.003s	TCP ACK	Seq=1, Ack=1	连接建立完成	TCP握手耗时基线
T+0.005s	SSH Protocol	Version="SSH-2.0-OpenSSH_9.2"	协议版本协商	版本兼容性问题定位
T+0.008s	SSH KEXINIT	kex_algorithms="curve25519-sha256,..."	密钥交换算法列表	算法不匹配导致卡顿
T+0.012s	SSH KEXDH_REPLY	host_key="AAAAB3NzaC1yc2E..."	服务端主机公钥	公钥指纹比对防劫持
T+0.015s	SSH NEWKEYS	(no payload)	加密信道启用指令	加密切换临界点
T+0.018s	SSH USERAUTH_REQUEST	user="admin", service="ssh-connection", method="password"	用户名与认证方式	认证阶段起点
T+0.022s	SSH USERAUTH_FAILURE	auth_methods="publickey,password"	认证失败返回	错误密码或禁用密码登录
T+0.025s	SSH USERAUTH_SUCCESS	(no payload)	认证成功	登录流程完成标志
T+0.028s	SSH CHANNEL_OPEN	channel_type="session"	会话通道建立	SFTP/端口转发前置条件
T+0.031s	SSH CHANNEL_DATA	data="bash-5.1$ "	Shell提示符明文	应用层交互起始

这个表格不是教科书式罗列，而是我在处理某金融客户SSH跳板机超时问题时的真实分析框架。当时客户反馈“连接后卡住30秒才出现密码提示”，我抓包后发现KEXINIT到NEWKEYS耗时28秒，远超正常值（<0.1秒）。进一步查看KEXINIT报文中的算法列表，发现客户端强制指定了diffie-hellman-group14-sha1，而服务端CPU老旧，该算法软件实现极慢。解决方案是修改客户端~/.ssh/config，添加KexAlgorithms curve25519-sha256,diffie-hellman-group-exchange-sha256，问题立刻解决。没有解密能力，你永远只能看到“连接慢”，而无法定位到具体是密钥交换环节的算法性能瓶颈。

4. 高阶技巧与避坑指南：那些官方文档不会写的实战经验

即使你已成功解密一次SSH会话，真正在复杂环境中稳定复现，仍需掌握以下五个关键技巧。这些全部来自我过去三年在20+不同客户现场踩坑后总结的“血泪经验”，网上几乎找不到系统整理。

4.1 技巧一：多会话并发抓包时，如何避免密钥日志混淆？

生产环境中常需同时监控多个SSH会话（如批量部署脚本、CI/CD流水线）。若所有ssh命令共用同一个SSH_KEY_LOG_FILE，日志会混杂，Wireshark无法区分哪段密钥对应哪个TCP流。解决方案是为每个会话生成唯一日志文件。利用shell进程ID（$$）和时间戳构造动态路径：

LOGFILE="/tmp/ssh_key_$$_$(date +%s%3N).log" export SSH_KEY_LOG_FILE="$LOGFILE" ssh -o LogLevel=DEBUG3 user@host1.com & ssh -o LogLevel=DEBUG3 user@host2.com & wait

这样每个子shell进程都会写入独立日志。Wireshark中，你可在Edit → Preferences → Protocols → SSH里，将Key log filename设置为/tmp/ssh_key_*.log（支持glob通配符），Wireshark会自动加载所有匹配文件。> 注意：wait命令必不可少，确保所有后台ssh进程结束后再停止Wireshark抓包，否则部分日志可能未刷新到磁盘。

4.2 技巧二：当遇到“Invalid SSH version string”错误时，真正的根因是什么？

这是Wireshark解密失败最常见的报错之一，表面看是协议版本不识别，实则90%以上源于TCP分片重组失败。SSH初始报文（SSH-2.0-xxx）通常小于1500字节，但在高延迟、高丢包网络中，TCP层可能将其拆分为多个MSS分片。Wireshark默认不自动重组TCP流，导致SSH Protocol解析器收到不完整的首包，无法提取版本字符串。解决方法：在Wireshark中，Edit → Preferences → Protocols → TCP，勾选Allow subdissector to reassemble TCP streams。然后重启Wireshark并重新加载捕获文件。此设置会让Wireshark在应用层解析前，先将属于同一TCP流的所有分片按序拼接，确保SSH-2.0-xxx字符串完整送达解析器。我曾在一个跨国视频会议系统中遇到此问题，客户网络MTU被错误设置为1300，导致SSH首包必然分片，开启此选项后解密成功率从0%提升至100%。

4.3 技巧三：如何解密SFTP和SCP流量？它们和普通SSH会话有何不同？

SFTP（SSH File Transfer Protocol）和SCP（Secure Copy Protocol）均运行在SSH会话通道之上，但协议层级不同。SFTP是独立的二进制协议，定义在RFC 4253之上，有自己的SSH_FXP_INIT、SSH_FXP_OPEN等消息类型；SCP则是基于shell的文本协议，通过scp -f或scp -t参数启动，交互为纯ASCII命令。Wireshark解密后，SFTP流量会显示为SSH Protocol → SFTP子协议，可直接看到文件名、操作类型（open,read,write）、状态码（SSH_FXP_STATUS）；而SCP流量则显示为SSH Protocol → CHANNEL_DATA，内容为C0644 12345 filename\n这样的明文指令。关键区别在于：SFTP解密后可直接分析文件传输性能（如单次read请求的数据块大小、响应延迟），而SCP因无结构化消息头，只能通过CHANNEL_DATA长度变化粗略估算传输速率。实测中，某客户SFTP上传大文件缓慢，解密后发现客户端每次SSH_FXP_WRITE只发64KB数据，而服务端SSH_FXP_STATUS响应延迟高达800ms，定位为服务端磁盘I/O瓶颈，而非网络问题。

4.4 技巧四：为什么`ssh -D`动态端口转发流量无法解密？如何绕过限制？

ssh -D 1080创建的SOCKS代理，其内部流量（如浏览器访问HTTP网站）完全不经过SSH协议栈。SSH客户端只是在本地监听1080端口，接收SOCKS协议请求，然后将目标地址和端口封装进SSH_MSG_CHANNEL_OPEN消息，发送给服务端；服务端收到后，再由其本地网络栈直接连接目标服务器。因此，Wireshark抓到的只有SSH信道内的CHANNEL_DATA（内容为SOCKS握手和目标地址），而真正的HTTP/HTTPS流量在服务端与目标服务器之间传输，你本地Wireshark根本捕获不到。想分析此类流量，必须在服务端机器上抓包，或改用ssh -L本地端口转发（ssh -L 8080:target.com:80 user@server.com），此时HTTP流量会完整流经你的本地SSH客户端，可被Wireshark解密。这是一个根本性架构限制，不是配置问题。

4.5 技巧五：生产环境安全红线——如何在不降低安全等级的前提下启用密钥日志？

很多安全团队禁止任何“密钥输出”行为，认为违反最小权限原则。其实，SSH_KEY_LOG_FILE输出的是会话密钥（session key），而非长期私钥，其生命周期与TCP连接绑定，连接关闭后密钥即失效。为满足审计要求，我推荐三重加固方案：

路径隔离：将日志文件写入/dev/shm/（内存文件系统），如/dev/shm/ssh_key_$$，连接结束后自动消失，不落地磁盘；
权限锁定：在ssh命令前执行umask 077，确保生成的文件权限为600，仅当前用户可读；
自动清理：用trap命令注册退出钩子，确保无论ssh是否异常终止，日志文件都被立即删除：

LOGFILE="/dev/shm/ssh_key_$$" trap 'rm -f "$LOGFILE"' EXIT export SSH_KEY_LOG_FILE="$LOGFILE" ssh -o LogLevel=DEBUG3 user@host.com

这套组合拳已通过某国有银行三级等保测评，审计报告明确指出：“会话密钥未持久化存储，符合GB/T 22239-2019中8.1.2.3条款关于临时密钥管理的要求”。

5. 超越解密：用SSH抓包数据驱动真实运维决策

解密只是手段，核心价值在于将原始字节流转化为可行动的运维洞察。在我服务的某大型电商客户中，我们不再满足于“看到密码提示”，而是构建了一套基于SSH抓包数据的自动化分析流水线。整个过程分为三个层次：

第一层是实时告警。我们用tshark（Wireshark命令行版）配合自定义Lua脚本，对每条SSH连接进行毫秒级分析。例如，当检测到KEXINIT到NEWKEYS耗时超过500ms，或USERAUTH_REQUEST到USERAUTH_SUCCESS间隔超过10秒，立即触发企业微信告警，并附带该连接的源IP、目标端口、协商算法、服务端OpenSSH版本。这让我们在用户投诉前就发现某批新采购的ARM服务器因bcrypt算法优化不足，导致SSH认证延迟飙升。

第二层是根因聚类。我们将一个月内所有SSH抓包的KEXINIT报文中的算法列表提取出来，用Python统计各算法组合的出现频次与平均延迟。结果发现，ecdh-sha2-nistp256在旧版OpenSSH（<8.0）中平均耗时120ms，而curve25519-sha256仅需8ms。据此，我们推动全公司客户端升级，并在Ansible Playbook中强制注入KexAlgorithms配置，使整体SSH连接P95延迟下降67%。

第三层是安全合规审计。我们定期扫描所有SSH会话的KEXINIT报文，检查是否包含已知不安全算法（如diffie-hellman-group1-sha1,ssh-rsa签名算法）。一旦发现，自动关联CMDB，定位到具体服务器和责任人，生成整改工单。这套机制帮助客户在等保2.0复审中，SSH协议安全性得分从72分提升至98分。

这些都不是Wireshark界面上点点鼠标就能完成的，而是建立在你真正理解SSH协议栈、能稳定解密每一帧数据、并愿意把抓包结果当作第一手业务数据来处理的基础上。当你能把SSH_MSG_CHANNEL_DATA里的bash-5.1$提示符，和数据库慢查询日志、应用APM链路追踪、网络设备SNMP指标放在同一张看板上交叉分析时，你就已经超越了“抓包工程师”，成为了真正驱动业务稳定的SRE。

我在实际使用中发现，最常被忽略的其实是第一步——确认OpenSSH版本。去年帮一家游戏公司排查海外玩家SSH登录失败问题，折腾两天才发现他们用的CentOS 7默认OpenSSH是6.6.1p1，根本不支持SSH_KEY_LOG_FILE。临时编译安装新版OpenSSH后，问题迎刃而解。所以，下次遇到解密失败，别急着查Wireshark设置，先敲ssh -V，这行命令能帮你省下80%的排查时间。

查看全文

http://www.jsqmd.com/news/886078/