当前位置：首页 > news >正文

Wireshark实战：从流量包里‘捞出’图片和压缩包的两种方法（附CTF解题步骤）

news 2026/7/10 5:16:51

Wireshark实战：从流量包里‘捞出’图片和压缩包的两种方法（附CTF解题步骤）

在网络安全和数字取证领域，网络流量分析是一项基础但至关重要的技能。想象一下这样的场景：你正在调查一起数据泄露事件，或者参加一场网络安全竞赛（CTF），突然发现一个可疑的网络流量捕获文件（pcap）。这个文件里可能隐藏着关键证据或比赛flag——比如被传输的图片、文档或压缩包。如何从海量的网络数据包中精准定位并还原出这些文件？这就是我们今天要探讨的核心技能。

Wireshark作为网络分析领域的"瑞士军刀"，提供了多种方法来提取传输文件。不同于简单的功能介绍，本文将深入两种实用技术路径：针对HTTP等协议的"导出对象"功能，以及更底层的"跟踪TCP流"原始数据重组方法。我们不仅会讲解基础操作，还会通过一个真实的CTF案例，演示如何处理分包传输、计算数据偏移、合并碎片文件，甚至破解RAR伪加密等进阶技巧。无论你是刚入门的安全爱好者，还是需要处理网络取证的一线运维人员，这些实战技能都将成为你的得力工具。

1. 准备工作与环境配置

在开始实际分析之前，我们需要确保拥有合适的工具和环境。Wireshark的最新稳定版本（目前为4.2.x）是首选，它支持Windows、macOS和Linux三大平台。安装时建议勾选所有组件，特别是USBPcap和WinPcap/Npcap驱动，这对完整捕获网络流量至关重要。

提示：在Linux系统上，你可能需要额外安装libpcap-dev等依赖库，并使用sudo权限运行Wireshark，或者将当前用户加入wireshark组以获得足够权限。

分析网络流量通常需要以下配套工具：

十六进制编辑器：010 Editor、HxD或Bless（Linux）
文件分析工具：binwalk、foremost（用于检测和提取嵌入文件）
压缩包处理工具：7-Zip、WinRAR（特别需要支持修复损坏压缩包）
校验工具：md5sum、sha1sum（验证文件完整性）

# Ubuntu/Debian系统安装常用分析工具 sudo apt install wireshark binwalk foremost md5deep

对于CTF比赛或取证分析，建议建立一个专门的工作目录，按照以下结构组织文件：

~/cases/ ├── original/ # 存放原始pcap文件 ├── extracted/ # 导出文件存放位置 ├── scripts/ # 自定义解析脚本 └── notes.md # 分析过程记录

2. 方法一：使用导出对象功能快速提取HTTP文件

当目标文件通过HTTP协议传输时，Wireshark的"导出对象"功能是最快捷的提取方式。这种方法适用于网页图片、文档下载、文件上传等常见场景，能够自动识别并重组HTTP传输中的完整文件。

2.1 操作步骤详解

过滤HTTP流量：在Wireshark主界面的过滤栏输入http，快速定位HTTP协议数据包
访问导出功能：点击菜单栏的文件 → 导出对象 → HTTP
识别目标文件：在弹出的窗口中，按文件类型或大小排序，寻找可疑对象
保存文件：选中目标后点击Save或Save All批量导出

典型HTTP文件传输特征：

特征项	请求包表现	响应包表现
请求方法	GET/POST	状态码200
内容类型	Content-Type头	如image/jpeg
数据长度	Content-Length头	与实际数据一致

2.2 实战案例：提取网页图片

假设我们有一个名为web_traffic.pcapng的捕获文件，怀疑其中包含泄露的截图：

应用显示过滤器：http contains "jpg" || http contains "png"
发现多个JPEG文件传输记录，重点关注大尺寸文件（如>500KB）
导出对象列表显示一个secret_screenshot.jpg文件
保存后使用图像查看器打开，确认内容有效

注意：某些网站会使用分块传输编码（Transfer-Encoding: chunked），此时需要确保Wireshark能正确重组分块数据。在Edit → Preferences → Protocols → HTTP中检查相关设置。

3. 方法二：跟踪TCP流重组原始数据

对于非HTTP协议传输的文件，或者当"导出对象"功能无法识别时，我们需要采用更底层的方法——跟踪TCP流并手动提取原始数据。这种方法技术要求更高，但适用性更广，能处理FTP、SMTP甚至自定义协议传输的文件。

3.1 基础操作流程

定位目标数据流：
- 使用显示过滤器如tcp.port == 21（FTP）缩小范围
- 右键可疑数据包 →跟踪流 → TCP流
识别文件特征：
- 图片：查找JFIF（JPEG）、PNG等文件头
- 压缩包：查找PK（ZIP）或Rar!（RAR）签名
保存原始数据：
- 在流窗口右下角选择原始数据格式
- 点击另存为...并赋予正确扩展名

# 示例：识别常见文件头 file_signatures = { b'\xFF\xD8\xFF': 'jpg', b'\x89PNG': 'png', b'PK\x03\x04': 'zip', b'Rar!\x1A\x07': 'rar' } def identify_file(data): for sig, ext in file_signatures.items(): if data.startswith(sig): return ext return 'bin'

3.2 处理复杂场景：分包传输与数据重组

当文件被分割成多个TCP包传输时，我们需要手动计算偏移量并拼接数据。以下是关键步骤：

确定数据边界：
- 统计所有相关包的Len字段总和
- 对比实际文件大小，计算协议头开销

提取有效载荷：

使用tshark命令行工具精确提取特定字节范围

tshark -r capture.pcap -Y "tcp.stream eq 123" -T fields -e data | xxd -r -p > output.bin

合并分段文件：

# Linux/macOS cat part1.bin part2.bin > complete.zip # Windows copy /b part1.bin+part2.bin complete.zip

4. CTF实战：从流量中还原伪加密RAR文件

让我们通过一个真实CTF案例（改编自HackTheBox挑战）综合应用上述技术。题目提供一个名为exfiltrated.pcapng的流量文件，提示flag藏在一个经过伪加密的RAR文件中。

4.1 初步分析

统计协议分布：

capinfos exfiltrated.pcapng tshark -r exfiltrated.pcapng -qz io,phs

发现大量HTTP流量，占比78%

过滤HTTP对象：
- 应用过滤器：http.request.method == "POST"
- 发现多个上传请求，其中upload.php传输了一个secret.rar文件
验证文件信息：
- 数据包详情显示Content-Length: 342,178 bytes
- 响应头包含MD5：5f4dcc3b5aa765d61d8327deb882cf99

4.2 数据提取与重组

由于文件被分割传输，我们需要：

计算分包结构：
- 5个数据包，前4个各65,535字节，最后1个49,378字节
- 每个包有42字节HTTP头，因此实际数据：
  - 前4包：65,535 - 42 = 65,493
  - 末包：49,378 - 42 = 49,336
- 总和：65,493*4 + 49,336 = 342,178（匹配）

精确提取每个片段：

for i in {1..5}; do tshark -r exfiltrated.pcapng -Y "frame.number == $((i+50))" -T fields -e data | xxd -r -p > part$i.bin dd if=part$i.bin of=clean$i.bin bs=1 skip=42 done

合并完整文件：

cat clean{1..5}.bin > secret.rar md5sum secret.rar # 验证与响应头一致

4.3 破解RAR伪加密

RAR伪加密是通过修改文件头中的加密标志位实现的假加密：

使用010 Editor分析：
- 在偏移0x14处查看加密标志
- 正常文件：0x00；伪加密：0x84 → 改为0x00

Python修复脚本：

with open('secret.rar', 'r+b') as f: f.seek(0x14) if f.read(1) == b'\x84': f.seek(0x14) f.write(b'\x80')

提取最终内容：

unrar x secret.rar cat flag.txt # HTB{th1s_1s_wh4t_r34l_f0r3ns1cs_l00ks_l1k3}

5. 高级技巧与故障排除

即使掌握了基本方法，实际分析中仍会遇到各种挑战。以下是几个常见问题的解决方案：

5.1 处理不完整捕获

当关键数据包缺失时，可以尝试：

使用editcap修复pcap文件头
通过文件尾签名逆向恢复（如ZIP的中央目录记录）
对损坏压缩包使用zip -FF或rar r修复命令

5.2 识别非常见协议

对于自定义协议传输的文件：

分析协议结构（如魔数、长度字段）
编写Wireshark解析器（Lua脚本）

使用scapy提取特定字段：

from scapy.all import * packets = rdpcap('custom.pcap') extracted = b''.join(p[Raw].load[8:] for p in packets if Raw in p)

5.3 性能优化技巧

处理大型pcap文件时：

使用dumpcap代替Wireshark直接捕获
应用精确显示过滤器减少内存占用
对万兆网络流量，考虑使用PF_RING或硬件加速

# 高效提取特定流的所有数据 tshark -r large.pcap -Y "ip.addr==192.168.1.100 && tcp.port==1234" -T fields -e data.data | tr -d '\n' | xxd -r -p > stream.bin

网络流量分析既是科学也是艺术。记得在一次取证比赛中，我花了三小时追踪一个被分割成37个碎片的PDF文件传输，最终在TCP重传包中找到了缺失的关键部分。这种经历让我深刻理解到：耐心和系统的方法论比任何工具都重要。下次当你面对海量数据包时，不妨先深呼吸，然后按照我们今天介绍的流程一步步推进——那些隐藏的文件终将浮出水面。

查看全文

http://www.jsqmd.com/news/857723/