当前位置: 首页 > news >正文

[Django] DisallowedHost突然爆发?ALLOWED_HOSTS=‘*‘为什么没用+中间件根治方案(附代码)

Django 生产环境 DisallowedHost 突然爆发?ALLOWED_HOSTS=['*'] 为什么没用?

TL;DR:你的 Django 项目突然开始报DisallowedHost,日志里 Host 是一个奇怪的下划线_,而你明明设了ALLOWED_HOSTS = ['*']。问题出在 Django 的 Host 校验分两步——先做 RFC 1034/1035 域名合法性校验,通过才查 ALLOWED_HOSTS。_不是合法域名,连第一关都过不去。根治方案:一个 15 行的中间件,在 CommonMiddleware 之前拦截。


1. 事故现场

某天早上,含光博客的日志/邮件告警里出现了这样一个错误(关键信息已标注):

DisallowedHostat/InvalidHTTP_HOSTheader:'_'.ThedomainnameprovidedisnotvalidaccordingtoRFC1034/1035.# ⬇ 三行关键证据HTTP_HOST='_'HTTP_USER_AGENT='Hello from Palo Alto Networks, find out more about our scans...'HTTP_X_FORWARDED_FOR='203.0.113.1'ALLOWED_HOSTS=['*','127.0.0.1','example.com']# ← 明明设了通配符

第一反应ALLOWED_HOSTS = ['*']不是应该放行所有 Host 吗?怎么还报 DisallowedHost?


2. 根因:Django 的 Host 校验是两步,不是一步

翻 Django 源码django/http/request.pyget_host()方法的逻辑是:

defget_host(self):host=self._get_raw_host()# 从 HTTP_HOST / SERVER_NAME 取# 第一步:RFC 1034/1035 域名合法性校验host,port=split_domain_port(host)ifhostandnothost_validation_re.match(host):raiseDisallowedHost(f"Invalid HTTP_HOST header:{host!r}.")# 第二步:ALLOWED_HOSTS 白名单比对ifnotvalidate_host(host,settings.ALLOWED_HOSTS):raiseDisallowedHost(f"Invalid HTTP_HOST header:{host!r}.")returnhost

关键发现:第一步的host_validation_re正则在对ALLOWED_HOSTS生效之前就已经跑了。

_为什么通不过这个正则?因为 RFC 1034/1035 规定域名只能包含字母、数字和连字符(-),_(下划线)不在合法字符集中。所以_直接在第一关被毙,根本走不到第二步的通配符*

Host 值第一步(RFC 校验)第二步(ALLOWED_HOSTS)结果
www.baidu.com200
_.com❌(含_不会走到DisallowedHost
纯数字 IP1.2.3.4200
单下划线_不会走到DisallowedHost
example.com200

ALLOWED_HOSTS = ['*']保证的是第二步永远通过,但救不了第一步的 RFC 合规性检查


3. 这些畸形 Host 从哪来?

互联网扫描器(Shodan、Censys、Palo Alto Cortex Xpanse 等)在持续探测公网资产。它们发请求时可能会:

  • Host: 你的IP(用 IP 而非域名)
  • Host: _(占位符/探测标记)
  • Host: <script>alert(1)</script>(XSS 探测)
  • 完全不发 Host 头(某些 HTTP/1.0 客户端)

这些都不是攻击——只是常规资产扫描。但 Django 默认会为每个 DisallowedHost 记录 traceback + 发邮件给 ADMINS,日志和邮箱很快会被撑满。


4. 解决方案对比

方案拦截点副作用推荐度
方案 A:Django 自定义中间件应用层(Django)⭐⭐⭐⭐⭐
方案 B:Nginx/Caddy 过滤反向代理层需 Web Server 配合⭐⭐⭐⭐
方案 C:修改 ALLOWED_HOSTS配置治标不治本(见第 2 节)
方案 D:忽略日志核弹级——真正的攻击 Host 注入也会被掩盖

推荐方案 A,原因是: 1. 不依赖 Web Server(含光博客的 Nginx 是 frp 穿透进来的,直接配 Nginx 有坑) 2. 15 行代码,无外部依赖 3. 精确控制——只拦截畸形 Host,正常请求零影响


5. 实现:BlockBadHostMiddleware

在 Django 项目的middleware.py(或任何 middleware 文件)中添加:

importrefromdjango.httpimportHttpResponse# RFC 1034/1035 合法域名正则# 匹配:example.com / sub.example.com / localhost / 纯 IPv4# 不匹配:_ / _something / -bad.com_HOST_RE=re.compile(r"^[a-zA-Z0-9]([a-zA-Z0-9\-]{0,61}[a-zA-Z0-9])?"r"(\.[a-zA-Z0-9]([a-zA-Z0-9\-]{0,61}[a-zA-Z0-9])?)*$")classBlockBadHostMiddleware:"""在 CommonMiddleware 之前拦截无效 Host,避免 DisallowedHost traceback"""def__init__(self,get_response):self.get_response=get_responsedef__call__(self,request):host=request.META.get("HTTP_HOST","")ifhostandnot_HOST_RE.match(host.split(":")[0]):returnHttpResponse("Bad Request",status=400)returnself.get_response(request)

然后在settings.pyMIDDLEWARE列表最前面插入:

MIDDLEWARE=['yourapp.middleware.BlockBadHostMiddleware',# ← 必须第一位!'django.middleware.security.SecurityMiddleware',# ... 其他中间件]

为什么必须第一位?Django 中间件按列表顺序执行。CommonMiddleware(包含get_host()调用)如果在BlockBadHostMiddleware之前执行,拦截器就没机会跑了。


6. 验证

# 畸形 Host → 400$curl-s-o/dev/null-w"%{http_code}"http://127.0.0.1:8770/-H"Host: _"400# 正常域名 → 200$curl-s-o/dev/null-w"%{http_code}"http://127.0.0.1:8770/-H"Host: www.baidu.com"200

畸形 Host 被静默拦截为 400,不再触发 traceback 和邮件告警。正常请求零影响。


7. 延伸:为什么 DNS 允许下划线但 HTTP Host 不允许?

这里有一个容易混淆的点:

  • DNS 层面:SRV 记录(_http._tcp.example.com)和 DKIM/SPF 等确实使用下划线,RFC 2181 明确说"DNS 不对 label 内容做限制"
  • HTTP Host 头层面:RFC 952 + RFC 1123(主机名规范)禁止下划线。Django 的host_validation_re遵循的是主机名规范,不是 DNS 规范

所以_dmarc.example.com作为 DNS 记录是合法的,但作为 HTTP Host 头传给 Django 就会被拒绝——除非你在前面放了这个中间件。


8. 总结

你看到的真实原因修法
DisallowedHost: '_'扫描器发的畸形 Host自定义中间件,返回 400 而不是抛异常
ALLOWED_HOSTS=['*']却没用*只管第二步,管不了第一步 RFC 校验中间件插在 MIDDLEWARE 第一位
日志/邮箱被撑满每个畸形请求都触发 traceback + 邮件拦截后只返回 400,无 traceback

这个错误在生产环境非常常见——任何暴露在公网的 Django 项目都会被扫描器光顾。上述 15 行中间件可以永久解决这个问题。


本文代码已在 Django 5.2 + Gunicorn 生产环境中验证通过。如果你也有类似的排查经验,欢迎在评论区交流。

http://www.jsqmd.com/news/1053177/

相关文章:

  • 5分钟掌握英雄联盟内存换肤:R3nzSkin终极使用指南
  • Ubuntu 18.04 Node.js 安装避坑指南:nvm、NodeSource 与 apt 选型逻辑
  • Qwen 3.6-27B本地部署实战:vLLM优化、长上下文对齐与PLC智能体落地
  • Selenium架构深度解析:从WebDriver协议到自动化测试框架设计
  • 如何永久保存微信聊天记录?WeChatMsg完整指南帮你掌控个人数据
  • 终极AMD处理器性能调优指南:掌握SMU调试工具的专业技巧
  • [特殊字符] 从零到一:Python 爬取微博热搜与热门话题实时帖子的终极实战指南(2026最新版)
  • 5步高效部署HunterPie:Monster Hunter: World游戏覆盖层终极指南
  • Java Playwright自动化测试:高级元素定位策略与实战技巧
  • LPC21xx/22xx Flash编程与代码保护:ISP/IAP实战与CRP避坑指南
  • LS1028A/i.MX 8M嵌入式图形与多外设开发实战:从GPU加速到NFC/BLE集成
  • [Android] FixPlus-AI一键擦除衣服变性感美女
  • LinkSwift:九大网盘直链下载助手,告别限速的本地解析方案
  • NoFences:终极免费桌面整理神器,3步打造整洁高效工作空间
  • 嵌入式GUI开发:emWin SWIPELIST控件配置、API与界面设计实战
  • Qwen3.7-Max 实操指南:百炼平台调用、结构化输出与Token Plan配置
  • OpenClaw与Grok Build 0.1集成:本地智能体工作流引擎+模型服务化实战
  • 3分钟掌握Translumo:让外语游戏和视频瞬间变中文的智能翻译神器
  • ARKit 6.0空间锚点动态持久化实战
  • 【基于机器学习的租房信息分析系统】Python+mysql+Django,2(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码
  • 终极指南:如何在Mac上完美使用Xbox手柄驱动解决方案
  • NXP MCUXpresso FOC参数调优实战:从电机辨识到速度环整定
  • 嵌入式GUI开发利器:emWin仿真器从入门到实战应用
  • 接口自动化测试实战:从零搭建Python+pytest框架与CI/CD集成
  • NXP Real-time Edge Yocto项目实战:构建确定性实时边缘计算系统
  • 第5章:HTTP API入门——用curl调用本地模型
  • Java 插入排序:抓牌怎么排,它就怎么排
  • HandheldCompanion:为掌上游戏电脑打造的全能控制中心
  • 流媒体下载失败频发?N_m3u8DL-RE 5分钟解决90%常见问题
  • Gemini 3.1 Pro实测:长上下文理解与结构化输出的工程落地指南