当前位置：首页 > news >正文

Apache Superset CVE-2023-27524未授权访问漏洞深度解析

news 2026/8/2 12:47:21

1. 这个漏洞不是“能登录”，而是“根本没设门”

Apache Superset 是我过去三年在数据可视化项目里用得最顺手的开源BI工具——轻量、可插拔、SQL Lab写查询像写Python一样自然。但2023年3月爆出的 CVE-2023-27524，让我在给某省属国企做安全加固时当场愣住：一个刚部署完、连管理员账号都还没来得及改密码的新环境，外部IP直接访问/api/v1/me就返回了完整的用户信息；再试/api/v1/chart，未经任何认证，竟能拉出全部仪表盘元数据，包括创建人、SQL语句、数据源ID……这不是弱口令问题，也不是配置疏忽，是Superset在特定版本中，把身份校验逻辑绕过去了。

关键词：Apache Superset、CVE-2023-27524、未授权访问、API权限绕过、RBAC失效、安全加固

这个漏洞的本质，是Superset的Flask App在处理某些REST API路由时，错误地跳过了@has_access_api装饰器的校验链。它不依赖于你是否设置了AUTH_ROLE_PUBLIC，也不看你有没有启用LDAP或OAuth——只要请求路径匹配特定正则模式（比如以/api/v1/开头且未被显式排除），而服务端又恰好运行在受影响版本上，请求就直接进到了业务逻辑层。我后来复现时特意关掉所有认证后端，只留本地DB，照样能拿到/api/v1/dataset列表。这意味着：它不是“认证没生效”，而是“压根没走到认证那一步”。

适合谁看？如果你正在用Superset做内部数据平台、已上线生产环境、或正准备选型评估，这篇就是你的紧急检查清单。不需要你懂Flask源码，但需要你能SSH进服务器、查版本、改配置、验证修复效果。文中所有操作步骤，我都已在CentOS 7 + Superset 2.0.1、Ubuntu 22.04 + Superset 2.1.0两套环境实测通过，命令可直接复制粘贴，参数值全部标注了来源依据和取舍逻辑。

2. 漏洞成因：不是代码写错了，是路由注册逻辑“短路”了

2.1 核心触发点：`/api/v1/`路由的“白名单豁免”机制

要真正理解CVE-2023-27524，必须回到Superset的API路由注册机制。Superset的REST API并非全部走统一鉴权入口，而是分成了两类：

标准API：如/api/v1/dashboard/{id}、/api/v1/chart/{id}，这些路由明确绑定了@has_access_api装饰器，会强制校验当前用户是否有对应资源的can_read权限；
“快捷通道”API：如/api/v1/me、/api/v1/health、/api/v1/version，这些接口设计初衷是供前端健康检查或用户自助获取基础信息，因此在早期版本中被硬编码进了“无需鉴权白名单”。

问题出在Superset 2.0.0之前（含2.0.0）的superset/app.py中一段关键逻辑：

# superset/app.py (v2.0.0 及更早) if request.path.startswith("/api/v1/") and not request.path.startswith("/api/v1/security/"): # 此处本应调用 check_auth()，但实际漏掉了 pass # ← 就是这一行，导致后续所有 /api/v1/ 接口跳过鉴权

这段代码的本意是：对/api/v1/security/下的认证相关接口（如登录、登出）走完整流程，其余/api/v1/接口则交由各Endpoint自行决定是否鉴权。但实际执行时，由于Flask蓝图注册顺序与装饰器加载时机的耦合缺陷，当请求进入/api/v1/前缀路由时，全局before_request钩子尚未触发，而各Endpoint又未显式声明@has_access_api，最终形成“真空地带”。

我用curl -v http://localhost:8088/api/v1/me抓包验证过：响应头里根本没有Set-Cookie，也没有重定向到/login，HTTP状态码直接是200，Body里明文返回了{"id": 1, "username": "admin", "first_name": "Admin", ...}。这说明请求根本没经过SecurityManager的is_authenticated()判断，连Session都没初始化。

2.2 为什么`AUTH_ROLE_PUBLIC`设置无效？

很多团队第一反应是去改superset_config.py里的AUTH_ROLE_PUBLIC = "Public"，以为把公开角色权限拉满就能堵住。这是典型误区。AUTH_ROLE_PUBLIC只控制已登录用户的默认角色权限，而CVE-2023-27524的问题在于：请求压根没被识别为“需要登录”。

你可以做个实验：在漏洞环境中，先用正确账号密码登录一次，拿到有效Cookie，然后用curl -b "session=xxx" http://host/api/v1/me，此时返回的是你自己的用户信息；但如果你删掉Cookie，再发curl http://host/api/v1/me，依然返回admin信息——因为后一次请求根本没进到“查Session”的环节，AUTH_ROLE_PUBLIC连被读取的机会都没有。

提示：AUTH_ROLE_PUBLIC只在用户完成认证后、分配默认角色时起作用。它解决的是“登录后能看什么”，而非“谁可以登录”。CVE-2023-27524绕过的是“登录”这个动作本身。

2.3 影响范围精确测绘：哪些版本躺枪，哪些版本免疫？

官方公告说“2.0.0及以下版本受影响”，但实际影响边界比这更细。我逐行比对了GitHub上Superset v1.5.2 → v2.1.1的app.py和security.py变更，确认以下版本矩阵：

Superset 版本	是否受影响	关键依据
≤ 1.5.2	是	`app.py`中存在未修复的`/api/v1/`路由短路逻辑
2.0.0	是	官方CVE公告明确列出，实测`/api/v1/dataset`可未授权访问
2.0.1	是	补丁仅修复了`/api/v1/me`，未覆盖`/api/v1/chart`等其他接口（见PR #21982）
2.1.0	否	合并PR #22145，重构整个API鉴权链，所有`/api/v1/`路由强制走`@has_access_api`
≥ 2.1.1	否	在2.1.0基础上增加单元测试覆盖边界case

特别注意：2.0.1是个“伪修复”版本。Superset团队在2.0.1中只给/api/v1/me加了显式鉴权，但/api/v1/chart、/api/v1/dashboard、/api/v1/dataset等高危接口仍处于裸奔状态。我在某金融客户环境就遇到过：他们升级到2.0.1后，安全扫描依然报CVE-2023-27524 HIGH，就是因为扫描器调用了/api/v1/chart并成功返回了200。

注意：不要轻信“已升级到2.x就安全”的说法。必须精确到小版本号，并用真实API调用验证。补丁不是打在“大版本”上，而是打在具体某次commit里。

3. 实战检测：三步定位，拒绝“我以为修好了”

3.1 第一步：快速版本识别（不登录、不看日志）

最稳妥的版本探测方式，是直接请求Superset的公开接口。/api/v1/version是唯一一个官方承诺永远无需鉴权的接口，且返回JSON中包含精确版本号：

curl -s "http://your-superset-host:8088/api/v1/version" | jq -r '.version' # 返回示例：2.0.1

如果返回404或非JSON内容，说明该实例可能：

已手动禁用/api/v1/version（极少见）；
运行在Nginx/Apache反向代理后，且代理规则屏蔽了/api/v1/（需检查代理配置）；
版本低于1.4.0（该接口1.4.0引入）。

此时改用第二方案：抓取首页HTML中的meta标签。Superset在<head>里埋了版本注释：

curl -s "http://your-superset-host:8088/" | grep -o 'superset-[0-9.]*' | head -1 # 返回示例：superset-2.0.1

提示：别依赖pip show apache-superset，生产环境常有多个Python环境，which superset和pip可能指向不同位置。线上检测必须走HTTP接口。

3.2 第二步：核心接口探活（模拟攻击者视角）

确认版本后，立即测试三个最具杀伤力的未授权接口。我封装了一个10行shell脚本，保存为check_cve.sh，运维同事也能一键跑：

#!/bin/bash URL="http://your-superset-host:8088" echo "=== Testing $URL ===" for endpoint in "/api/v1/me" "/api/v1/chart" "/api/v1/dataset"; do echo -n "[$endpoint] " CODE=$(curl -s -o /dev/null -w "%{http_code}" "$URL$endpoint") if [ "$CODE" = "200" ]; then echo "✅ VULNERABLE (HTTP $CODE)" # 额外获取前200字符确认内容真实性 curl -s "$URL$endpoint" | head -c 200 | sed 's/[[:space:]]\+/ /g' | cut -c1-80 else echo "❌ Safe (HTTP $CODE)" fi done

执行结果示例：

=== Testing http://superset-prod:8088 === [/api/v1/me] ✅ VULNERABLE (HTTP 200) {"id":1,"username":"admin","first_name":"Admin","last_name":"User","email":"admin@ex... [/api/v1/chart] ✅ VULNERABLE (HTTP 200) {"result":[{"id":1,"slice_name":"Sales Trend","viz_type":"line","datasource_id":2... [/api/v1/dataset] ✅ VULNERABLE (HTTP 200) {"result":[{"id":2,"table_name":"sales_data","sql":"SELECT * FROM sales WHERE ...

只要任意一个返回200且Body含有效JSON，即可100%确认存在漏洞。注意：返回200但Body是空JSON{}或错误提示（如{"message":"Forbidden"}）不算漏洞，说明已修复。

3.3 第三步：深度验证（确认数据泄露程度）

如果前两步确认漏洞存在，下一步是量化风险等级。我建议按数据敏感度分三级验证：

风险等级	验证接口	可获取信息	应对优先级
高危	`/api/v1/dataset`	所有数据集名称、关联数据库ID、原始SQL（若启用了`SQLLAB_BACKEND_PERSISTENCE`）	立即阻断
中危	`/api/v1/chart`	所有图表名称、类型、关联数据集ID、过滤条件（可能含业务逻辑）	24小时内修复
低危	`/api/v1/me`	当前admin账号基础信息（用户名、邮箱）	48小时内修复

实测中，/api/v1/dataset最危险。某次为客户做渗透测试时，该接口返回了"sql": "SELECT customer_id, phone, address FROM customers WHERE status='active'"——这意味着攻击者无需任何凭证，就能直接看到脱敏规则（phone字段未掩码）、表结构（customers）、甚至业务状态字段（status='active'）。这种信息足以支撑后续针对性社工或撞库。

注意：不要在生产环境随意调用/api/v1/dataset并打印全部结果。用jq '.result[] | select(.table_name=="sensitive_table")'精准过滤，避免无意中导出全量数据。

4. 修复方案：不止打补丁，更要建立防御纵深

4.1 方案一：升级到安全版本（推荐，但需谨慎验证）

官方明确修复版本是2.1.0+。升级不是简单pip install --upgrade apache-superset，必须遵循以下四步：

备份数据库：Superset元数据全存在superset.db（SQLite）或PostgreSQL中。执行：

# SQLite cp /path/to/superset.db /backup/superset.db.$(date +%Y%m%d) # PostgreSQL pg_dump -U superset -h localhost superset > /backup/superset_pg_$(date +%Y%m%d).sql

停服并清理缓存：Superset升级后，旧版缓存可能引发兼容性错误。
```
superset run --stop rm -rf ~/.superset/cache/
```
升级并初始化：--upgrade-db会自动执行SQL迁移，但必须确保数据库连接正常。
```
pip install "apache-superset>=2.1.0" superset db upgrade superset init
```
回归验证：重点验证三件事：
- 原有仪表盘能否正常加载（检查/api/v1/dashboard返回200且含result字段）；
- SQL Lab执行历史是否完整（/api/v1/log返回200）；
- 最关键：用3.2节脚本重跑，确认所有/api/v1/*接口均返回401或302。

提示：升级后首次访问Web UI可能变慢，因为Superset 2.1.0启用了新的前端构建缓存机制。等待2分钟或清浏览器缓存即可。切勿因页面加载慢而回退版本。

4.2 方案二：反向代理层拦截（适用于无法立即升级的场景）

如果生产环境因合规审计或依赖锁定无法升级，必须用Nginx/Apache在流量入口处做拦截。这是临时但有效的“外科手术式”防护。

Nginx配置示例（放在server块内）：

# 拦截所有未带Authorization头的 /api/v1/ 请求 location ^~ /api/v1/ { # 允许健康检查接口（Superset 2.1.0+要求） if ($request_uri ~ "^/api/v1/health$") { proxy_pass http://superset_backend; break; } # 允许登录、登出等认证接口 if ($request_uri ~ "^/api/v1/security/(login|logout|csrf_token)$") { proxy_pass http://superset_backend; break; } # 其他所有 /api/v1/ 请求，必须带 Authorization 或 Cookie if ($http_authorization = "") { set $blocked "1"; } if ($http_cookie !~ "session=") { set $blocked "${blocked}1"; } if ($blocked = "11") { return 401 "Unauthorized: Missing credentials"; } proxy_pass http://superset_backend; }

此配置的核心逻辑是：只放行明确需要公开的接口（/health、/login），其余所有/api/v1/请求，必须携带Authorization头或sessionCookie。我在线上环境实测，该规则能100%拦截curl http://host/api/v1/me，同时不影响前端正常登录流程。

注意：Nginx的if指令性能较低，但此处仅用于安全拦截，QPS极低，可接受。切勿在if中做复杂正则或变量拼接。

4.3 方案三：最小权限配置加固（长期防御基石）

即使升级到2.1.0+，也不能认为万事大吉。Superset的RBAC模型仍有优化空间。我在某电商客户处落地了一套“三线防御”配置：

禁用Public角色所有API权限（superset_config.py）：

# 默认Public角色拥有"can read" on "All Datasources"，必须收紧 FAB_ROLES = { "Public": [ ["can_read", "DashboardModelView"], ["can_read", "ChartModelView"], # 移除 ["can_read", "DatasetModelView"] 和 ["can_read", "SqlLab"] ], }

关闭SQL Lab的匿名执行能力（关键！）：

# 即使用户已登录，也禁止执行任意SQL SQLLAB_BACKEND_PERSISTENCE = False # 关闭SQL历史持久化 SQLALCHEMY_EXPERIMENTAL = True # 启用实验性SQL解析器，增强语法校验

数据库连接层网络隔离：
- Superset应用服务器与数据库之间使用私有子网，禁止公网IP直连；
- 数据库防火墙规则只允许可信IP段（如K8s Pod CIDR）访问5432端口；
- 对customers、users等敏感表，额外配置行级安全策略（PostgreSQL RLS）。

这套组合拳的效果是：即使未来出现新的API绕过漏洞，攻击者最多只能看到仪表盘列表，无法触达底层数据表，更无法执行SQL。

经验：Superset的安全不是“打一个补丁就结束”，而是“应用层（Superset）+ 网络层（Nginx）+ 数据层（DB）”的三层过滤。每一层都应假设下一层可能失效。

5. 复盘与延伸：从CVE-2023-27524学到的5条血泪教训

5.1 教训一：开源组件的“小版本号”比“大版本号”更重要

Superset 2.0.0和2.0.1看起来只差一个补丁号，但安全水位天壤之别。我见过太多团队在安全报告里写“已升级至Superset 2.x”，结果审计时发现是2.0.1，漏洞依旧。必须把版本号精确到三位（如2.1.0），并写入CMDB资产台账。我们现在的做法是：每次pip install后，自动执行superset version并将输出写入/etc/superset/VERSION，Zabbix监控脚本每5分钟检查一次该文件，异常即告警。

5.2 教训二：API安全不能只靠“认证”，必须做“路由级鉴权”

CVE-2023-27524暴露的根本问题是：Superset把“认证”（Authentication）和“鉴权”（Authorization）混为一谈。它以为“用户登录了”，就默认所有API都该被授权访问。但现代API设计原则是：每个Endpoint必须独立声明所需权限。我们在自研的BI平台中，强制要求所有Flask路由必须带@require_permission("dataset:read")装饰器，且权限字符串需经中央策略引擎校验，杜绝“全局开关”式配置。

5.3 教训三：安全扫描必须覆盖“未登录态”，而非只扫登录后

很多企业采购的商业扫描器，默认用admin账号登录后再爬API，这完全漏掉了CVE-2023-27524这类漏洞。我们现在的安全测试SOP是：第一轮用空Cookie扫描所有/api/路径，第二轮用admin账号扫描，第三轮用最低权限账号扫描。三轮结果对比，才能发现权限越界或绕过问题。

5.4 教训四：生产环境的`DEBUG=True`是定时炸弹

Superset默认DEBUG=False，但有些团队为排查问题临时开启，重启后忘记关闭。DEBUG=True时，Flask会暴露详细错误堆栈，其中可能包含数据库连接串、文件路径、环境变量。我在某次应急响应中，就从/api/v1/me的500错误页里看到了psycopg2.OperationalError: password authentication failed for user "superset_db"——这直接暴露了数据库用户名。所有生产环境的superset_config.py必须显式声明DEBUG = False，CI/CD流水线加入检查脚本。

5.5 教训五：文档里的“默认配置”往往是最大风险源

Superset官方文档强调AUTH_TYPE = AUTH_DB是推荐配置，却没强调AUTH_ROLE_PUBLIC = "Public"带来的隐式风险。我们现在的做法是：所有新上线的开源组件，必须人工审计其default_config.py，将所有True、"Public"、"admin"类默认值标记为高危项，逐一评估是否需修改。例如，Superset的ENABLE_PROXY_FIX = False默认值，在K8s Ingress环境下会导致X-Forwarded-For失效，必须改为True——但这个修改又可能引发新的Header注入风险，需同步加白名单校验。

最后分享一个真实案例：某政务云平台因未及时修复CVE-2023-27524，被攻击者通过/api/v1/dataset获取到人口库表结构，进而构造SQL注入探针，最终窃取了12万条居民身份证号。而修复方案，只是升级到2.1.0并重启服务，耗时17分钟。安全不是玄学，它就藏在版本号、配置项、一行curl命令里。你今天的17分钟，可能就是明天避免百万损失的关键。

查看全文

http://www.jsqmd.com/news/894076/