当前位置：首页 > news >正文

项目实训（五）：面向 AI 解释的 SQL 注入传播链记录

news 2026/6/22 0:18:08

一、本次改动的背景

上一篇里，我主要补了函数调用传播和作用域处理，让 SQL 注入检测不再只停留在函数定义本身，而是可以根据真实调用点的实参状态，继续进入函数体做分析。

这一轮没有新增新的漏洞类型，也没有大幅调整整体架构，而是继续沿着 SQL 注入这条主线，把检测结果里的“传播过程”记录得更完整一些。

之前后端已经可以输出source_line、sql_build_line、sink_line这类字段，能够说明用户输入、SQL 构造和execute(...)大概分别出现在哪几行。

但这些信息还是比较粗。它们能说明“风险发生在哪”，却不能完整说明“数据是怎么一步步传过去的”。对于后续 AI 解释来说，如果只拿到SQLInjection标签和几个行号，生成的解释就容易比较泛。

所以这次的重点，是先由后端把传播链事实记录清楚，再交给后续 AI 模块组织成用户能看懂的说明和修复建议。

二、新增 flow_trace 传播链

这次主要新增了一个结构化字段：

flow_trace

它用来记录从 source 到 sink 的关键传播步骤。目前主要记录：

source assign function_call parameter_bind sql_build sink

对于涉及返回值传播的场景，也会继续记录return相关步骤。

也就是尽量把下面这条链路记录下来：

用户输入 -> 变量赋值 -> 函数调用 -> 参数绑定 -> SQL 构造 -> execute 执行

这里我没有选择在 B 阶段直接生成一大段中文解释，而是先保留结构化事实。因为 B 阶段更适合做静态分析和证据提取，比如哪一行识别到了用户输入、哪个变量被污染、实参绑定到了哪个形参、SQL 在哪里构造、最终在哪里进入execute(...)。

这些信息本身不一定适合直接展示给用户，但很适合交给后续 AI 解释模块使用。

三、传播链记录了什么

这次在后端新增了EvidenceStep，用来表示传播链上的一步。它大致记录：

kind line symbol from_symbol to_symbol function_name source_kind source_label source_selector sink_label sql_shape

其中kind表示当前步骤的类型，例如source、assign、function_call、parameter_bind、sql_build、sink。

例如下面这段代码：

defrun_query(uid):sql=f"SELECT * FROM users WHERE id ={uid}"cursor.execute(sql)user_id=request.args.get("id")run_query(user_id)

内部可以记录出类似这样的传播链：

source@5 -> assign@5 -> function_call@6 -> parameter_bind@6 -> sql_build@2 -> sink@3

对应含义是：第 5 行识别到用户输入，并赋值给user_id；第 6 行user_id被传入run_query，并绑定到形参uid；第 2 行uid被拼接进动态 SQL；第 3 行 SQL 进入cursor.execute。

这样后端输出的结果就不只是“这里有 SQL 注入风险”，而是能把风险形成过程记录下来。后续 AI 可以根据这些步骤生成更自然的解释，例如说明用户输入如何进入函数、如何参与 SQL 构造、最后如何到达执行点。

四、和前端、AI 模块的关系

这里我做了一个边界区分。

flow_trace目前主要保留在 B 阶段的中间结果里，也就是：

RiskCandidate.flow_trace

它主要服务后续 AI 解释模块和结果整理层。

最终返回给 VS Code 插件的RiskItem暂时不直接暴露完整传播链。因为前端当前更需要展示的是风险类型、风险说明、修复建议和最终解释，而不是底层的每一个传播步骤。

目前分工大致是：

B 阶段：记录结构化传播链 AI 解释模块：根据传播链生成解释和修复建议 前端插件：展示最终整理后的检测结果

这样职责会清楚一些，也方便后续继续扩展。

五、测试情况与目前边界

这次补充了函数调用传播链相关测试，重点验证函数调用场景下能够记录：

source assign function_call parameter_bind sql_build sink

运行命令为：

python-m unittest discover-s tests

当前测试结果：

Ran 35 tests OK

目前flow_trace主要还是服务 Python SQL 注入检测主线，已经可以覆盖普通变量传播、函数调用、参数绑定、返回值传播和executesink。

不过它还没有完整覆盖跨文件调用、类方法、对象属性、容器元素、高阶函数等复杂情况。这些后续可以继续通过补充新的EvidenceStep.kind或扩展字段来完善。

整体来看，这一轮改动不算大，重点也不是新增检测能力，而是让已有 SQL 注入检测结果更适合后续 AI 解释。之前后端更多是输出几个关键行号，现在则开始记录更细的传播链事实：

source -> assign -> function_call -> parameter_bind -> sql_build -> sink

这样后续 AI 模块在生成漏洞解释时，就不需要只根据风险标签和行号进行推测，而是可以基于后端给出的结构化传播路径，生成更准确、更贴近代码实际执行过程的说明和修复建议。

查看全文

http://www.jsqmd.com/news/750066/

如何在5分钟内解锁你的加密音乐收藏：Unlock-Music完整指南

2026年武汉微电影制作拍摄公司TOP7权威排行榜，为你揭晓行业佼佼者！ - 品牌推荐官方

魔兽争霸3终极助手：3步配置WarcraftHelper解锁宽屏与高帧率

城通网盘下载太慢？这个免费神器让你秒变下载达人！

别再手动降噪了！用FFmpeg的arnndn+AI模型，批量处理播客录音真香

如何实现Unity游戏实时翻译：XUnity.AutoTranslator技术深度解析

30秒生成CSDN技术博客封面！GPT-Image-2适配平台规范的参数配置指南

EasyClick 双端自动化智能体｜AndroidiOS 全平台 EC 脚本开发助手

MOOTDX：量化投资中的通达信数据整合技术突破

新手如何通过快马平台轻松上手windows18-hd19主题开发项目

现代汽车租赁前端系统架构：从React技术栈到工程实践全解析

2026年成都打酒铺热销品牌TOP7权威排行榜，速来围观！ - 品牌推荐官方

第3篇：数据的运算——让数据动起来仓颉中文编程

3步解锁数字音乐自由：QMCDecode全面解析

无锡黄金回收避坑指南：选福正美，不扣点不熔金 - 福正美黄金回收

终极本地Cookie导出指南：Get cookies.txt LOCALLY完全教程

DownKyi哔哩下载姬：B站视频下载与处理的完整解决方案

2026 南通上门黄金变现，福正美黄金奢饰品回收排名靠前 - 福正美黄金回收

Dell G15终极散热控制指南：如何用开源工具告别过热烦恼[特殊字符]

深入/sys/kernel/debug：揭秘Linux内核动态打印（dynamic_debug）的工作原理与实现

如何快速掌握Python通达信数据获取：面向量化新手的完整指南

深度解析roop-unleashed：无训练AI人脸交换框架的架构创新与实战指南

为什么4.8元付费降AI比免费工具效果好：付费免费技术差距极致数据反差深度解读

完全掌握手柄映射：3步让任何游戏支持手柄操控的终极方案

唤醒沉睡的Surface RT：3步解锁ARM设备的远程桌面潜能 [特殊字符]

Android性能优化实战：用Systrace揪出BufferQueue卡顿的元凶（附完整分析流程）

避坑指南：STM32F051的ADC用TIM1触发时，DMA数据错位或采不到？

Python 爬虫进阶技巧：连接池复用减少网络开销

3分钟零基础教程：DoL-Lyra整合包打造个性化游戏体验

2026年广州广告公司制作TOP7权威排行榜，实战榜单为你全景解析！ - 品牌推荐官方

一、本次改动的背景

二、新增 flow_trace 传播链

三、传播链记录了什么

四、和前端、AI 模块的关系

五、测试情况与目前边界

相关文章：