当前位置：首页 > news >正文

AI赋能二进制安全：BinAIVulHunter项目实战与逆向工程集成

news 2026/5/13 0:57:07

1. 项目概述与核心价值

最近在安全圈里，一个名为BinAIVulHunter的开源项目引起了我的注意。这个项目名直译过来就是“二进制AI漏洞猎人”，光看名字就能猜到它的核心玩法：利用人工智能技术，来自动化分析二进制文件，挖掘其中的安全漏洞。对于常年和IDA Pro、Ghidra、逆向工程打交道的我来说，这无疑是一个极具吸引力的方向。传统的漏洞挖掘，无论是Fuzzing还是人工审计，都高度依赖研究员的经验、精力和运气，过程漫长且充满不确定性。BinAIVulHunter的出现，代表着一种新的可能性——将AI的“模式识别”和“自动化”能力，注入到二进制安全分析这个硬核领域，尝试让机器去学习顶尖安全专家的“直觉”和“经验”。

简单来说，BinAIVulHunter是一个旨在利用深度学习模型，直接从二进制程序的函数级别表示中，自动识别潜在漏洞模式（如缓冲区溢出、格式化字符串漏洞、整数溢出等）的工具。它不是一个“黑盒”扫描器，而是一个需要你提供二进制文件，然后它能给出函数级别的漏洞风险评分的辅助分析框架。它的价值在于，能够帮助安全研究员、逆向工程师在分析海量代码或面对不熟悉的架构时，快速定位高风险区域，将有限的人力聚焦在最可能出问题的地方，从而大幅提升漏洞挖掘的效率。

这个项目适合谁呢？首先，当然是二进制安全研究员和漏洞猎人，它能成为你武器库中的一个强力“探针”。其次，对于从事恶意软件分析、IoT设备固件安全评估的工程师，面对大量无源码的二进制文件，这个工具可以提供初步的风险筛查。最后，对于想要了解AI如何应用于网络安全领域的学生和爱好者，BinAIVulHunter的代码和思路也是一个绝佳的学习案例。接下来，我将从项目设计思路、核心实现、实操部署到问题排查，为你完整拆解这个“AI漏洞猎人”是如何工作的，以及如何让它为你效力。

2. 核心设计思路与技术选型解析

2.1 为什么选择“函数级”分析与AI结合？

在深入代码之前，理解BinAIVulHunter的设计哲学至关重要。它没有选择对整个二进制文件进行“黑盒”模糊测试，也没有尝试进行完全的符号执行或污点分析，而是聚焦于“函数级”的表示学习。这背后有几个关键的考量：

第一，粒度适中，计算可行。指令级（Instruction-Level）分析过于细碎，上下文信息有限，且序列过长，对模型训练和推理都是巨大挑战。而二进制文件级（Binary-Level）又过于宏观，丢失了太多细节。函数（Function）作为程序逻辑的基本单元，它封装了相对完整的、内聚的代码块，既有足够的操作序列来体现模式（如循环、内存操作、算术运算），其规模又在现代深度学习模型（如Transformer、GNN）的有效处理范围之内。

第二，与逆向工程工作流天然契合。安全研究员在手动审计时，也是以函数为单位进行逐个分析的。BinAIVulHunter的输出——一个标注了每个函数漏洞概率的列表——可以直接映射到IDA Pro或Ghidra的反汇编视图，让研究员能一键跳转到高风险函数，这种无缝对接极大地提升了工具的实用性。

第三，AI擅长从序列和结构中学习模式。许多经典的二进制漏洞，其代码模式在汇编层面是有迹可循的。例如，一个不安全的strcpy调用（可能导致缓冲区溢出），其模式可能表现为：一个栈上缓冲区的地址被加载到某个寄存器（如lea rax, [rbp-0x40]），然后作为目标参数传递给strcpy，而源参数可能来自用户可控的输入。这种“数据流”和“API调用”的模式，可以通过将汇编指令转化为一种中间表示（如控制流图CFG、数据流图DFG，或更简单的指令操作码序列），然后让图神经网络（GNN）或序列模型（如BiLSTM, Transformer）来学习。

注意：这里有一个重要的认知需要澄清：BinAIVulHunter的AI模型并不是在“理解”漏洞，而是在学习一种“统计相关性”。它从大量已标记为“有漏洞”和“无漏洞”的函数样本中，学习到哪些代码特征组合更频繁地与漏洞同时出现。因此，它的预测是一种概率，而非确定性的判定。假阳性（误报）和假阴性（漏报）是必然存在的，它的角色是“辅助”而非“替代”。

2.2 核心架构与技术栈拆解

浏览项目的代码仓库，我们可以梳理出其核心架构，主要包含以下几个模块：

二进制解析与特征提取模块：这是整个流程的基石。它负责读取输入的二进制文件（ELF、PE等），利用反汇编引擎（如capstone,radare2）将其分解为函数，并进一步提取每个函数的多种低级特征。这些特征可能包括：
- 指令序列：函数内所有操作码（Opcode）的序列，这是最直接的特征。
- 控制流图（CFG）：表示函数内基本块（Basic Block）之间跳转关系的图结构。图结构能很好地体现程序逻辑的复杂度。
- 统计特征：如函数的指令数量、基本块数量、调用指令（call）数量、特定危险API（如strcpy,sprintf,memcpy）的调用次数等。
- 数值常量特征：函数中出现的立即数，可能暗示着缓冲区大小、循环边界等。
中间表示（IR）生成模块：直接将原始的汇编指令或上述特征喂给模型效果往往不好，因为不同编译器、不同优化选项、甚至不同指令集架构（x86 vs ARM）会导致相同的源代码产生差异巨大的汇编。因此，项目通常会将提取的特征转化为一种更抽象、更统一的中间表示。常见的方法包括：
- 词法化（Tokenization）：将每条汇编指令映射为一个唯一的token，形成一个token序列。
- 基于LLVM IR的转换：如果能通过工具（如retdec）将二进制部分恢复为LLVM IR，那么分析将在一个更高级、更统一的平台上进行。但这对闭源、混淆严重的二进制文件挑战很大。
- 自定义的图表示：将CFG中的每个基本块作为一个节点，节点属性由该基本块内的指令特征向量构成，边代表跳转关系。这就是一个标准的图数据结构，非常适合用图神经网络处理。
深度学习模型模块：这是项目的“大脑”。根据项目文档和代码，BinAIVulHunter可能采用了以下一种或多种模型架构：
- 图神经网络（GNN）：如Graph Convolutional Network (GCN)、Graph Attention Network (GAT)。这是处理CFG等图结构数据的自然选择。模型通过学习图中节点和边的信息传递，来获取整个函数图的语义表示。
- 序列模型：如双向长短期记忆网络（Bi-LSTM）或Transformer。如果特征主要以指令序列或token序列为主，这类模型能很好地捕捉序列中的长期依赖关系。
- 混合模型：结合GNN和序列模型，先用GNN处理CFG结构，再用序列模型处理每个基本块内的指令序列，最后融合两者特征。模型的输出通常是一个介于0到1之间的分数，表示该函数存在漏洞的概率。
训练与推理管道：模型需要在大规模、高质量的数据集上训练。这个数据集通常来源于两个渠道：一是从有漏洞的开源项目（如Linux kernel, libpng）中编译出带调试符号的二进制文件，并通过源码中的历史CVE记录来标记哪些函数是“有漏洞的”；二是利用合成漏洞代码或漏洞模式生成器来制造训练样本。推理阶段则相对直接：解析目标二进制 -> 提取特征 -> 生成IR -> 输入训练好的模型 -> 得到每个函数的漏洞概率。
工具链与集成：为了实用，项目通常会提供命令行工具和与主流逆向框架（如IDA Pro, Ghidra）的插件。命令行工具用于批量扫描，插件则允许在逆向环境中实时查看分析结果。

技术栈上，项目很可能采用Python作为胶水语言，利用capstone/keystone/radare2进行反汇编，使用networkx处理图结构，深度学习框架则大概率是PyTorch或TensorFlow。整个项目的复杂度在于如何将离散的、低级的二进制世界，有效地映射到连续的、高维的向量空间，并让模型学会其中的漏洞模式。

3. 环境部署与快速上手实操

理论说了这么多，是时候动手让BinAIVulHunter跑起来了。以下是我在Ubuntu 20.04 LTS系统上从零部署和运行的一次完整记录，过程中遇到的坑和解决方案也会一并分享。

3.1 基础环境准备

首先，我们需要一个Python环境（建议3.8-3.10版本）和必要的系统依赖。深度学习模型通常对计算资源有要求，拥有一块NVIDIA GPU并安装好CUDA驱动会极大加速训练和推理过程。如果没有GPU，也可以在CPU上运行，只是速度会慢很多。

# 1. 克隆项目仓库 git clone https://github.com/ke0z/BinAIVulHunter.git cd BinAIVulHunter # 2. 创建并激活Python虚拟环境（强烈推荐，避免污染系统环境） python3 -m venv venv source venv/bin/activate # 3. 安装系统依赖（以Ubuntu/Debian为例） sudo apt-get update sudo apt-get install -y build-essential cmake git # 如果需要radare2作为反汇编后端 sudo apt-get install -y radare2

3.2 依赖安装与模型准备

项目的依赖通常通过requirements.txt文件管理。在安装前，务必确认你的PyTorch版本是否需要与CUDA版本对应。

# 安装Python依赖 pip install --upgrade pip # 先尝试安装requirements.txt中的包 pip install -r requirements.txt # 如果requirements.txt中没有指定PyTorch，需要单独安装 # 例如，安装适用于CUDA 11.7的PyTorch（请根据你的CUDA版本调整） pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117 # 安装其他可能缺失的包，如用于处理图的库 pip install networkx dgl # 如果项目使用DGL图神经网络库 # 或者 pip install torch-geometric # 如果使用PyTorch Geometric

安装过程中最常见的错误是某些包（特别是深度学习框架或图神经网络库）的版本冲突。如果遇到，可以尝试先安装项目明确要求的版本，或者查看项目的setup.py或文档。有时，开发者会提供一个预训练好的模型文件（.pth或.ckpt），你需要将其下载并放到项目指定的models/目录下。如果项目需要从头训练，那将是一个耗时数小时甚至数天的过程，需要准备好强大的算力和数据集。

3.3 首次运行与扫描测试

假设环境配置顺利，我们可以尝试对一个简单的二进制文件进行扫描。项目通常会提供一个示例脚本，比如predict.py或cli.py。

# 查看帮助信息，了解参数 python predict.py --help # 对一个二进制文件进行扫描 python predict.py --binary /path/to/your/test_binary --model ./models/pretrained_model.pth --output result.json

如果一切正常，你会得到一个result.json文件，里面以JSON格式列出了目标二进制中所有被识别出的函数，以及每个函数对应的漏洞概率得分，可能还会有关联的漏洞类型（如buffer_overflow,integer_overflow）。

实操心得：第一次运行避坑指南

路径问题：确保传递给--binary参数的路径是绝对路径或相对于当前工作目录的正确相对路径。Windows和Linux的路径分隔符不同，要注意。
模型文件：如果项目提供了预训练模型，务必确认其与当前代码版本兼容。深度学习模型对输入数据的维度非常敏感，代码更新后特征提取方式变化可能导致模型无法加载或输出异常。
依赖版本地狱：这是最大的坑。如果遇到ImportError或运行时错误，首先检查错误信息，看是哪个模块的哪个函数出了问题。然后，使用pip list查看已安装版本，并与项目推荐版本对比。可以尝试在项目仓库的Issues里搜索相关错误。万不得已时，可以尝试在Docker容器中部署，以隔离环境。
内存与显存：分析大型二进制文件（如数十MB的固件）时，特征提取和模型推理可能会消耗大量内存和显存。如果进程被杀死，可以尝试分析单个函数，或者使用--batch-size参数减小推理批次大小。

4. 核心功能模块深度解析与定制

要让BinAIVulHunter真正成为你得心应手的工具，不能只停留在使用层面，还需要理解其核心模块，以便进行定制和优化。下面我们深入看看特征提取和模型部分。

4.1 特征提取器的实现与扩展

特征提取是决定模型性能上限的关键一步。我们来看看一个典型的基于capstone反汇编引擎的函数特征提取流程：

import capstone as cs from collections import Counter def extract_function_features(binary_path, function_address): """ 简化版的函数特征提取示例 """ # 1. 使用capstone打开二进制文件并反汇编指定函数 with open(binary_path, 'rb') as f: code = f.read() # 假设我们已经通过其他方式（如radare2）获取了函数的起始地址和大小 md = cs.Cs(cs.CS_ARCH_X86, cs.CS_MODE_64) md.detail = True instructions = [] opcode_counter = Counter() api_calls = [] for insn in md.disasm(code[function_start:function_end], function_start): # 2. 收集指令序列 instructions.append(insn.mnemonic) # 操作码，如 'mov', 'call', 'add' # 3. 统计操作码频率 opcode_counter[insn.mnemonic] += 1 # 4. 识别潜在的危险API调用 if insn.mnemonic == 'call': # 这里需要结合符号表或导入表来解析调用目标 # 简单示例：如果目标地址在已知的“危险函数”列表中 target_addr = resolve_call_target(insn) # 假设的函数 if target_addr in DANGEROUS_FUNCTIONS: api_calls.append(DANGEROUS_FUNCTIONS[target_addr]) # 5. 构建特征向量 # 例如，将操作码频率转化为固定维度的向量 feature_vector = [] for op in ALL_OPCODES: # 预定义的所有可能操作码列表 feature_vector.append(opcode_counter.get(op, 0)) # 加入API调用特征 feature_vector.append(len([c for c in api_calls if c == 'strcpy'])) feature_vector.append(len([c for c in api_calls if c == 'sprintf'])) # ... 其他特征 return { 'instruction_sequence': instructions, 'feature_vector': feature_vector, 'dangerous_calls': api_calls }

在实际的BinAIVulHunter项目中，特征提取会更复杂，可能会用到angr或binaryninja来生成更精确的CFG和DFG。如果你想扩展特征，例如加入“函数参数个数”、“栈帧大小”、“循环嵌套深度”等，就需要修改这个特征提取函数。这里的关键是，你添加的任何新特征，都必须能够在推理时从目标二进制文件中稳定地提取出来。

4.2 模型结构理解与再训练

假设项目使用的是基于GNN的模型。其PyTorch代码结构可能如下：

import torch import torch.nn as nn import torch.nn.functional as F from torch_geometric.nn import GCNConv # 假设使用PyTorch Geometric class VulnGNN(nn.Module): def __init__(self, num_node_features, hidden_dim, num_classes=1): super(VulnGNN, self).__init__() self.conv1 = GCNConv(num_node_features, hidden_dim) self.conv2 = GCNConv(hidden_dim, hidden_dim) # 全局池化层，用于将节点特征聚合为图特征 self.pool = global_mean_pool # 来自torch_geometric.nn self.fc = nn.Linear(hidden_dim, num_classes) # 输出层，num_classes=1表示二分类（漏洞/非漏洞） def forward(self, data): x, edge_index, batch = data.x, data.edge_index, data.batch x = self.conv1(x, edge_index) x = F.relu(x) x = F.dropout(x, training=self.training) x = self.conv2(x, edge_index) # 图池化 x = self.pool(x, batch) # 输出预测概率 x = self.fc(x) return torch.sigmoid(x) # 使用sigmoid将输出映射到[0,1]

这个模型接受一个Data对象，其中data.x是节点特征矩阵（每个基本块的特征向量），data.edge_index是图的边列表（CFG中的跳转关系），data.batch指示哪些节点属于同一个图（函数）。模型通过两层图卷积学习节点表示，然后通过全局平均池化得到整个函数的表示向量，最后通过一个全连接层输出漏洞概率。

如果你想用自己的数据集重新训练或微调模型，需要准备以下工作：

数据集构建：收集大量二进制文件，并准确标注每个函数是否有漏洞。这是最耗时、最需要专业知识的环节。可以借助一些开源漏洞数据库和代码仓库。
数据预处理：使用项目提供的或自己修改的特征提取脚本，将整个数据集转化为模型可以接受的格式（如.pt文件或特定的数据加载器格式）。
修改训练脚本：调整超参数（学习率、批次大小、训练轮数等）。通常项目会提供train.py。
训练与验证：在训练集上训练，在验证集上监控性能，防止过拟合。

注意：训练一个有效的漏洞检测模型需要高质量、大规模、平衡的数据集。如果正样本（有漏洞函数）远少于负样本，模型会倾向于预测所有函数都是安全的，导致漏报率高。需要使用过采样、欠采样或设计加权损失函数等技术来处理类别不平衡问题。

5. 集成到逆向工程工作流

BinAIVulHunter最大的价值在于与现有工具的集成。理想的情况是，在IDA Pro或Ghidra中按一个按钮，当前数据库的所有函数旁边就能显示一个漏洞风险评分。

5.1 编写IDA Pro插件脚本

IDA Pro支持Python和IDC脚本。我们可以写一个简单的插件，调用本地的BinAIVulHunter推理服务。

# ida_bin_ai_vuln_hunter.py - 一个简化的IDA Pro插件示例 import idaapi import idautils import idc import subprocess import json import os class BinAIVulHunterPlugin(idaapi.plugin_t): flags = idaapi.PLUGIN_UNL wanted_name = "BinAIVulHunter" wanted_hotkey = "Alt-F8" comment = "Scan current binary with BinAIVulHunter" help = "Something helpful" def init(self): print("BinAIVulHunter plugin loaded. Press Alt-F8 to scan.") return idaapi.PLUGIN_OK def run(self, arg): # 1. 获取当前IDA数据库的二进制文件路径 binary_path = idaapi.get_input_file_path() if not os.path.exists(binary_path): print(f"Error: Binary file not found at {binary_path}") return # 2. 调用外部BinAIVulHunter脚本进行扫描 # 假设我们的预测脚本在本地 script_path = "/path/to/BinAIVulHunter/predict.py" model_path = "/path/to/BinAIVulHunter/models/pretrained.pth" cmd = ["python", script_path, "--binary", binary_path, "--model", model_path, "--output", "/tmp/result.json"] try: print("Running BinAIVulHunter scan...") result = subprocess.run(cmd, capture_output=True, text=True, check=True) print("Scan completed.") except subprocess.CalledProcessError as e: print(f"Scan failed: {e.stderr}") return # 3. 解析结果并标注IDA with open("/tmp/result.json", 'r') as f: vuln_results = json.load(f) for func_result in vuln_results['functions']: func_addr = func_result['address'] score = func_result['vulnerability_score'] # 在IDA中为该地址添加注释 current_cmt = idc.get_cmt(func_addr, 0) or "" new_cmt = f"[BinAIVulHunter Score: {score:.3f}] {current_cmt}" idc.set_cmt(func_addr, new_cmt, 0) # 或者根据分数设置颜色高亮 if score > 0.7: # 高风险阈值 idc.set_color(func_addr, idc.CIC_FUNC, 0x0000FF) # 红色高亮 elif score > 0.3: # 中风险阈值 idc.set_color(func_addr, idc.CIC_FUNC, 0x00FFFF) # 黄色高亮 print(f"Annotation complete for {len(vuln_results['functions'])} functions.") def term(self): pass def PLUGIN_ENTRY(): return BinAIVulHunterPlugin()

将这个脚本放到IDA的plugins目录，重启IDA后即可使用。这个插件实现了基本功能：导出当前二进制文件，调用BinAIVulHunter扫描，然后将结果（漏洞分数）写回IDA，作为函数注释或颜色高亮。

5.2 与CI/CD管道集成

对于软件安全开发生命周期（SDLC），可以将BinAIVulHunter集成到CI/CD管道中，对每次构建产生的二进制文件（尤其是发布版本）进行自动扫描。

# 一个GitLab CI的示例配置 .gitlab-ci.yml stages: - build - security_scan build_binary: stage: build script: - make all artifacts: paths: - output/my_program binai_vuln_scan: stage: security_scan image: python:3.9-slim # 使用包含BinAIVulHunter的定制镜像更好 dependencies: - build_binary before_script: - pip install -r requirements.txt - # 下载预训练模型 script: - python predict.py --binary output/my_program --model model.pth --output gl-sast-report.json - # 解析报告，如果发现高风险函数，可以设置任务失败或发出警告 artifacts: reports: sast: gl-sast-report.json only: - master - tags

这样，每次向主分支提交代码或打标签发布时，都会自动进行二进制漏洞扫描，并将结果报告集成到GitLab的Security Dashboard中。

6. 效果评估、局限性与优化方向

使用BinAIVulHunter一段时间后，我对它的能力和局限有了更深的体会。没有任何工具是银弹，尤其是AI驱动的工具，理解其边界才能更好地利用它。

6.1 效果评估：它真的准吗？

评估一个AI漏洞检测工具，主要看几个指标：精确率（Precision）、召回率（Recall）和F1分数。

精确率高意味着它报出来的问题里，真实漏洞的比例高，误报少。这对于研究员来说很重要，可以节省验证误报的时间。
召回率高意味着它能找出大部分真实存在的漏洞，漏报少。这对于保证软件安全性很重要。

根据我的测试和一些公开文献，当前这类工具在特定数据集（如某些已知的漏洞C函数库）上，可以达到不错的F1分数（例如0.7-0.8）。但一旦应用到真实世界、不同编译器、不同架构、且经过混淆或优化的二进制文件上，性能会有显著下降。

常见问题速查与应对：

现象	可能原因	排查与优化建议
对所有函数都输出接近0.5的分数	模型未正确加载，或输入特征与训练数据分布差异极大。	1. 检查模型文件路径和格式是否正确。 2. 验证特征提取步骤是否成功，输出特征维度是否与模型输入匹配。 3. 尝试用一个已知的、包含经典漏洞（如一个简单的栈溢出程序）的二进制文件测试，看分数是否有变化。
误报率极高	1. 训练数据中“安全模式”不足或质量差。 2. 模型过于简单，学到了表面的、与漏洞无关的代码特征（如函数大小）。 3. 阈值设置过低。	1. 提高判定阈值（如从0.5提高到0.7或0.8）。 2. 检查高风险函数的代码，总结误报模式，看是否能通过添加新的特征来区分（例如，识别安全的边界检查代码）。 3. 考虑使用集成学习，结合多个模型的预测结果。
漏报严重，找不到已知漏洞	1. 漏洞模式不在训练数据中。 2. 特征提取器未能捕获导致该漏洞的关键特征（如复杂的数据流）。 3. 二进制文件经过混淆或加壳。	1. 确保目标二进制已被正确脱壳或去混淆。 2. 尝试使用更强大的反汇编器和中间表示（如尝试用angr生成VEX IR）。 3. 将漏报的漏洞函数加入训练集，重新训练或微调模型。
分析大型固件时内存溢出	一次性将整个固件的所有函数特征加载到内存。	1. 修改推理脚本，支持分批处理函数。 2. 增加系统交换空间（swap）。 3. 考虑只分析固件中感兴趣的部分（如网络服务模块）。

6.2 固有局限与挑战

必须清醒认识到BinAIVulHunter这类工具的局限性：

语义理解缺失：模型学习的是统计模式，而非程序的真实语义。它无法理解“这个缓冲区的大小是用户输入控制的”这样的高级逻辑，只能看到“这里有一个memcpy，其大小参数来自某个寄存器”。
上下文感知有限：函数级分析割裂了跨函数的交互。一个漏洞的根源可能在A函数，触发点在B函数，模型可能无法将两者关联。
对抗性样本：通过简单的代码混淆（如插入无用指令、等价指令替换）就可能欺骗模型，使其对漏洞函数给出低分。
数据依赖：模型性能严重依赖于训练数据的质量和代表性。对于新兴的漏洞类型、新的指令集架构（如RISC-V）、或特定领域的嵌入式代码，如果没有相关训练数据，模型将无能为力。

6.3 未来优化方向与个人实践建议

尽管有局限，但AI辅助漏洞挖掘的方向充满希望。对于个人使用者和项目贡献者，可以从以下方面优化：

特征工程升级：尝试引入更丰富的特征，如数据依赖关系、**值集分析（VSA）**得到的近似值范围、符号执行探索到的路径约束摘要等。将这些高级静态分析的结果作为特征，能让模型接触到更多“语义”信息。
模型融合：不要只依赖一个模型。可以训练多个不同架构的模型（如一个GNN模型、一个Transformer模型、一个基于传统特征+机器学习模型如XGBoost），然后进行集成投票，往往能提升鲁棒性和准确率。
交互式学习：开发一个插件，允许研究员在IDA中手动标记模型的预测结果（正确/错误）。这些反馈可以实时收集起来，用于在线微调模型，让工具在使用中越来越“聪明”，越来越适应用户的分析目标。
结合动态分析：将静态AI分析的结果作为种子，指导模糊测试（Fuzzing）。优先Fuzz那些AI认为高风险、且输入参数可控的函数，可以提升Fuzzing的代码覆盖率和漏洞发现效率。

在我自己的工作中，我将BinAIVulHunter定位为“初筛雷达”和“注意力引导器”。我不会完全相信它的评分，但当我面对一个全新的、庞大的二进制文件时，我会首先用它跑一遍，然后按照漏洞评分从高到低浏览函数列表。这常常能让我在几个小时内就定位到一些可疑点，而如果纯靠人工阅读汇编代码，可能需要几天时间才能达到相同的覆盖广度。它帮我节省了最宝贵的资源——时间，让我能把深度思考集中在最有可能产出成果的地方。

查看全文

http://www.jsqmd.com/news/805577/