当前位置：首页 > news >正文

基于深度信念网络的软件缺陷预测：从原理到工程实践

news 2026/7/15 14:24:34

1. 项目概述：为什么我们需要更聪明的软件缺陷预测？

在软件开发的漫长周期里，测试环节往往是最耗费资源、也最令人头疼的部分。想象一下，你手头有一个包含上万个模块的大型系统，测试团队的时间和精力是有限的，你不可能对每个模块都投入同等的测试力度。传统的做法可能是凭经验、或者根据代码行数来分配资源，但这就像大海捞针，效率低下且容易遗漏关键问题。这就是软件缺陷预测技术要解决的核心痛点：如何精准地预测哪些软件模块最有可能藏有缺陷（Bug），从而将有限的测试资源“好钢用在刀刃上”。

传统的软件缺陷预测模型，大多依赖于经典的机器学习算法，比如支持向量机（SVM）、决策树（DT）或朴素贝叶斯（NB）。这些方法的基本思路是，从源代码或开发历史中提取一系列“度量元”（Metrics），例如代码圈复杂度、代码行数、类的内聚耦合度等，将这些度量元作为特征，输入分类器进行训练。然而，随着现代软件系统变得日益庞大和复杂，我们面临两个棘手的挑战：数据高维冗余和类别极端不平衡。

一方面，为了全面描述软件特征，我们可能会提取上百个度量元，但这些特征之间往往存在高度的相关性（冗余），这会导致模型训练效率低下，甚至引发“维度灾难”，使得模型难以学到有效的规律。另一方面，在一个成熟的软件项目中，真正有缺陷的模块通常是少数（可能只占5%-10%），而大部分模块是干净的。这种“类别不平衡”会让分类器倾向于将所有模块都预测为“无缺陷”，因为这样也能获得很高的整体准确率，但这完全违背了缺陷预测的初衷——我们恰恰最关心那些少数的、有问题的模块。

正是在这样的背景下，深度学习技术，特别是深度信念网络（Deep Belief Network, DBN），进入了我们的视野。DBN最初在图像识别、语音处理领域大放异彩，其核心能力在于能够通过多层非线性变换，自动从原始数据中学习到层次化的、抽象的特征表示。这就像一位经验丰富的老师傅，不是简单地数零件（度量元），而是能“看”出零件组合背后的结构模式和潜在风险。将DBN应用于软件缺陷预测，其核心假设是：代码的缺陷模式也隐藏在这种深层的、复杂的结构关系中，而DBN有能力将其挖掘出来。

本文要探讨的DBNPM模型，正是基于这一思路的一次实践。它不满足于在原始的高维、冗余度量元上做文章，而是尝试让DBN网络自己去“理解”这些数据，自动进行特征提取和降维，从而构建一个更鲁棒、更精准的缺陷预测分类器。接下来，我将为你深入拆解这个模型的构建思路、实现细节，并分享在实际复现和应用过程中可能遇到的“坑”以及应对技巧。

2. 核心思路与模型架构设计

2.1 从传统方法到深度学习的范式转变

在深入DBNPM之前，有必要理解传统方法的局限。传统机器学习模型（如SVM）在软件缺陷预测上，本质是一个“特征工程+浅层分类”的流程。特征工程的质量——即我们选取和构造的度量元是否有效——直接决定了模型性能的天花板。然而，手工设计和筛选特征是一项极其依赖领域知识且耗时的工作。

DBNPM模型的思路则是一种范式转变：将特征学习的任务交给模型本身。我们不再需要绞尽脑汁去思考哪些度量元的组合可能有效，而是提供尽可能全面的原始度量元数据，让DBN这个深度网络通过无监督的预训练和有监督的微调，自动发现对缺陷预测最有用的高层特征组合。这种“端到端”的学习方式，特别适合处理像软件度量数据这种内在结构复杂、关系非线性的场景。

2.2 DBNPM模型的两阶段工作流程

DBNPM的整体框架清晰地区分为两个核心阶段：模型构建阶段和预测阶段。这个设计确保了模型的实用性和可复用性。

第一阶段：模型构建（离线训练）这个阶段的目标是利用已有的、带标签（即有缺陷/无缺陷）的历史项目数据，训练出一个可靠的分类器。具体步骤如下：

数据准备与特征提取：收集历史项目的源代码，使用静态分析工具（如McCabe、Halstead度量工具）提取一系列预定义的软件度量元，形成初始特征向量。同时，从问题追踪系统（如JIRA、Bugzilla）中获取对应模块的缺陷标签。
数据预处理：这是关键一步，主要解决类别不平衡问题。文中提到采用了随机采样的方法，使训练集中有缺陷和无缺陷的模块数量相等。这一步需要谨慎操作，过采样或欠采样都有其利弊，我们会在后续实操部分详细讨论。
DBN特征学习：将平衡后的、标准化的初始特征向量输入DBN网络。DBN由多层受限玻尔兹曼机（RBM）堆叠而成。每一层RBM都是一个简单的两层神经网络（可见层和隐藏层），通过无监督的对比散度算法进行训练，学习如何用隐藏层节点来“重建”可见层输入。层层堆叠后，顶层的隐藏层输出，就是经过网络深度加工后得到的“高级特征”。这些特征比原始度量元更紧凑、更具代表性。
分类器训练：将DBN顶层学习到的高级特征，连接一个简单的分类器（例如Softmax回归层或SVM）。然后，利用带标签的数据，通过反向传播算法对整个网络（包括DBN的权重和分类器）进行有监督的“微调”，最终得到一个能够根据高级特征判断缺陷的完整模型。

第二阶段：预测（在线应用）当需要对一个新的、未知的软件模块进行缺陷预测时：

特征提取：对该新模块提取与训练阶段完全相同的软件度量元，构成初始特征向量。
特征转换：将这个初始特征向量输入到已训练好的DBN网络中。网络的前向传播过程，会将其自动转换为对应的高级特征表示。
缺陷判定：将得到的高级特征输入到顶层的分类器，分类器输出最终的预测结果：“有缺陷”或“无缺陷”。

这个流程的优势在于，一旦模型训练完成，对新样本的预测过程非常高效，只需一次前向传播即可，非常适合集成到持续集成/持续交付（CI/CD）流水线中，对每次提交的代码进行实时风险评估。

2.3 为什么选择深度信念网络（DBN）？

在众多深度学习模型中，选择DBN而非CNN或RNN，是基于软件缺陷预测数据的特点深思熟虑的：

处理向量化数据：软件度量元数据本质上是结构化、固定长度的特征向量，这与图像（二维网格）或序列（时间步）数据不同。DBN天生擅长处理这类向量化输入。
强大的无监督特征学习能力：DBN通过RBM堆叠进行逐层贪婪预训练，这种无监督学习方式能有效捕捉数据的高阶相关性，非常适合从可能存在冗余的高维度量元中提取本质特征。
缓解梯度消失：与传统的深度反向传播网络相比，DBN的逐层预训练为网络权重提供了非常好的初始值，这使得后续的有监督微调更容易、更稳定，有效缓解了深度网络训练中常见的梯度消失问题。
可解释性相对较好：虽然深度学习常被诟病为“黑盒”，但DBN每一层RBM学习到的权重，可以理解为对输入特征的不同抽象组合，相较于其他更复杂的网络，其学习过程有一定可追溯性。

注意：DBNPM模型并不直接处理源代码文本或抽象语法树（AST）。它处理的是从代码中提取出来的、数值化的度量元。这意味着模型的性能上限，部分依赖于这些底层度量元能否有效表征代码的缺陷倾向。这是一个重要的前提认知。

3. 关键技术细节与实操要点解析

3.1 数据基石：理解NASA MDP数据集

任何机器学习项目都始于数据。DBNPM模型在论文中使用了经典的NASA MDP数据集进行验证。这个数据集是软件工程实证研究领域的基准数据集之一，包含了多个真实航天软件项目的模块级度量数据。

以数据集中常用的JM1、MC1、PC5为例，每个数据集都是一个表格，每一行代表一个软件模块（如一个函数或一个文件），每一列代表一个软件度量元（特征）以及一个标签列。特征主要来源于两类：

McCabe复杂度度量：如圈复杂度v(g)、基本复杂度ev(g)等，用于衡量程序控制流的复杂程度。
Halstead度量：如程序词汇表n、程序量v、难度d、工作量e等，基于源代码中运算符和操作数的数量，来评估程序的复杂性和潜在缺陷。

实操要点：数据集的“坑”与处理

数据不一致与缺失值：MDP数据集的不同子集（如JM1, KC1）包含的度量元数量和类型可能略有不同。在整合使用前，必须进行严格的特征对齐，处理缺失值。常见方法包括删除缺失过多的特征列，或使用中位数/均值填充。
特征量纲差异巨大：例如，代码行数（loc）可能上千，而某些复杂度度量值可能是个位数。直接输入网络会导致数值大的特征主导训练过程。必须进行特征标准化，通常采用Z-score标准化（减去均值，除以标准差）或Min-Max归一化，将各特征缩放到相近的区间。
理解“缺陷”标签：数据集中“defects”为True的模块，代表该模块在历史上至少被发现并报告过一个缺陷。这并不意味着该模块现在一定有缺陷，而是表明其具有某种“缺陷倾向”。我们的模型正是在学习这种倾向性模式。

3.2 核心引擎：深度信念网络的构建与训练

DBNPM的核心是一个由多层RBM堆叠而成的深度信念网络。理解其训练过程是复现模型的关键。

3.2.1 受限玻尔兹曼机（RBM）的工作原理可以把单个RBM理解为一个两层、双向的神经网络。底层是可见层v（输入我们的软件度量特征），上层是隐藏层h（学习到的特征表示）。层内神经元无连接，层间全连接。

能量函数：RBM用能量函数定义系统状态：E(v, h) = - Σ_i Σ_j w_ij * v_i * h_j - Σ_j b_j * v_j - Σ_i c_i * h_i。其中w_ij是连接权重，b_j和c_i是偏置项。能量越低的状态，出现的概率越高。
条件概率与采样：由于层内无连接，给定可见层状态，所有隐藏层节点的激活是条件独立的，反之亦然。激活概率通常用Sigmoid函数计算：p(h_j=1|v) = sigmoid(c_j + Σ_i w_ij * v_i)。训练时，通过吉布斯采样在可见层和隐藏层之间来回“重构”数据。
训练目标：通过对比散度算法，调整权重和偏置，使得RBM能够以最大的概率生成训练数据。简单说，就是让网络学会用隐藏层来“记住”输入数据的分布。

3.2.2 从RBM到DBN：逐层贪婪预训练DBN的训练分为两个核心阶段：

无监督逐层预训练：
- 首先，将标准化后的特征数据输入第一层RBM（可见层），训练该RBM。
- 训练完成后，固定第一层RBM的权重，将其隐藏层的激活值（即学习到的特征）作为第二层RBM的可见层输入。
- 重复此过程，逐层向上训练。每一层都在学习其输入数据中更抽象、更高阶的统计特征。对于软件度量数据，底层RBM可能学习到一些简单特征的组合（如高圈复杂度+高代码行数），而高层RBM则可能学习到更复杂的、与缺陷模式相关的抽象模式。
有监督微调：
- 在所有RBM层预训练完成后，我们在DBN的顶层添加一个输出层（例如一个Softmax分类器，输出“有缺陷/无缺陷”的概率）。
- 此时，我们将整个网络（DBN+顶层分类器）视为一个整体的深度神经网络。利用带标签的数据，使用反向传播算法进行有监督的微调。预训练得到的权重为网络提供了极佳的初始点，使得微调过程能快速收敛到一个性能更好的局部最优解。

实操心得：网络结构调参论文中提到使用了5层RBM，但指出调整隐藏层层数和每层神经元数量对最终性能影响不大。这在实践中是一个有趣的观察，但并不意味着可以随意设置。

网络深度：对于MDP这类维度（21-39维）的数据，3-5层RBM通常是足够的。过深的网络可能导致过拟合，且训练时间大幅增加。
隐藏层神经元数：一个常见的起点是，第一层隐藏层神经元数略大于输入维度（例如1.5倍），后续逐层减少。也可以尝试“编码器”结构，即先逐层减少神经元（编码），再逐层增加（解码），但DBN通常只使用编码部分。我的经验是，从较小的网络开始（如输入层->64->32->16），如果欠拟合再逐步增加复杂度。
学习率与迭代次数：RBM预训练的学习率通常设置得较小（如0.01），使用小批量随机梯度下降。迭代次数（epoch）需要监控重构误差的变化，当其不再显著下降时即可停止。

3.3 应对类别不平衡：采样策略的权衡

类别不平衡是缺陷预测的老大难问题。DBNPM论文中采用了简单的随机欠采样，使两类样本数相等。但这并非唯一选择，各有优劣：

随机欠采样：随机丢弃多数类（无缺陷）样本。优点是简单快捷，能快速平衡数据。最大风险是可能丢失重要信息，特别是当多数类样本本身分布不均时。
随机过采样：随机复制少数类（有缺陷）样本。不会丢失信息，但容易导致模型过拟合，因为它只是简单复制了现有少数样本。
SMOTE（合成少数类过采样技术）：在少数类样本的特征空间中进行插值，生成新的“合成”样本。这比简单复制更好，但对于高维数据，插值生成的点可能落在无意义的区域，引入噪声。
代价敏感学习：不改变数据分布，而是在训练时给少数类样本的预测错误赋予更高的惩罚权重。这需要模型支持（如代价敏感的SVM或调整交叉熵损失的类别权重）。

我的建议：在实际项目中，不要只依赖一种方法。可以尝试以下组合策略：

首先尝试代价敏感学习，因为它不改变原始数据分布，最为“诚实”。
如果效果不佳，可以尝试SMOTE，但要注意检查生成样本的合理性。
将欠采样与集成学习结合（如EasyEnsemble）：多次对多数类进行欠采样，每次与少数类构成平衡子集，分别训练多个分类器，最后集成投票。这种方法既能缓解信息丢失，又能利用集成学习的优势，在实践中往往效果不错。

4. 模型复现与性能评估实战

4.1 环境搭建与数据预处理

我们使用Python作为实现语言，主要依赖scikit-learn、TensorFlow或PyTorch（用于构建DBN），以及pandas、numpy进行数据处理。

# 示例：数据加载与预处理核心步骤 import pandas as pd from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from imblearn.under_sampling import RandomUnderSampler # 导入欠采样库 # 1. 加载数据 (以JM1为例，需提前下载并格式化CSV) data = pd.read_csv('jm1.csv') X = data.drop('defects', axis=1) # 特征 y = data['defects'] # 标签，假设为布尔型或0/1 # 2. 处理缺失值（简单示例：用中位数填充） X.fillna(X.median(), inplace=True) # 3. 划分训练集和测试集（先划分，再对训练集做平衡，防止数据泄露） X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42, stratify=y) # 4. 特征标准化（基于训练集统计量，避免使用测试集信息） scaler = StandardScaler() X_train_scaled = scaler.fit_transform(X_train) X_test_scaled = scaler.transform(X_test) # 测试集使用相同的scaler转换 # 5. 处理训练集的类别不平衡（使用随机欠采样） rus = RandomUnderSampler(random_state=42) X_train_balanced, y_train_balanced = rus.fit_resample(X_train_scaled, y_train) print(f"原始训练集分布: {pd.Series(y_train).value_counts().to_dict()}") print(f"平衡后训练集分布: {pd.Series(y_train_balanced).value_counts().to_dict()}")

4.2 使用TensorFlow/Keras构建DBN模型

虽然TensorFlow 2.x没有原生的DBN层，但我们可以通过组合全连接层并自定义预训练逻辑来构建，或者使用一些第三方库（如dbn）。这里展示一个简化的概念性实现思路：

import tensorflow as tf from tensorflow import keras from tensorflow.keras import layers, models # 假设我们构建一个3层RBM堆叠的DBN，输入维度为input_dim input_dim = X_train_balanced.shape[1] # 思路：先构建单独的RBM进行预训练，然后堆叠成DBN进行微调 # 注意：以下为概念性代码，实际RBM训练需实现对比散度(CD)算法。 class RBM(layers.Layer): """简化的RBM层（概念示意，实际训练逻辑更复杂）""" def __init__(self, n_hidden): super(RBM, self).__init__() self.n_hidden = n_hidden def build(self, input_shape): self.W = self.add_weight(shape=(input_shape[-1], self.n_hidden), initializer='glorot_uniform', trainable=True) self.v_bias = self.add_weight(shape=(input_shape[-1],), initializer='zeros', trainable=True) self.h_bias = self.add_weight(shape=(self.n_hidden,), initializer='zeros', trainable=True) # 此处省略前向传播、采样、CD-k训练等具体方法... # 更实际的做法：使用堆叠的Dense层模拟DBN结构，并用无监督目标预训练（如自动编码器）， # 或者直接使用有标签数据端到端训练一个深度神经网络。 # 许多研究表明，在数据量足够的情况下，端到端训练的深度网络也能取得类似效果。 # 构建一个用于微调的深度神经网络（模拟DBN结构） model = models.Sequential([ layers.Dense(64, activation='relu', input_shape=(input_dim,)), layers.Dropout(0.2), # 加入Dropout防止过拟合 layers.Dense(32, activation='relu'), layers.Dropout(0.2), layers.Dense(16, activation='relu'), layers.Dense(1, activation='sigmoid') # 二分类输出 ]) model.compile(optimizer='adam', loss='binary_crossentropy', # 对于不平衡数据，可考虑加权交叉熵 metrics=['accuracy', tf.keras.metrics.Precision(), tf.keras.metrics.Recall()]) # 训练模型 history = model.fit(X_train_balanced, y_train_balanced, epochs=50, batch_size=32, validation_split=0.1, verbose=1) # 在测试集上评估（注意：测试集是原始不平衡的分布，更反映真实场景） test_loss, test_acc, test_precision, test_recall = model.evaluate(X_test_scaled, y_test, verbose=0)

4.3 性能评估：超越简单的准确率

在类别不平衡的数据集上，准确率是极具误导性的指标。一个将所有样本预测为多数的模型，准确率也可能很高。因此，我们必须使用更全面的评估指标，这也是论文中采用的方法：

精确率：在所有被模型预测为“有缺陷”的模块中，真正有缺陷的比例。Precision = TP / (TP + FP)。它衡量了预测结果的“准头”。精确率高意味着模型报出的警报可信度高，测试人员不会白费功夫。
召回率：在所有实际有缺陷的模块中，被模型成功预测出来的比例。Recall = TP / (TP + FN)。它衡量了模型的“查全率”。召回率高意味着漏报的缺陷少。
F1值：精确率和召回率的调和平均数。F1 = 2 * (Precision * Recall) / (Precision + Recall)。它是一个综合性的指标，在精确率和召回率之间寻求平衡。在缺陷预测中，我们通常更看重召回率（不想漏掉缺陷），但F1值是一个很好的整体性能参考。
受试者工作特征曲线下面积：这是一个非常重要的指标，它衡量的是模型在不同分类阈值下的整体分类能力，对类别不平衡不敏感。AUC值越接近1，模型性能越好。

实操中的评估流程：

使用分层K折交叉验证，确保每一折中类别比例与原始数据集一致，获得稳定的性能估计。
计算每一折的精确率、召回率、F1值、AUC。
汇报这些指标的平均值和标准差，而不是单次训练-测试分割的结果。

from sklearn.model_selection import StratifiedKFold from sklearn.metrics import precision_score, recall_score, f1_score, roc_auc_score cv = StratifiedKFold(n_splits=10, shuffle=True, random_state=42) precision_scores, recall_scores, f1_scores, auc_scores = [], [], [], [] for train_idx, val_idx in cv.split(X_train_scaled, y_train): # 在原始训练集上做CV X_cv_train, X_cv_val = X_train_scaled[train_idx], X_train_scaled[val_idx] y_cv_train, y_cv_val = y_train.iloc[train_idx], y_train.iloc[val_idx] # 对CV训练集进行平衡处理 rus = RandomUnderSampler(random_state=42) X_cv_train_bal, y_cv_train_bal = rus.fit_resample(X_cv_train, y_cv_train) # 创建并训练模型（这里简化，实际应重新初始化模型） # ... 模型训练代码 ... # 预测概率 y_pred_proba = model.predict(X_cv_val) y_pred = (y_pred_proba > 0.5).astype(int) # 以0.5为阈值 # 计算指标 precision_scores.append(precision_score(y_cv_val, y_pred, zero_division=0)) recall_scores.append(recall_score(y_cv_val, y_pred)) f1_scores.append(f1_score(y_cv_val, y_pred)) auc_scores.append(roc_auc_score(y_cv_val, y_pred_proba)) print(f"平均精确率: {np.mean(precision_scores):.3f} (+/- {np.std(precision_scores):.3f})") print(f"平均召回率: {np.mean(recall_scores):.3f} (+/- {np.std(recall_scores):.3f})") print(f"平均F1值: {np.mean(f1_scores):.3f} (+/- {np.std(f1_scores):.3f})") print(f"平均AUC: {np.mean(auc_scores):.3f} (+/- {np.std(auc_scores):.3f})")

5. 常见问题、挑战与优化方向

5.1 复现论文结果时可能遇到的挑战

数据集的版本与获取：NASA MDP数据集有多个版本和来源，不同来源的数据预处理程度可能不同（如缺失值处理、特征名）。务必确认你使用的数据集与论文中描述的特征维度完全一致。建议从PROMISE Repository等权威学术数据源获取。
随机性的影响：深度学习训练、数据采样、数据划分都存在随机性。为了结果可复现，务必固定所有随机种子（如Python的random、numpy、TensorFlow的随机种子）。即使如此，由于硬件或库版本的细微差异，完全复现论文中的数字可能仍有困难，关注趋势和相对性能更重要。
超参数敏感度：论文可能未详尽列出所有超参数（如学习率衰减策略、优化器参数、Dropout率）。DBN虽然对结构不太敏感，但对学习率、预训练迭代次数等还是敏感的。需要根据训练损失和验证集性能进行细致的调优。

5.2 从研究到实践：工业界应用的考量

将DBNPM或类似模型应用于实际工业项目，需要考虑更多工程化问题：

特征工程依然重要：虽然DBN能自动学习特征，但输入特征的质量是基础。除了传统的代码度量元，可以考虑加入：
- 过程度量元：如代码修改历史、开发者数量、文件年龄等。
- 变更度量元：本次提交修改的行数、修改的文件数、涉及模块的复杂度变化等。
- 语义特征：利用词袋模型或简单的嵌入技术从代码标识符、注释中提取的文本特征。
跨项目预测的挑战：在一个项目上训练的模型，直接用于另一个技术栈、领域、开发规范不同的项目，性能往往会大幅下降（即“项目间差异”）。这是缺陷预测领域的核心挑战之一。解决方案包括：
- 迁移学习：利用DBN等深度模型在大型、多源数据集上进行预训练，学习通用的代码表示，再在目标小项目上进行微调。
- 实例选择与权重调整：从源项目中筛选与目标项目最相似的模块进行训练。
模型集成与持续学习：单一模型的预测可能不稳定。可以集成多个不同架构的模型（如DBN、GBDT、神经网络）进行投票。更重要的是，模型需要能够持续学习。当新的缺陷数据被标记后，应能安全、高效地更新模型，而不是从头训练。
解释性与可操作性：开发者和测试经理不仅想知道“哪个模块可能有缺陷”，更想知道“为什么”。虽然DBN是黑盒，但可以通过SHAP、LIME等模型解释工具，分析哪些原始度量元对本次预测贡献最大，从而提供更具体的代码审查或测试建议。

5.3 性能优化与前沿探索

处理极端高维与稀疏特征：如果引入了文本特征，维度会急剧膨胀。可以考虑先使用自编码器或PCA进行降维，再将降维后的特征与数值型度量元拼接，输入DBN。
结合图神经网络：软件代码的本质是图结构（AST、控制流图、调用图）。图神经网络能直接处理这种结构化信息，是比基于度量元的向量表示更强大的方法。可以将GNN与DBN结合，或用GNN完全替代。
利用预训练语言模型：像CodeBERT、GraphCodeBERT这类基于Transformer架构、在大规模代码库上预训练的模型，能够理解代码的深层语义。将它们作为特征提取器，获取代码片段的向量表示，再接入分类层，是目前最前沿且效果显著的方法。

我个人在实际研究中的体会是，基于深度学习的缺陷预测，其价值不仅在于指标上的提升，更在于它提供了一种自动化和智能化的新范式。它迫使我们将软件质量保障的视角，从依赖人工经验规则，转向基于数据驱动的决策。然而，没有任何一个模型是银弹。DBNPM在应对高维冗余数据上表现出色，但将其成功落地，需要数据科学家和软件工程师的紧密协作，从数据收集、特征定义、模型训练到结果解读，形成一个完整的闭环。最终，一个有效的缺陷预测系统，应该是准确、可解释、易集成的，它辅助人类专家，而不是取代他们。

查看全文

http://www.jsqmd.com/news/890196/