当前位置: 首页 > news >正文

分别用四种不同的方法对时序序列的异常点检测(python代码)

1.时序数据(是对第四列(Dissolved Oxygen)溶解氧进行异常点检测)

2.四种异常点检测模型

2.1.iForest算法

对水质记录数据集中的溶解氧(Dissolved Oxygen)进行异常检测,并通过 Isolation Forest 算法识别出异常点。

具体流程如下:

  1. 导入所需的库和模块,包括 numpy、pandas、matplotlib、sklearn.metrics 中的 roc_auc_score,以及 sklearn.ensemble 中的 IsolationForest。

  2. 设置绘图相关的参数。

  3. 读取数据集并提取出溶解氧一列。

  4. 将溶解氧数据转换成二维数组,以便后续处理。

  5. 构建 IsolationForest 模型,并通过 fit 方法拟合数据。

  6. 通过 decision_function 方法获得每个数据点的异常程度,并将预测结果保存在 item 变量中。

  7. 使用 predict 方法预测每个数据点是否为异常点,并将预测结果保存在 pre 变量中。由于 Isolation Forest 的预测结果是 -1 表示异常点,1 表示正常点,因此将预测结果中的 -1 转换成 0。

  8. 计算预测结果与异常程度之间的 roc_auc_score,并输出结果。

  9. 对预测结果为异常点的数据点进行可视化,用红色散点表示。

  10. 将预测结果为异常点的数据点从 DO 数组中删除,并将删除后的数据保存在 DO_copy 变量中。

  11. 对删除异常点后的数据进行可视化,用蓝色线条表示。

  12. 输出异常点的数量、删除后的数据点数量和 DO_copy 数组的形状。

  13. 运行结果

2.2.Local Outlier Factor(局部离群点因子)算法

这段代码使用了Local Outlier Factor(局部离群点因子)算法来检测数据集中的异常值(离群点)。

具体来说,它读取了一个水质记录的CSV文件,提取其中的溶解氧数据(Dissolved Oxygen),并将其转化为NumPy数组。然后,它使用sklearn.neighbors中的LocalOutlierFactor类来创建一个分类器,并将溶解氧数据(DO)输入分类器进行拟合和预测。接着,它遍历预测结果,将预测为-1的样本点(即被分类为离群点)用红点标记在图上,并将其从原始数据中删除,最后将剩下的数据绘制成另一个图形。

该代码的主要目的是帮助筛选出数据集中存在的异常值,以便进一步的处理。

运行结果

2.3. OneClassSVM

这段代码的主要作用是使用支持向量机(SVM)来检测水质记录中的异常值(outliers)。具体来说,它通过导入sklearn库中的svm.OneClassSVM函数,对数据中的溶解氧(Dissolved Oxygen)这一列进行处理,将其转换为numpy数组后,通过调用fit()方法训练SVM模型。然后,使用fit_predict()方法来检测数据集中的异常值,将检测到的异常值用红色散点图标记出来,并输出异常值的个数。最后,将所有数据点和异常值在同一张图中绘制出来,以便用户查看和分析结果。

运行结果

2.4。DBSCAN算法

代码主要是用DBSCAN算法对水质数据集中的溶解氧数据进行聚类分析。具体实现步骤如下:

  1. 导入所需的库,包括numpy、pandas、matplotlib和sklearn.cluster中的DBSCAN。

  2. 读取水质数据集,将其中的溶解氧数据提取出来。

  3. 构造输入数据,将溶解氧数据组成一个二维数组。

  4. 设置DBSCAN算法的参数,包括领域的大小(eps)和领域内最小点的个数(min_samples)。

  5. 构造分类器,并对数据进行拟合和预测,得到每个样本所属的簇的标签。

  6. 统计异常值的个数(即标签为-1的样本),并将其在图中用红色圆圈表示。

  7. 将统计结果输出,并将所有样本的散点图绘制出来,其中异常值用红色标记。

对代码感兴趣的私信

http://www.jsqmd.com/news/410656/

相关文章:

  • 工艺品植绒布厂家全攻略:高频疑问解答,选对供应商少走弯路 - 品牌企业推荐师(官方)
  • 树的重心|例题:洛谷P1364医院设置
  • 2026年最新工业大脑公司推荐:涵盖全球厂商,直面工业科技前沿
  • 2026大型洗涤设备优质推荐榜 含价格查询 - 优质品牌商家
  • 探讨不锈钢螺旋筋瓦斯管价格和选购要点,新疆有好用的厂家吗 - myqiye
  • 全球工业格局:汽车制造AI系统排名,AI如何改变现代工业
  • 计算机毕业设计之jsp个体商户经营管理系统的设计与实现
  • 使用Yolo 11进行定制化图像识别全流程
  • 吐血推荐! AI论文工具 千笔AI VS PaperRed,继续教育写作神器!
  • 2026年高精密光学与医疗CNC加工厂家推荐:五轴工艺与质量管控深度解析 - 余文22
  • 细聊闪测仪价格区间,台硕检测闪测仪费用高吗 - mypinpai
  • 2026年内蒙古路边石/火烧板/地铺石/吉林白工程板源头厂家优选指南:蛟河市鑫双兴石材厂 - 2026年企业推荐榜
  • Alexa迈入“自我”时代:AI自主性新纪元
  • 驱动清理技术全解析:从底层原理到企业级部署
  • 2026年韶山评价高的企业红色团建,红色培训,红色教育培训学院优质供应商榜单 - 品牌鉴赏师
  • 2026陀螺仪,陀螺系统厂家优选指南:技术趋势与核心厂商测评 - 深度智识库
  • TileLang-Ascend“Developer模式“
  • 外贸独立站和平台店铺有什么区别?2026年ROI测算模型
  • 2026年度铝外壳与医疗五轴CNC高精密零件加工厂家推荐榜单:侧重品质与卓越服务 - 余文22
  • springboot121-基于Java的房屋系统(编号:45266146)
  • Aila:一次提问,与全球顶尖AI同时对话
  • 一站式解析:多语言网站云浮服务商如何在48小时内完成需求评估
  • MATLAB认知无线电网络中的信道选择算法
  • NxNandManager:突破Switch存储管理难题的革新工具
  • 【图像加密】基于自正交拉丁方算法进行图像加密和解密附matlab代码
  • 方法级缓存@PassionFruit
  • 永磁同步电机(PMSM)与T型三电平逆变器的Simulink仿真之旅
  • [项目]乐谱资料管理系统(北京某培训机构定制)
  • 2026年云南旅行社推荐排行榜:火车站附近地接、包车导游、接送机服务,诚信旅行社报价与服务优势深度解析 - 品牌企业推荐师(官方)
  • 抽屉里的闲置瑞祥商联卡福利,别让它悄悄过期 - 团团收购物卡回收