066、无监督学习:K-means聚类实战手记
066、无监督学习:K-means聚类实战手记
昨天在产线数据监控系统里遇到个典型问题——产线上传的传感器温度数据突然出现异常波动,但产线状态显示正常。打开原始数据一看,八千多条温度记录,肉眼根本看不出规律。这时候就该无监督学习上场了,特别是K-means这种“数据分组”利器。
问题场景:产线温度数据异常检测
产线每5秒采集一次温度,24小时就是17280个点。运维同事已经排除了硬件故障,怀疑是某些传感器的固有特性导致数据分布异常。我们需要找出数据中“自然形成”的簇,看看是否存在异常的传感器分组。
K-means核心思想:物以类聚
K-means的哲学很简单:相似的数据点应该聚在一起。算法自己找中心点(质心),把附近的数据点拉到自己阵营。整个过程就像社交场合中人们自动形成小圈子——距离近的聊得来。
importnumpyasnpfromsklearn.clusterimportKMeansimportmatplotlib