当前位置: 首页 > news >正文

对角矩阵的层次聚类

对角矩阵(即距离/相似度矩阵)是层次聚类(尤其是凝聚式层次聚类)的核心输入,其计算过程本质是基于距离矩阵不断合并簇、更新矩阵的迭代过程,具体步骤如下:

一、初始化距离矩阵(对角矩阵)

首先对所有N个数据点计算两两之间的距离,构建N×N的对称距离矩阵(对角矩阵,对角线元素为0,代表自身与自身的距离为0)。

- 常用距离度量:欧氏距离、曼哈顿距离等,层次聚类最常用欧氏距离。

- 示例:若有A-G共7个数据点,先计算所有点对的距离,得到对称的距离矩阵,对角线为0,非对角线元素为对应两点的距离。

二、迭代合并与矩阵更新

凝聚式层次聚类的核心迭代逻辑如下,每一步都会更新距离矩阵:

1. 寻找最近簇:在当前的对角矩阵中,找到非对角线距离最小的两个簇(初始时每个数据点就是一个簇)。

- 例如初始矩阵中B和C的距离最小(1.00),则优先合并B、C为一个新簇(B,C)。

2. 合并簇:将距离最近的两个簇合并为一个新簇,此时总簇数减1。

3. 更新距离矩阵:删除原两个簇对应的行和列,新增一行一列代表新簇与其他所有簇的距离,重新计算新簇到其余簇的距离,得到新的对角矩阵。

计算两个簇之间距离(即新行/列的数值)有三种常用标准:

- 单连接(Single Linkage):取两个簇中所有点对的最小距离作为簇间距离,易受极端值影响,可能出现“链式效应”。

- 完全连接(Complete Linkage):取两个簇中所有点对的最大距离作为簇间距离,限制较强,可能忽略整体相近的簇。

- 平均连接(Average Linkage):取两个簇中所有点对的距离均值作为簇间距离,结果更稳定,计算量相对更大。

- 示例:合并(B,C)后,计算新簇(B,C)到A的距离,需取B到A、C到A的距离均值作为簇间距离。

三、终止与结果输出

重复上述“找最近簇-合并-更新矩阵”的步骤,直到满足终止条件:

- 可选终止条件:所有点合并为一个大簇、达到预设的簇数量、最近簇的距离超过设定阈值。

- 最终可通过树状图(dendrogram)可视化整个合并过程,直观展示数据的层次结构,也可通过切割树状图得到指定数量的聚类结果。

补充说明

如果是分裂式层次聚类(自顶向下),则初始将所有点放在一个大簇中,每次分裂时计算簇内点的距离矩阵,将最不相似的子簇拆分,逐步更新矩阵直到每个点自成一类,该方法实际应用较少。

http://www.jsqmd.com/news/854473/

相关文章:

  • 全息三维空间孪生,全域无感精准智位系列:UWB:多路径干扰精度失稳|镜像:多源时空误差融合
  • 长春沙发翻新换皮靠谱商家推荐|匠阁、御匠、锦修三大品牌全解析、服务内容、全市上门 - 卓信营销
  • SPEC CPU 2017基准测试深度解析:从原理到实战调优
  • 在MMDetection 3.x中手把手复现EfficientDet的BiFPN模块(附代码逐行解读)
  • UWB:可视测距、遮挡失联|镜像:盲区推演、全域接续 可视测距受限与盲区智能重构技术解析
  • 校园外卖跑腿小程序系统Java代买帮忙配送源码解决方案
  • 【万字文档+源码】基于SpringBoot+vue社区药房系统 -可用于毕设-课程设计-练手学习
  • 飞驰人生3电影完整版免费看
  • 我的Type-C串口板又烧了?一个CH340N电路设计中的隐藏坑点与补救方案
  • 沈阳塑胶地板哪家靠谱?本地服务商实测指南
  • 保姆级教程:在Ubuntu 14.04上为ARM64交叉编译带WebRTC的ZLMediaKit(含libsrtp/OpenSSL避坑指南)
  • SaySo 语音识别相关技术解析,从语音输入到可用文本
  • 企业Agent体系建设:从CLI化到Skill化的完整指南
  • SWAT-MODFLOW地表与地下协同模拟及多情景专题应用
  • 别再只用COCO了!针对桥梁隧道裂缝检测,这份8000+样本的精细标注数据集评测与使用指南
  • Linux Shell生成随机文件:dd、openssl等工具实战与性能优化
  • Datasheet学习4(Audio)(TODO)
  • 别再搞混了!SAP物料主数据、BOM、工艺路线里的三种损耗率(Scrap)到底怎么配?
  • 5大核心技术突破:Source Han Serif CN开源字体全栈部署实战指南
  • 2026年玉米膨化机市场:谁是真正的行业领航者?
  • 高粱品质改良与生物育种技术创新 伯远生物
  • 如何用Driver Store Explorer彻底清理Windows冗余驱动:完整指南
  • 日砸3亿的具身智能狂潮,英诺投中半个清华系
  • 嵌入式系统学习路线:从C语言到RTOS/Linux的四年规划
  • cursor接入外部大模型教程!新手必看
  • Perplexity诗词搜索实测对比:3类主流AI模型在平仄识别、典故溯源、意象关联上的性能断层式差距(附127组测试数据)
  • 2026 智能中高考行业深度报告:想象力凭精准提分成加盟首选
  • Windows 10下MFA安装避坑全记录:解决conda网络超时、模型下载失败等常见问题
  • UWB:直线传播物理局限|镜像:跨镜时空轨迹张量
  • 美团霸王餐活动API接口快速对接