当前位置：首页 > news >正文

别再只会用TOPSIS了！数学建模实战：用Python+灰色关联度分析搞定城市水质评价

news 2026/7/28 21:36:36

用Python+灰色关联度分析破解城市水质评价难题

当面对包含COD、氨氮、总磷等多项指标的复杂水质数据集时，许多分析者会条件反射地选择TOPSIS法。但真实世界的数据往往充满噪声和不确定性，这时候灰色关联度分析（Grey Relational Analysis, GRA）反而能展现出独特优势。去年参与某流域治理项目时，我们曾用传统方法对12个监测断面排序，结果与专家评估存在明显偏差，直到改用GRA才获得符合实际的评价结果。

1. 为什么灰色关联度更适合水质评价？

水质数据具有典型的"小样本、贫信息"特征。某环保局2023年数据显示，约67%的监测站点每月仅采集4-8组数据，且指标间存在非线性关系。灰色关联度分析的核心优势在于：

容忍数据缺失：即使某些监测点数据不完整，仍能保持分析稳定性
无需严格分布假设：不像TOPSIS要求指标满足正态分布
动态权重适应：自动反映各指标对整体水质的动态影响

# 典型水质数据集示例 import pandas as pd water_quality = pd.DataFrame({ '站点': ['A', 'B', 'C', 'D'], 'COD(mg/L)': [15.2, 28.6, 12.1, 32.4], '氨氮(mg/L)': [0.8, 1.5, 0.6, 2.1], '总磷(mg/L)': [0.3, 0.7, 0.2, 0.9] })

注意：实际应用中常会遇到某些站点数据异常偏高的情况，GRA通过数据规范化处理能有效降低极端值影响

2. 数据预处理的三个关键步骤

某次大学生建模竞赛中，超过40%的参赛队因预处理不当导致结果失真。正确的流程应该是：

异常值处理：使用IQR方法识别并修正异常监测值
- 上界 = Q3 + 1.5×IQR
- 下界 = Q1 - 1.5×IQR

指标正向化：将负向指标（如污染物浓度）转换为正向指标

# 负向指标转换示例 def negative_to_positive(x, max_val): return max_val - x water_quality['COD_正向'] = water_quality['COD(mg/L)'].apply( lambda x: negative_to_positive(x, water_quality['COD(mg/L)'].max()))

无量纲化处理：推荐采用均值法标准化

def mean_normalization(series): return series / series.mean() water_quality_normalized = water_quality.iloc[:,1:4].apply(mean_normalization)

处理方法	TOPSIS适用性	GRA适用性	注意事项
Z-score	优	良	可能放大噪声
极差法	良	优	对最大值敏感
均值法	中	优	保持比例关系

3. Python实现灰色关联度完整流程

以下代码展示了从数据加载到结果输出的完整链路，使用公开的长江流域某支流2023年监测数据：

import numpy as np def grey_relation_analysis(data, rho=0.5): """ data: 标准化后的DataFrame (行为样本，列为指标) rho: 分辨系数，通常取0.5 """ # 确定参考序列（各指标最优值） reference = data.max().values # 计算关联系数 diff = np.abs(data.values - reference) min_diff = diff.min() max_diff = diff.max() relations = (min_diff + rho * max_diff) / (diff + rho * max_diff) # 计算关联度并排序 grey_degree = relations.mean(axis=1) return pd.Series(grey_degree, index=data.index) # 应用示例 results = grey_relation_analysis(water_quality_normalized) print(results.sort_values(ascending=False))

提示：分辨系数ρ取值会影响结果区分度，建议在0.3-0.7之间测试

实际项目中我们发现，当ρ=0.5时，某工业园区上下游站点的关联度差异能放大1.8倍，更利于识别潜在污染源。

4. 结果可视化与业务解读

静态的排序列表往往难以体现分析价值。我们使用Pyecharts创建交互式热力图，直观展示各站点在不同指标上的关联度表现：

from pyecharts.charts import HeatMap from pyecharts import options as opts # 准备热力图数据 heat_data = [] for i in range(len(water_quality)): for j in range(3): # 3个指标 heat_data.append([j, i, relations[i,j]]) heatmap = ( HeatMap() .add_xaxis(['COD', '氨氮', '总磷']) .add_yaxis( "关联度", water_quality['站点'].tolist(), heat_data, label_opts=opts.LabelOpts(is_show=False) ) .set_global_opts( visualmap_opts=opts.VisualMapOpts(min_=0, max_=1) ) ) heatmap.render("water_quality_heatmap.html")

这种可视化方式特别适合向非技术人员汇报，某环保局项目汇报会上，主管领导通过热力图立即发现了两个异常站点，后续排查确认了偷排行为。

5. 进阶技巧：动态权重优化

传统GRA采用等权重计算关联度，但实际水质评价中，不同季节应侧重不同指标。我们开发了基于熵权法的动态权重调整方案：

def entropy_weight(data): # 数据标准化 normalized = data / data.sum() # 计算熵值 k = 1 / np.log(data.shape[0]) entropy = -k * (normalized * np.log(normalized)).sum(axis=0) # 计算权重 diversity = 1 - entropy weights = diversity / diversity.sum() return weights # 应用动态权重 weights = entropy_weight(water_quality_normalized) weighted_degree = (relations * weights.values).sum(axis=1)

夏季暴雨期间，该方法自动提升总磷指标的权重（从0.3增至0.45），更准确反映了面源污染的影响。

查看全文

http://www.jsqmd.com/news/909103/