当前位置：首页 > news >正文

Python统计假设检验17种方法速查与应用指南

news 2026/6/23 0:21:34

## 1. 统计假设检验的核心价值与应用场景 统计假设检验是数据分析师和研究人员最常使用的工具之一。在Python生态中，借助SciPy、StatsModels等库，我们可以快速实现各类检验方法。实际工作中经常遇到这样的场景：产品经理拿着AB测试数据问你"这个转化率提升显著吗？"，或者临床研究人员需要确认"新药组和对照组的疗效差异是否具有统计学意义"。这时候就需要选择合适的假设检验方法。 我整理了一份包含17种常用检验方法的速查表（Cheat Sheet），覆盖从正态性检验到非参数检验的常见需求。这份清单特别适合放在手边随时查阅，当你不确定该用T检验还是Mann-Whitney U检验时，可以快速找到答案。下面我会详细解释每种方法的适用条件、实现代码以及实际应用中的注意事项。 ## 2. 参数检验方法详解 ### 2.1 正态分布检验 在决定使用参数检验还是非参数检验前，必须先检查数据是否符合正态分布。常用的检验方法有： ```python from scipy import stats # Shapiro-Wilk检验（适合小样本） stat, p = stats.shapiro(data) # Anderson-Darling检验（适合大样本） result = stats.anderson(data) # Kolmogorov-Smirnov检验 stat, p = stats.kstest(data, 'norm')

重要提示：当p值小于0.05时，通常认为数据不服从正态分布。但样本量大于50时，Shapiro检验可能过于敏感，建议改用Anderson-Darling检验。

2.2 均值比较检验

单样本T检验

用于检验样本均值与已知值的差异：

t_stat, p_val = stats.ttest_1samp(sample, popmean)

独立样本T检验

比较两组独立样本的均值差异：

t_stat, p_val = stats.ttest_ind(group1, group2)

配对T检验

用于前后测设计或配对样本：

t_stat, p_val = stats.ttest_rel(before, after)

实际经验：当方差齐性不满足时（可用Levene检验判断），应设置equal_var=False参数使用Welch校正。

3. 非参数检验方法精讲

3.1 秩和检验

当数据不满足正态分布时，Mann-Whitney U检验是独立T检验的非参数替代：

u_stat, p_val = stats.mannwhitneyu(group1, group2)

对应的配对版本是Wilcoxon符号秩检验：

stat, p_val = stats.wilcoxon(before, after)

3.2 Kruskal-Wallis检验

单因素方差分析的非参数版本，适用于多组比较：

h_stat, p_val = stats.kruskal(*groups)

4. 方差分析与相关性检验

4.1 单因素方差分析(ANOVA)

f_stat, p_val = stats.f_oneway(*groups)

4.2 重复测量方差分析

需要借助StatsModels实现：

import statsmodels.api as sm from statsmodels.formula.api import ols model = ols('score ~ C(time) + C(subject)', data).fit() anova_result = sm.stats.anova_lm(model, typ=2)

4.3 相关性检验

Pearson相关系数（线性相关）：

r, p = stats.pearsonr(x, y)

Spearman秩相关（单调关系）：

rho, p = stats.spearmanr(x, y)

5. 比例检验与卡方检验

5.1 比例检验

比较样本比例与理论值：

count = 55 # 成功次数 nobs = 100 # 总试验数 value = 0.5 # 理论比例 stat, p_val = stats.binom_test(count, nobs, value)

5.2 卡方检验

适合性检验（观察频数vs期望频数）：

stat, p_val = stats.chisquare(f_obs, f_exp)

独立性检验（列联表分析）：

stat, p_val, dof, expected = stats.chi2_contingency(table)

6. 实用速查表与决策流程

6.1 检验方法选择流程图

数据类型	比较目标	方法选择
连续变量	单样本均值	Shapiro → T检验/Mann-Whitney
连续变量	两独立组	方差齐性 → T检验/Welch检验
分类变量	比例差异	卡方检验/Fisher精确检验

6.2 完整17种检验清单

Shapiro-Wilk正态性检验
Kolmogorov-Smirnov检验
Anderson-Darling检验
单样本T检验
独立样本T检验
配对样本T检验
Levene方差齐性检验
Mann-Whitney U检验
Wilcoxon符号秩检验
Kruskal-Wallis检验
Friedman检验
单因素ANOVA
重复测量ANOVA
Pearson相关性检验
Spearman相关性检验
二项比例检验
卡方独立性检验

7. 实际应用中的常见陷阱

7.1 多重比较问题

当进行多次检验时，假阳性率会显著上升。解决方法包括：

Bonferroni校正：将显著性水平α除以检验次数
使用FDR（错误发现率）控制方法

from statsmodels.stats.multitest import multipletests reject, pvals_corrected, _, _ = multipletests(pvals, method='bonferroni')

7.2 样本量不足

小样本情况下（n<30），非参数检验的效能可能不足。建议：

优先考虑参数检验（如T检验）
如必须使用非参数方法，可考虑增加样本量
报告效应量（effect size）而不仅是p值

7.3 效应量计算

除了p值，还应报告效应量指标：

Cohen's d（T检验）
Eta-squared（ANOVA）
Cramer's V（卡方检验）

# 计算Cohen's d def cohen_d(x,y): nx, ny = len(x), len(y) dof = nx + ny - 2 return (np.mean(x) - np.mean(y)) / np.sqrt(((nx-1)*np.std(x)**2 + (ny-1)*np.std(y)**2) / dof)

我在实际项目中发现，很多分析师只关注p值是否小于0.05，却忽略了效应量大小。一个统计显著但效应量很小的结果，在实际应用中可能毫无意义。建议在报告中同时呈现p值和效应量指标，并给出专业解释。

查看全文

http://www.jsqmd.com/news/706468/