当前位置：首页 > news >正文

别再死记硬背公式了！用Python模拟一个天气预测的马尔可夫链模型（附完整代码）

news 2026/7/28 12:22:37

用Python实战马尔可夫链：从天气预测到商业决策的智能跃迁

天气预报总让人又爱又恨——明明说今天晴天，出门却淋成落汤鸡。这种预测困境背后，其实藏着概率论的瑰宝：马尔可夫链。本文将以天气预测为切入点，带你用Python构建可落地的马尔可夫模型，并拓展到商业决策、用户行为预测等真实场景。无需数学公式堆砌，我们将通过代码实现和可视化，让抽象概念变得触手可及。

1. 环境配置与基础概念

工欲善其事，必先利其器。我们先配置开发环境：

# 安装必要库（建议使用Python 3.8+） !pip install numpy pandas matplotlib seaborn

马尔可夫链的核心是无记忆性（Markov Property）：未来状态只取决于当前状态。用天气举例：

今天晴天的前提下，明天降雨的概率与过去一周的天气无关
这种特性大幅简化了复杂系统的建模过程

状态转移矩阵是马尔可夫链的心脏。假设我们只有三种天气状态：

当前\下一状态	晴天	阴天	雨天
晴天	0.7	0.2	0.1
阴天	0.3	0.5	0.2
雨天	0.2	0.3	0.5

这个矩阵告诉我们：如果今天是晴天，明天仍有70%概率保持晴天；若是雨天，第二天有50%概率继续下雨。

2. 构建天气预测引擎

让我们用Python实现这个预测系统。首先定义状态和转移矩阵：

import numpy as np states = ['晴天', '阴天', '雨天'] transition_matrix = np.array([ [0.7, 0.2, 0.1], # 晴天 [0.3, 0.5, 0.2], # 阴天 [0.2, 0.3, 0.5] # 雨天 ])

预测未来N天天气的核心算法：

def predict_weather(days, current_state): state_idx = states.index(current_state) predictions = [] for _ in range(days): # 根据当前状态选择转移概率 probs = transition_matrix[state_idx] # 按概率随机选择下一状态 next_state = np.random.choice(states, p=probs) predictions.append(next_state) state_idx = states.index(next_state) return predictions

测试这个预测器：

# 从晴天开始预测未来7天 forecast = predict_weather(7, '晴天') print("未来一周天气预报:", " → ".join(forecast))

注意：每次运行结果可能不同，这是概率模型的特性。要获得稳定趋势需要多次模拟取平均值。

3. 可视化与结果分析

数据科学家常说："没可视化的分析就像没放调料的沙拉。"让我们用Matplotlib增强结果呈现：

import matplotlib.pyplot as plt from collections import Counter def simulate_and_plot(runs=1000, days=7): results = {state: [0]*days for state in states} for _ in range(runs): forecast = predict_weather(days, '晴天') for day, state in enumerate(forecast): results[state][day] += 1 # 转换为概率 for state in results: results[state] = [x/runs for x in results[state]] # 绘制堆叠面积图 fig, ax = plt.subplots(figsize=(10,6)) bottom = np.zeros(days) for state, counts in results.items(): ax.bar(range(days), counts, label=state, bottom=bottom) bottom += counts ax.set_xlabel('预测天数') ax.set_ylabel('概率分布') ax.set_title(f'天气概率变化趋势 ({runs}次模拟)') ax.legend() plt.show() simulate_and_plot()

这段代码会生成直观的概率分布图，展示从晴天出发，未来七天各种天气出现的概率变化。你会观察到：

前几天受初始状态影响较大
约5天后趋于稳定分布（稳态分布）
雨天概率随时间逐渐升高

4. 商业场景迁移应用

马尔可夫链的魅力在于其通用性。只需更换状态定义，同一套代码就能解决各类预测问题：

4.1 用户行为预测

定义电商用户状态：

user_states = ['浏览', '加购', '收藏', '支付'] user_matrix = np.array([ [0.6, 0.2, 0.15, 0.05], # 浏览 [0.3, 0.4, 0.2, 0.1 ], # 加购 [0.2, 0.3, 0.3, 0.2 ], # 收藏 [0.1, 0.1, 0.1, 0.7 ] # 支付 ])

4.2 库存管理

预测商品库存状态：

inventory_states = ['充足', '预警', '缺货'] inventory_matrix = np.array([ [0.8, 0.15, 0.05], # 充足 [0.5, 0.3, 0.2 ], # 预警 [0.3, 0.4, 0.3 ] # 缺货 ])

4.3 金融信用评级

评估客户信用变化：

credit_states = ['AAA', 'AA', 'A', 'BBB', '违约'] credit_matrix = np.array([ [0.85, 0.1, 0.04, 0.01, 0.0], [0.1, 0.75, 0.1, 0.05, 0.0], [0.02, 0.15, 0.7, 0.1, 0.03], [0.01, 0.05, 0.15, 0.6, 0.19] ])

提示：实际应用中，转移矩阵需要通过历史数据统计得出。可以使用value_counts()等方法计算状态转移频率。

5. 高级应用与优化技巧

当掌握了基础模型后，可以尝试这些进阶操作：

5.1 稳态分布计算

通过矩阵运算找到长期稳定状态：

def find_steady_state(matrix, tolerance=1e-6): n = matrix.shape[0] diff = np.inf current = np.ones(n)/n # 初始随机分布 while diff > tolerance: next_state = current @ matrix diff = np.sum(np.abs(next_state - current)) current = next_state return current steady_state = find_steady_state(transition_matrix) print("稳态分布:", dict(zip(states, steady_state)))

5.2 蒙特卡洛模拟增强预测

结合历史数据进行更精准预测：

def monte_carlo_simulation(initial_state, steps=100, runs=10000): state_counts = {state:0 for state in states} for _ in range(runs): final_state = predict_weather(steps, initial_state)[-1] state_counts[final_state] += 1 # 归一化 total = sum(state_counts.values()) return {k: v/total for k,v in state_counts.items()}

5.3 实时更新转移矩阵

动态调整模型参数：

class DynamicMarkovModel: def __init__(self, states): self.states = states self.state_index = {s:i for i,s in enumerate(states)} self.counts = np.ones((len(states), len(states))) # 初始为1避免除零 def update(self, sequence): for i in range(len(sequence)-1): current = self.state_index[sequence[i]] next_ = self.state_index[sequence[i+1]] self.counts[current][next_] += 1 @property def transition_matrix(self): row_sums = self.counts.sum(axis=1, keepdims=True) return self.counts / row_sums

在实际项目中，我发现这些技巧能显著提升模型效果：