当前位置：首页 > news >正文

别再死磕直接求解器了！用Python手把手实现一个简易AMG求解器（附完整代码）

news 2026/8/1 7:12:54

用Python实现简易AMG求解器：告别直接求解的性能瓶颈

在数值计算领域，大型稀疏线性方程组的求解一直是工程师和科研人员面临的挑战。当矩阵维度超过10万时，传统的直接求解方法如LU分解会消耗惊人的内存和计算时间。我曾在一个流体仿真项目中，面对200万×200万的稀疏矩阵，numpy.linalg.solve运行了整整三天仍未完成计算——这正是我们需要代数多重网格法(AMG)的根本原因。

与大多数教程不同，本文将完全从代码实践角度出发，用Python构建一个精简但功能完整的AMG求解器原型。我们会避开繁琐的数学推导，专注于三个核心环节的实现：粗网格生成、插值算子构建和V-cycle迭代。最终完成的求解器虽然只有不到200行代码，却能处理传统方法难以应对的大规模问题。

1. AMG核心架构设计

我们的AMG求解器将采用经典的Ruge-Stuben算法框架，整体结构分为预处理阶段和求解阶段。预处理阶段负责构建多层网格结构，这是AMG区别于传统迭代法的关键所在。

class AMGSolver: def __init__(self, A, theta=0.25): self.A = A # 原始系数矩阵 self.theta = theta # 强连接阈值 self.levels = [] # 存储各层网格信息 def setup(self): """构建多层网格结构""" current_A = self.A while current_A.shape[0] > 100: # 粗化至约100阶矩阵停止 level = {} level['A'] = current_A level['C'], level['F'] = self.coarsen(current_A) level['P'] = self.interpolation(current_A, level['C'], level['F']) level['R'] = level['P'].T # 限制算子为插值算子的转置 current_A = level['R'] @ current_A @ level['P'] # 计算粗网格矩阵 self.levels.append(level)

关键参数选择经验：

theta通常取0.2-0.3，值越小粗网格点越多
粗化停止条件可根据问题规模调整，一般到100-200阶即可
插值算子构建是精度关键，直接影响收敛速度

2. 粗网格生成实现

粗化过程本质是图论中的节点选择问题。我们将矩阵视为图，使用RS算法选择粗网格点(C点)，其余为细网格点(F点)。以下是完整的粗化实现：

def coarsen(self, A): n = A.shape[0] S = self.get_strong_connections(A) # 获取强连接关系 C = set() F = set(range(n)) # 第一阶段：根据强连接独立集选择粗点 while True: # 计算每个点的权重（强影响点数） weights = {i: len(S['T'][i]) for i in F} if not weights: break # 选择权重最大的点作为粗点 i = max(weights.keys(), key=lambda x: weights[x]) C.add(i) F.remove(i) # 移除i及其强连接的邻居 neighbors = S['T'][i].union(S['D'][i]) F -= neighbors # 第二阶段：确保每个F点至少连接一个C点 for i in list(F): if not S['D'][i].intersection(C): # 若无连接，选择强连接中权重最大的点加入C candidates = S['D'][i] if candidates: j = max(candidates, key=lambda x: len(S['T'][x])) C.add(j) F.remove(j) return list(C), list(F) def get_strong_connections(self, A): """识别强连接关系""" n = A.shape[0] S = {'D': defaultdict(set), 'T': defaultdict(set)} # 强依赖和强影响 for i in range(n): row = A.getrow(i) if issparse(A) else A[i] diagonal = row[i] for j in range(n): if i != j and abs(row[j]) > self.theta * abs(diagonal): S['D'][i].add(j) # j强依赖于i S['T'][j].add(i) # i强影响j return S

性能优化技巧：

使用稀疏矩阵存储非零元素（scipy.sparse）
在第一阶段采用贪心算法快速选择粗点
通过字典存储连接关系，提高查询效率

3. 插值算子构建

插值算子P负责将粗网格解映射到细网格。我们实现经典的直接插值方法，保证算子稀疏性：

def interpolation(self, A, C, F): n = A.shape[0] nc = len(C) P = lil_matrix((n, nc)) # 列表格式便于构建 # 粗点直接对应 c_indices = {c: i for i, c in enumerate(C)} for i, c in enumerate(C): P[c, i] = 1.0 # 对每个F点构建插值关系 S = self.get_strong_connections(A) for i in F: # 获取强连接的C点 D_i = S['D'][i] C_i = D_i.intersection(C) if not C_i: # 若无强连接C点，取对角元最大的连接 row = A.getrow(i) if issparse(A) else A[i] max_val = 0 best_c = C[0] for c in C: if abs(row[c]) > max_val: max_val = abs(row[c]) best_c = c P[i, c_indices[best_c]] = 1.0 continue # 计算插值权重 a_ii = A[i,i] sum_strong = sum(A[i,j] for j in S['D'][i]) for c in C_i: a_ic = A[i,c] sum_c = sum(A[i,j] for j in S['D'][i] if c in S['D'][j]) w = -a_ic / (a_ii + sum_strong) if (a_ii + sum_strong) != 0 else 0 P[i, c_indices[c]] = w return P.tocsr() # 转换为压缩稀疏行格式

插值质量检查：

每行非零元不超过5个（保证稀疏性）
粗点对应的列应为单位向量
所有行和应接近1（保持常数函数）

4. V-cycle迭代求解

完成预处理后，我们实现标准的V-cycle迭代算法：

def solve(self, b, x0=None, max_iters=20, tol=1e-6): if x0 is None: x = np.zeros_like(b) else: x = x0.copy() for _ in range(max_iters): residual = b - self.A @ x if np.linalg.norm(residual) < tol: break # V-cycle开始 x = self.v_cycle(0, x, b) return x def v_cycle(self, level, x, b): if level == len(self.levels): # 最粗层直接求解 A = self.levels[-1]['A'] return spsolve(A, b) # 当前层信息 A = self.levels[level]['A'] P = self.levels[level]['P'] R = self.levels[level]['R'] # 预平滑 x = self.gauss_seidel(A, x, b, iterations=2) # 限制残差到粗网格 residual = b - A @ x coarse_b = R @ residual # 粗网格求解 coarse_x = np.zeros(coarse_b.shape) coarse_x = self.v_cycle(level+1, coarse_x, coarse_b) # 插值修正 x += P @ coarse_x # 后平滑 x = self.gauss_seidel(A, x, b, iterations=2) return x def gauss_seidel(self, A, x, b, iterations=1): """高斯-赛德尔平滑迭代""" for _ in range(iterations): for i in range(A.shape[0]): row = A.getrow(i) if issparse(A) else A[i] sum_ax = row.dot(x) x[i] = (b[i] - (sum_ax - row[i]*x[i])) / row[i] return x

收敛性调优：

增加预/后平滑次数可提高稳定性
在粗网格上可采用更精确的直接求解
结合Krylov子空间方法如CG可加速收敛

5. 性能测试与对比

我们构造一个典型的二维泊松问题测试求解器性能：

def test_poisson_2d(n=64): """生成n×n二维泊松问题""" from scipy.sparse import diags h = 1.0 / (n+1) diagonals = [-np.ones(n*n-1), 4*np.ones(n*n), -np.ones(n*n-1)] offsets = [-1, 0, 1] A = diags(diagonals, offsets, format='csr') # 添加周期性边界条件 for i in range(n): A[i*n, (i+1)*n-1] = -1.0 A[(i+1)*n-1, i*n] = -1.0 # 构造右端项 x = np.linspace(h, 1-h, n) y = np.linspace(h, 1-h, n) X, Y = np.meshgrid(x, y) b = np.sin(np.pi*X) * np.sin(np.pi*Y) b = b.ravel() return A, b # 测试不同规模问题 sizes = [32, 64, 128] results = [] for n in sizes: A, b = test_poisson_2d(n) # 直接求解 t0 = time.time() x_direct = spsolve(A, b) t_direct = time.time() - t0 # AMG求解 solver = AMGSolver(A, theta=0.25) solver.setup() t0 = time.time() x_amg = solver.solve(b, max_iters=20, tol=1e-6) t_amg = time.time() - t0 # 计算误差 error = np.linalg.norm(x_direct - x_amg) results.append((n*n, t_direct, t_amg, error))

性能对比表：