当前位置：首页 > news >正文

神经算子：从PDE求解到生物医学工程应用的AI新范式

news 2026/7/18 14:54:54

1. 神经算子：从抽象概念到生物医学的“超级翻译器”

在科学计算和工程仿真领域，我们长期面临一个核心矛盾：一方面，物理世界的规律（如流体流动、组织形变、药物扩散）本质上是连续的，由偏微分方程（PDE）描述；另一方面，计算机只能处理离散的数据点。传统的高保真数值方法（如有限元法）虽然精确，但计算成本高昂，难以满足实时或大规模参数化分析的需求。而降阶模型（ROM）虽然快速，但其极度简化的特性往往牺牲了泛化能力，一旦问题参数或边界条件超出预设范围，预测就可能失效。

大约五年前，一种名为“神经算子”的机器学习范式开始进入我们的视野。它试图从根本上解决这个矛盾：不学习单个问题的解，而是学习从问题参数（如边界条件、外力、材料属性）到PDE解的“映射规则”本身。你可以把它想象成一个精通所有PDE语言的“超级翻译器”。一旦训练完成，给定一个新的、从未见过的“问题描述”（输入函数），这个翻译器几乎能瞬间“译出”对应的“解”（输出函数），无需重新进行昂贵的数值求解。

我第一次接触这个概念是在一篇关于非局部材料建模的论文中，当时团队正苦于如何从有限的生物组织实验数据中反推出其复杂的本构关系。传统方法要么需要强假设，要么计算量巨大。神经算子的出现，尤其是像DeepONet这样的架构，让我们看到了曙光——它承诺了一种数据驱动且高效的方法，来学习这种从载荷到响应的复杂物理映射。在生物医学工程这个数据往往稀疏、昂贵，但物理规律又至关重要的领域，这种能力显得尤为珍贵。它不仅仅是加速计算，更是开启了一扇从数据中直接发现物理规律、构建可解释模型的新大门。

2. 核心架构解析：神经算子如何“学会”映射

神经算子的核心思想是学习两个无限维函数空间之间的算子。用更直白的话说，传统神经网络学习的是“点对点”的映射（如输入一个向量，输出一个标量或向量），而神经算子学习的是“函数对函数”的映射。这使其天生适合处理PDE问题，因为PDE的解本身就是一个函数（如空间中的温度场、位移场）。

2.1 两大主流范式：DeepONet与积分神经算子

目前，神经算子家族主要有两大分支，它们从不同的数学视角实现了函数到函数的映射。

2.1.1 DeepONet：分支与主干的精巧分工

DeepONet（Deep Operator Network）是首个具有严格数学基础的深度神经算子，其设计非常直观且巧妙。它由两个并行的子网络构成：

分支网络：负责处理输入函数f。通常，我们将输入函数在一组固定的传感器点{x1, x2, ..., xm}上进行离散采样，得到一个向量[f(x1), f(x2), ..., f(xm)]输入给分支网络。该网络的任务是从这个离散表示中，提炼出能够刻画整个输入函数全局特征的隐式编码b(f) = [b1(f), b2(f), ..., bp(f)]。你可以把它理解为一个“问题特征提取器”。
主干网络：负责处理输出函数的查询位置y。它接收一个空间坐标y作为输入，输出一个相同维度的向量t(y) = [t1(y), t2(y), ..., tp(y)]。这个网络学习的是解函数在空间中的基函数模式，是一个“空间模式编码器”。

最终的预测输出Gθ(f)(y)，就是这两个向量在隐空间中的内积：Gθ(f)(y) = Σ_{k=1}^{p} bk(f) · tk(y)这实际上是用一组由主干网络生成的、与位置相关的基函数tk(y)，以及由分支网络确定的、与输入函数相关的系数bk(f)，来线性组合出最终的解函数。这种“系数-基函数”的分解思想，与许多经典的数值方法（如谱方法）有异曲同工之妙。

注意：DeepONet的训练完全依赖于数据。损失函数就是预测解与真实解在所有训练样本和所有传感器位置上的均方误差。它不显式地编码物理方程，因此是一个“黑箱”模型，但其强大的函数逼近能力已被理论证明。

2.1.2 基于空间的积分神经算子：迭代式的特征演化

另一大类神经算子采用了一种迭代架构，灵感来源于求解PDE的迭代方法（如不动点迭代）。其通用形式可以写作：u_{t+1}(x) = σ( W u_t(x) + ∫ κ_φ(x, y, a(x), a(y)) u_t(y) dy )这里：

u_t(x)是第t层（或迭代步）的特征函数。
σ是非线性激活函数。
W是一个线性变换矩阵（可学习参数）。
积分核κ_φ是整个架构的灵魂。它是一个由神经网络参数化的函数，定义了空间中任意两点x和y之间的“相互作用”。通过积分操作，模型能够捕获解函数的非局部依赖关系，这是处理许多复杂物理现象（如长程力、扩散）的关键。
a(x)和a(y)是可选的附加信息，如空间相关的参数或系数。

这个公式描述了一个过程：每一层，节点x处的特征由其自身经过线性变换后的特征，加上其“邻居”节点y的特征通过核函数加权求和后的结果，共同经过非线性激活得到。通过多层堆叠，信息在空间中传播和融合，最终逼近PDE的解。

2.1.3 谱域实现的“三剑客”

直接计算上述积分在连续空间中是不现实的。因此，研究者们利用变换域方法来实现高效的积分操作，其中最著名的三种是：

傅里叶神经算子：在傅里叶频域进行积分核与函数的卷积。由于卷积在频域变为逐点乘法，且快速傅里叶变换效率极高，FNO在处理具有平移不变性的问题上（如均匀介质中的波动）速度极快，成为目前最流行的神经算子之一。
小波神经算子：使用小波变换替代傅里叶变换。小波能同时提供空间和频率的局部化信息，因此WNO特别擅长处理多尺度问题和奇异性（如尖锐界面、裂纹），这在生物组织（具有多层次结构）的力学分析中很有优势。
拉普拉斯神经算子：在拉普拉斯域（或更广义的复频域）表示解。它采用一种“极点-留数”的公式，特别适合描述具有衰减、振荡等动态特性的系统，例如阻尼振动、生物电信号传播等。

实操心得：选择哪种神经算子，很大程度上取决于问题的物理本质。对于周期性或均匀性问题，FNO是首选；对于多尺度、异质性强的生物组织，WNO可能更佳；而对于动态系统响应分析，LNO值得尝试。在实际项目中，我们常常会先用FNO做基线模型，因为其实现成熟、计算快，再根据效果尝试更专门的架构。

2.2 物理信息神经算子：给黑箱装上“物理指南针”

纯粹的数据驱动神经算子虽然强大，但在数据稀缺的生物医学场景下，容易过拟合或产生物理上不合理的预测。这催生了物理信息神经算子的概念。

其核心思想非常简单却有效：在损失函数中，除了衡量预测与观测数据吻合程度的数据损失L_data，额外增加一个物理损失L_physics。这个物理损失强制要求神经算子预测出的函数，必须近似满足其背后潜在的物理定律（通常是PDE及其边界/初始条件）。

L(θ) = L_data(θ) + λ * L_physics(θ)其中λ是一个权衡超参数。

例如，如果我们知道某个过程受扩散方程支配，那么L_physics就会计算预测解代入扩散方程算子后的残差。通过同时最小化数据误差和物理残差，PINOs能够：

显著减��对大量标注数据的依赖：物理定律提供了强大的正则化。
提升外推泛化能力：即使在训练数据分布之外，预测也倾向于遵守物理规律。
增强模型的可解释性：模型不再是一个纯粹的黑箱，其行为受到已知物理的约束。

在我参与的一个心脏电生理模拟项目中，我们仅有少数几个病人的心脏表面电位映射数据。直接训练DeepONet来预测整个心脏的电位传播效果很差。引入基于反应-扩散方程的物理损失后，模型不仅能用少得多的数据拟合出观测点，还能合理预测未测量区域的电活动，其预测的波前传播速度与生理常识相符，这让我们对模型的可靠性有了更大信心。

3. 从公式到实践：Peridynamic Neural Operator (PNO) 案例深潜

理论需要落地才能体现价值。在生物医学工程中，一个极具代表性的应用是Peridynamic Neural Operator。它完美展示了如何将领域知识（非局部力学）与神经算子架构深度融合，解决从实验数据中发现本构定律这一经典逆问题。

3.1 问题背景：生物组织力学与数字图像相关技术

生物软组织（如心脏瓣膜、血管、皮肤）的力学行为极其复杂，表现为非线性、超弹性、各向异性且常具有非局部效应。其本构关系（应力-应变关系）很难用传统的唯象模型精确描述。另一方面，数字图像相关技术已成为实验力学的主流手段，它能通过对比变形前后的图像，高精度地测量物体表面的全场位移。然而，DIC给出的是“结果”（位移场），我们如何从中反推出“原因”（材料本构关系）？

传统反演方法通常需要假设一个本构模型的形式（如Fung模型、Holzapfel模型），然后优化其参数。这种方法严重依赖于模型假设的正确性，且计算成本高。PNO提供了一条新路径：不预设本构方程的具体形式，而是用一个神经算子来直接学习从位移历史到材料点所受合力的映射。

3.2 PNO架构设计与物理编码

PNO的灵感来源于近场动力学，这是一种非局部连续介质力学理论。其基本思想是：材料点x的力学状态不仅取决于其直接邻居，还取决于其有限半径δ内所有点的相互作用。

PNO的目标是学习一个算子G，该算子将位移场u(x,t)映射到运动方程中的残差（即惯性力与内力之差）。其核心公式体现了物理编码：G[u](x,t) := ∫_{B_δ(0)} ( t[u,x,t]⟨ξ⟩ + t[u,x+ξ,t]⟨-ξ⟩ ) · M[u,x,t]⟨ξ⟩ dξ这个公式保证了动量守恒等基本物理定律的自动满足。其中：

t[u,x,t]⟨ξ⟩是一个标量力状态，描述了从点x指向点x+ξ的“键”上的力。它由一个浅层MLPσ_NN参数化，输入是物理量（如键的伸长率e、非局部膨胀ϑ等）和可学习的材料参数θ_t。
ω(x,ξ)是一个非局部核函数，决定了相互作用的权重随距离和方向的变化。它也由一个神经网络ω_NN参数化。
M是变形后键的方向向量。

最关键的一步是异质性编码：对于像心血管组织这样具有胶原纤维定向排列的材料，其力学性能是各向异性的。PNO通过引入一个可学习的、空间变化的旋转角场α(x)来刻画这种异质性。核函数变为ω(R(-α(x))ξ)，其中R是旋转矩阵。这意味着，模型在学习力学响应的同时，可以一并推断出胶原纤维的微观取向场。

3.3 训练、验证与物理发现

训练PNO需要一组时序的DIC测量数据：{ 位移场 u^s(x, t_k), 体力 b^s(x, t_k), 边界条件 u^s_BC(x, t_k) }，其中s代表不同的加载协议（如双轴测试中不同的应力比例）。

损失函数定义为预测位移与实测位移的相对L2误差。训练过程即优化力状态网络和核函数网络的参数θ_t,θ_ω以及纤维角场参数θ_α。

在一项针对猪三尖瓣前叶的双轴测试实验中，研究团队使用了7种不同的应力比例协议，共采集了1398个时间点的数据。他们用其中120个点训练PNO，用剩余的1278个点测试。

结果令人印象深刻：

预测精度：能够学习异质性纤维取向的PNO模型，其测试误差比假设材料均匀的模型降低了约75%，也显著优于传统的Fung模型拟合。这说明从数据中同时学习力学本构和微观结构是可行且必要的。
物理发现：训练好的PNO不仅仅是一个预测工具。它可以被用来：
- 计算无法直接测量的场：例如，从DIC位移场计算出第一Piola-Kirchhoff应力场（图4d），这是实验无法直接提供的。
- 揭示微观结构：模型预测的胶原纤维取向场α(x)，与通过偏振空间频域成像技术独立测量的结果高度吻合（图4e）。这意味着，PNO仅从宏观力学测试数据中，“发现”了组织的微观结构特征。

避坑指南：在实际操作中，成功应用PNO有几个关键点。第一，数据质量至关重要。DIC的位移场噪声需要预处理，否则会严重影响核函数的学习。我们通常会用简单的滑动平均或基于物理的光滑先验进行滤波。第二，非局部半径δ的选择。太小则退化为局部模型，太大则计算量激增且可能引入不必要的长程耦合。需要通过网格搜索或基于材料特征长度（如纤维束间距）来初步确定。第三，力状态网络σ_NN不宜过深。由于其输入是明确的物理量（应变、伸长率），一个2-3层的MLP通常足以捕捉复杂的非线性，过深反而容易导致训练不稳定和过拟合。

4. 生物医学工程中的全景式应用图谱

神经算子在生物医学工程中的应用已远远超出组织力学，正在渗透到成像、动力学、疾病预测等多个前沿领域。

4.1 组织力学与生物医学成像

在这个领域，神经算子主要扮演着“增强器”和“求解器”的角色。

弹性成像：超声弹性成像通过测量组织在声辐射力下的位移来反演其弹性模量分布，这是一个典型的病态逆问题。基于WNO的弹性成像方法，能够直接从稀疏或含噪的位移场中稳定、快速地重建出组织的弹性图，甚至不需要显式求解复杂的PDE反问题。
血流动力学：从稀疏的边界测量（如血管入口流速波形）预测整个血管网络的压力和流速场。DeepONet和FNO已被用于构建从流速到压力的映射算子，这对于无创评估血管功能（如主动脉扩张性）具有重要意义。
医学图像处理：
- 图像配准：将不同时间点或不同模态的医学图像进行对齐。传统方法迭代求解优化问题，速度慢。FNO-based的配准方法（如FNOReg）学习从图像对到形变场的算子，实现近乎实时的配准。
- 图像生成与增强：直接从原始超声射频信号生成聚焦超声的压力分布图或肺部通气图，绕过了复杂的声波传播正演模拟。

4.2 生物医学动力学与疾病进展预测

这里，神经算子用于学习时空演化动力学，是“预测器”。

心血管力学：预测主动脉壁内损伤场的演化，模拟动脉夹层的发生和发展过程。这对于评估动脉瘤破裂风险至关重要。
肿瘤生长预测：将肿瘤生长模型（如反应-扩散方程）与神经算子结合，构建从初始条件、微环境参数到长期肿瘤形态演化的算子。这类模型能够整合多模态影像数据（CT, MRI），进行个性化预后模拟。
心脏电生理：学习从心肌组织特性、离子通道参数到心脏表面电位时��传播的算子。可以用于快速筛查致心律失常基质，或评估药物对心脏电活动的影响。
药物动力学：在数据稀缺的情况下（如早期临床试验），利用神经算子学习药物在体内浓度随时间变化的规律，可以更准确地预测新给药方案下的药效。

4.3 前沿扩展与融合模型

基础的神经算子架构正在被扩展，以应对更复杂的挑战：

时序图模型：对于肿瘤、血管网络等具有不规则几何形状的结构，图神经网络与神经算子的结合（图神经算子）显示出巨大潜力。它将计算域视为图，节点间的消息传递机制天然适合建模非均匀的相互作用。
多保真度学习：生物医学数据常呈现多保真度特性——高保真数据（如动物实验、高分辨率仿真）精确但稀少；低保真数据（如简化模型、历史数据）丰富但粗糙。构建能够同时利用多保真度数据的神经算子，是提升数据利用效率的关键。例如，可以用大量低保真数据预训练算子，再用少量高保真数据微调。
与生成式AI结合：一个令人兴奋的方向是使用大型语言模型作为“ orchestrator ”，将用自然语言描述的临床问题（如“模拟缺氧条件下肿瘤中的氧扩散”）自动转化为神经算子的数学表述和训练设置。反之，神经算子可以作为物理模拟模块，被AI智能体调用，用于自动化实验设计或药物发现流程。

5. 挑战、对策与未来展望

尽管前景广阔，将神经算子应用于生物医学工程仍面临诸多挑战，这也是我们一线研究者每天在攻克的问题。

5.1 核心挑战与应对策略

数据稀缺与异质性：这是生物医学领域的常态。应对策略包括：
- 物理信息正则化：如前所述的PINO，是当前最主流且有效的方法。
- 迁移学习与元学习：在一个大型、多样的生物力学数据集上预训练一个“基础神经算子”，然后针对特定器官或疾病，用少量数据快速微调。
- 多任务学习：让一个算子同时学习多个相关任务（如同时预测位移场和应力场），共享的表征学习可以提高数据效率。
外推泛化能力：模型在训练数据分布内表现良好，但面对全新的病理状态或极端加载条件时可能失效。
- 不确定性量化：为神经算子的预测提供置信区间。贝叶斯神经算子或深度集成方法可以估计预测中的认知不确定性和偶然不确定性，这对于临床决策至关重要。
- 纳入更广泛的物理约束：除了守恒律，还可以编码诸如材料稳定性（ Drucker 公设）、热力学第二定律等更基本的原理，确保预测在物理上是“合理”的，即使外推。
计算效率与部署：虽然推理快，但训练大型神经算子（尤其是3D+时间问题）仍需要大量计算资源。
- 模型压缩与蒸馏：训练一个大型、精确的教师网络，然后将其知识蒸馏到一个更轻量化的学生网络中，便于在边缘设备（如超声仪）上部署。
- 专用硬件与编译器优化：利用GPU、TPU甚至神经形态计算芯片的并行能力，并针对FNO中的FFT等操作进行底层优化。

5.2 构建生物力学基础模型：一个可行的愿景

我认为，神经算子发展的一个终极形态，是构建生物力学基础模型。这类似于自然语言处理中的GPT或视觉领域的CLIP。我们可以设想这样一个框架：

大规模预训练：在一个极其庞大和多样化的生物力学数据集上进行预训练，这个数据集包含：
- 多器官：心脏、血管、肝脏、骨骼、皮肤等的力学响应数据（来自仿真、实验）。
- 多尺度：从分子（胶原蛋白拉伸）到组织（瓣膜变形）到器官（心脏泵血）的数据。
- 多模态：整合力学数据与影像、组学、电生理数据。
- 多物理场：耦合力学、流体、传热、化学反应。
任务适配与微调：这个预训练好的基础算子，已经内化了广泛的生物力学“常识”。当面对一个新的特定任务时（例如，为某个患者预测主动脉瘤的生长），我们只需要提供该患者有限的个性化数据（如一次CT影像和血压测量），对基础模型进行轻量级的微调，即可获得一个高精度的个性化模型。
可解释性与知识发现：基础模型不仅用于预测，其内部表示可能编码了深层次的生物力学规律。通过分析模型在不同刺激下的响应，我们或许能发现新的生物标志物，或者对疾病机制产生新的假设。

这条路充满挑战，涉及数据标准化、模型架构设计、伦理等诸多问题。但回顾从DeepONet诞生至今短短几年的发展，神经算子已经从一个新颖的数学概念，迅速成长为解决生物医学工程中高维、多物理场、数据驱动建模问题的有力工具。它正在改变我们理解生命系统力学、设计医疗设备、规划手术方案乃至发现新药的方式。作为一名从业者，我的体会是，拥抱这种“学习算子”的范式，意味着我们从“解决单个问题”转向“学习解决一类问题的方法”，这或许是通往更智能、更通用的科学计算引擎的关键一步。最后分享一个实用建议：对于刚入门的研究者或工程师，不要试图从头实现最复杂的变体。从成熟的库（如DeepXDE, NeuralOperators）中调用标准的DeepONet或FNO，在一个自己熟悉的、定义清晰的小规模PDE问题上（比如一维Burgers方程）跑通整个流程，亲手调试参数、观察效果，是理解其精髓最快的方式。

查看全文

http://www.jsqmd.com/news/882344/