当前位置：首页 > news >正文

机器学习发现物理守恒量：从数据中挖掘对称性与不变性

news 2026/7/18 21:17:39

1. 项目概述：当机器学习遇见物理学的“不变性”

在物理学的世界里，对称性与守恒量是理解宇宙运行规律的基石。从牛顿时代起，我们就知道一个系统如果具有时间平移对称性，那么它的能量就是守恒的；如果具有空间平移对称性，那么动量就保持不变。这些由诺特定理所揭示的深刻联系，构成了经典物理学的核心框架。然而，当我们面对复杂系统——无论是高温超导材料中电子的诡异行为，还是量子多体系统中难以捉摸的纠缠结构，抑或是湍流中瞬息万变的涡旋——传统的解析方法常常显得力不从心。我们很难写出一个简洁的方程来描述所有细节，更不用说从中直接“看出”隐藏的对称性或守恒律了。

这正是机器学习，特别是深度学习方法，开始大放异彩的舞台。我最初接触这个交叉领域时，也带着疑问：一个从海量数据中学习模式的“黑箱”工具，如何能帮助我们理解物理学中最根本、最抽象的不变性原理？经过一段时间的实践和文献梳理，我发现，机器学习并非要取代物理直觉，而是成为物理学家手中的一把新“放大镜”和“计算尺”。它能够从高维、复杂甚至带有噪声的实验或模拟数据中，自动挖掘出那些表征系统本质的“不变模式”，并以一种可解释的方式呈现出来，有时甚至能发现人类未曾预设的规律。

这个项目的核心，就是探讨如何利用机器学习，特别是神经网络模型，来发现物理系统中的对称性与守恒量。这不仅仅是应用一个现成的算法，更涉及如何将物理先验知识（如拉格朗日量形式、对称性约束）巧妙地编码进模型架构，如何设计损失函数来“引导”网络学习守恒量，以及如何从训练好的模型中“反推”出人类可读的物理定律。无论是使用受限玻尔兹曼机（RBM）从自旋构型中提取类似重正化群流的特征，还是训练一个“哈密顿神经网络”来保证能量守恒，亦或是利用自编码器的潜在空间来可视化序参量，其目标都是一致的：让机器帮助我们“看见”那些隐藏在数据背后的、支配万物运行的基本法则。

2. 核心思路：从数据中“蒸馏”物理定律的三种范式

将机器学习应用于物理定律发现，并非只有一种固定的模式。根据问题的性质、数据的类型以及我们期望的输出形式，大致可以归纳出三种主流的范式。理解这些范式，是设计有效方案的第一步。

2.1 范式一：基于符号回归的“白盒”发现

这是最直接、也最符合物理学家思维习惯的一种方式。其目标是从系统的轨迹数据（如位置、速度随时间的变化）中，直接回归出一个简洁的数学表达式，例如系统的拉格朗日量（L）或哈密顿量（H）。2012年之前，以施密特和利普森的工作为代表，这类方法主要依赖于遗传编程等符号回归技术。

核心思想：算法在由基本数学运算符（+、-、×、÷、sin、cos等）和变量构成的巨大搜索空间中，寻找一个能最精确拟合观测数据（如运动轨迹）的表达式。这个表达式本身就被视为发现的物理定律。

优势与挑战：其最大优势是结果的可解释性极强——直接给出了一个人类可读的公式。然而，搜索空间随着表达式复杂度指数增长，计算成本高昂，且容易陷入局部最优，找到的可能是过拟合的复杂表达式，而非简洁的物理定律（如欧姆剃刀原则所追求的）。近年来，结合了神经网络特征提取和符号回归的混合方法（如AI Feynman）在一定程度上缓解了这个问题，先由神经网络学习一个平滑的函数近似，再对其进行符号化简化。

2.2 范式二：基于神经网络的“灰盒”学习与解释

这是目前最活跃的研究方向。我们不要求网络直接输出一个符号公式，而是训练一个神经网络来近似某个物理量或变换，然后通过分析网络内部的权重、激活值或结构，来解读它学到了什么。

核心思想：将神经网络本身视为一个复杂的函数逼近器。通过精心设计网络架构和损失函数，我们可以约束或引导网络学习具有特定物理意义的表示。例如：

守恒量学习：训练一个网络I(x)，使其在系统的一条轨迹x(t)上输出恒定值，即I(x(t1)) ≈ I(x(t2))。这个网络I学习到的函数就是一个近似的守恒量。
对称性学习：训练一个网络来识别经过某种变换（如旋转、平移）前后数据是否“等价”，或者训练一个网络来生成这种对称变换本身。
序参量学习：在相变研究中，训练分类网络区分不同相，然后通过解释网络决策所依赖的特征（如通过相关器卷积网络），找到对应的序参量。

优势与挑战：神经网络的表达能力极强，能处理高维、非线性的复杂关系。关键在于“解释”这一步。如何从一个训练好的、包含数百万参数的“黑箱”中，提取出简洁的物理洞察？这催生了诸如相关性探测、权重可视化、网络手术（逐步剪枝直至性能下降）等一系列可解释性技术。这就像一个“灰盒”，我们知道它的内部结构（权重连接），但需要工具来理解这些结构对应的物理含义。

2.3 范式三：物理信息嵌入的“架构约束”学习

这是将物理知识最深度融合进机器学习模型的方法。我们不再寄希望于事后解释，而是在模型设计之初，就将已知的物理定律（如牛顿第二定律、能量守恒）作为硬约束或软约束编码进去。

核心思想：设计具有特定归纳偏置的神经网络架构，使其输出必然满足某些物理规律。最著名的例子是哈密顿神经网络和拉格朗日神经网络。

哈密顿神经网络：网络不直接预测系统的加速度或下一时刻状态，而是学习一个标量函数H(q, p)（哈密顿量）。系统的动力学则由哈密顿方程dq/dt = ∂H/∂p, dp/dt = -∂H/∂q自动导出。这样，只要H不显含时间，能量自然守恒。
拉格朗日神经网络：类似地，网络学习拉格朗日量L(q, dq/dt)，然后通过欧拉-拉格朗日方程推导出运动方程。
对称性等变网络：设计卷积层、群卷积层等，使其输出在输入经历特定对称变换（如旋转）时，也以可预测的方式变换。这强制网络学习对称性等变的特征。

优势与挑战：这种方法得到的模型通常具有更好的外推能力、更高的数据效率，并且由于内置了物理规律，其结果天生可信。挑战在于，如何为未知系统设计合适的约束架构？有时过强的约束可能会限制模型发现新物理的能力。它更适合于“已知规律，未知参数”或“已知部分规律，补充剩余部分”的场景。

在实际项目中，这三种范式往往混合使用。例如，可能先用一个物理约束网络（范式三）学习系统的近似动力学，再对其学到的哈密顿量进行符号回归（范式一）以获得解析式，或者分析其内部表示（范式二）以发现新的不变量。

3. 关键技术实现：从数据准备到模型解释的全流程

理论思路需要落地为具体的代码和实验。下面我将以一个相对经典的案例——从经典力学系统轨迹中发现守恒量——为例，拆解一个完整的实现流程。这里我们采用上述的“范式二”，即训练一个神经网络来学习守恒量，并尝试解释它。

3.1 数据生成与预处理：构建物理上有意��的训练集

机器学习需要数据。对于物理系统，数据通常来自数值模拟或实验观测。以二维平面上的开普勒问题（行星绕恒星运动）为例，这是一个能量和角动量都守恒的系统。

步骤1：数值模拟生成轨迹我们使用四阶龙格-库塔法数值积分开普勒问题的运动方程。生成多条具有不同初始条件（不同能量、角动量）的轨迹。每条轨迹是一系列时间点上的状态向量[x, y, vx, vy]。

import numpy as np from scipy.integrate import solve_ivp def kepler_equations(t, state, GM=1.0): x, y, vx, vy = state r = np.sqrt(x**2 + y**2) ax = -GM * x / r**3 ay = -GM * y / r**3 return [vx, vy, ax, ay] # 生成多条轨迹 trajectories = [] conserved_values = [] # 存储真实的能量和角动量，用于验证 for _ in range(100): # 随机初始条件（保证轨道有界） a = np.random.uniform(1.0, 3.0) # 半长轴 ecc = np.random.uniform(0.0, 0.7) # 偏心率 # 根据轨道参数计算初始位置速度（略） # ... initial_state = [x0, y0, vx0, vy0] t_span = (0, 10*np.pi) # 积分多个周期 t_eval = np.linspace(*t_span, 500) sol = solve_ivp(kepler_equations, t_span, initial_state, t_eval=t_eval, rtol=1e-9) trajectories.append(sol.y.T) # 形状 (500, 4) # 计算真实守恒量 E = 0.5*(vx0**2+vy0**2) - GM/np.sqrt(x0**2+y0**2) L = x0*vy0 - y0*vx0 conserved_values.append([E, L])

步骤2：构建“正负样本对”我们的目标是训练一个网络I(state)，使其对同一条轨迹上的所有状态输出相同的值（守恒量），而对不同轨迹的状态输出不同的值。这需要构造对比学习所需的样本对。

正样本对：从同一条轨迹中随机选取两个不同时刻的状态(s_i, s_j)，它们对应的标签（网络应输出的值）应该相同。
负样本对：从两条不同的轨迹中分别选取一个状态(s_i, s_k)，它们对应的标签应该不同。

注意：直接让网络输出一个具体的“标签值”是困难的，因为我们不知道守恒量的具体数值尺度。更常用的技巧是使用“孪生网络”或“对比损失”，让网络学习一个嵌入空间，在这个空间里，正样本对的距离很近，负样本对的距离很远。网络最终学到的，是守恒量的一种“等价类”表示。

3.2 模型架构设计：孪生网络与对比损失

我们采用一种改进的孪生网络架构，其核心思想是让网络学会一个“不变函数”。

import torch import torch.nn as nn import torch.nn.functional as F class InvariantNetwork(nn.Module): """ 学习守恒量的核心网络 """ def __init__(self, input_dim=4, hidden_dims=[64, 32], latent_dim=1): super().__init__() layers = [] prev_dim = input_dim for h_dim in hidden_dims: layers.append(nn.Linear(prev_dim, h_dim)) layers.append(nn.ReLU()) prev_dim = h_dim layers.append(nn.Linear(prev_dim, latent_dim)) # 输出一个标量 self.net = nn.Sequential(*layers) def forward(self, x): return self.net(x) class SiameseConservationNet(nn.Module): """ 孪生网络框架 """ def __init__(self, base_network): super().__init__() self.base_net = base_network # 共享权重的基网络 def forward(self, x1, x2): I1 = self.base_net(x1) I2 = self.base_net(x2) return I1, I2

损失函数设计：这是引导网络学习守恒量的关键。我们不能直接用均方误差，因为不知道目标值。这里使用一种基于轨迹扰动的对比损失思想（受Conservation Laws from Trajectories论文启发）：

正样本损失：对于来自同一条轨迹的两个状态s_i,s_j，我们希望I(s_i)和I(s_j)尽可能接近。使用均方误差：L_pos = (I(s_i) - I(s_j))^2。
负样本损失（防平凡解）：如果只有L_pos，网络可能学会一个将所有输入映射到同一个常数的平凡函数。为了防止这个，我们需要引入“负样本”。一种巧妙的方法是对轨迹进行物理上不合理的扰动，生成“假”的状态。例如，随机打乱一条轨迹上状态的速度方向，或者给位置加上随机噪声。对于原始状态s_i和其扰动后的状态s_i'，我们希望I(s_i)和I(s_i')的输出不同。损失可以设计为：L_neg = max(0, margin - |I(s_i) - I(s_i')|)，其中margin是一个超参数，鼓励两者差异大于某个阈值。
总损失：L_total = L_pos + λ * L_neg，λ是权衡系数。

def conservation_loss(I1, I2, I1_perturbed, margin=1.0, lambda_neg=0.1): """ I1, I2: 同轨迹不同时刻状态的网络输出 I1_perturbed: I1对应状态的物理扰动版本的网络输出 """ pos_loss = F.mse_loss(I1, I2) # 正样本对输出应一致 neg_loss = F.relu(margin - (I1 - I1_perturbed).abs()).mean() # 鼓励与扰动样本输出不同 total_loss = pos_loss + lambda_neg * neg_loss return total_loss, pos_loss, neg_loss

实操心得：margin和lambda_neg的选择至关重要。margin太小，网络可能无法有效区分真实状态与扰动状态；太大则可能导致训练不稳定。通常需要根据输出值的量级进行多次调试。一个经验是，可以先观察正样本损失L_pos下降后网络输出的典型波动范围，将margin设置为该范围的2-3倍。

3.3 训练与验证：不仅仅是损失下降

训练过程相对标准，但验证需要物理直觉。

# 训练循环伪代码 model = SiameseConservationNet(InvariantNetwork()) optimizer = torch.optim.Adam(model.parameters(), lr=1e-3) for epoch in range(num_epochs): for batch in dataloader: states_a, states_b, states_perturbed = batch # 同轨迹对，扰动状态 I_a, I_b = model(states_a, states_b) I_a, _ = model(states_a, states_perturbed) # 获取扰动状态的输出 loss, pos_loss, neg_loss = conservation_loss(I_a, I_b, I_a_perturbed) optimizer.zero_grad() loss.backward() optimizer.step()

验证策略：

轨迹内一致性：在一条训练未见的轨迹上，计算网络对所有状态I(state)的输出。理想情况下，这应该是一条近乎水平的直线（忽略数值误差）。计算其标准差，标准差越小，说明学到的量在轨迹上越守恒。
跨轨迹区分性：计算不同轨迹（对应不同能量/角动量）的I(state)的平均值。这些平均值应该彼此不同，并且（理想情况下）与真实的守恒量（如能量E）单调相关。我们可以画散点图，看<I>vsE是否呈现清晰的函数关系。
物理可解释性测试：这是最关键的。尝试用学到的I(state)来预测物理行为。例如，在开普勒问题中，角动量L守恒意味着掠面速度恒定。我们可以用网络输出的I值对轨迹进行排序，看看是否与根据真实角动量计算出的掠面速度顺序一致。

3.4 模型解释：从网络输出到物理公式

训练出一个在轨迹上输出稳定值的网络I(x, y, vx, vy)只是第一步。我们更希望得到一个人类可理解的解析表达式。

方法1：符号回归拟合将训练好的网络I视为一个黑箱函数，在一个大的状态数据集上采样输入-输出��(state, I(state))。然后，使用符号回归工具（如gplearn、PySR或AI Feynman）对这个数据集进行拟合，寻找一个简洁的数学表达式来近似I。

# 假设我们有一个训练好的模型 `trained_model` 和采样数据 `X_sample`, `y_sample = trained_model(X_sample)` import pysr # 使用PySR进行符号回归 model = pysr.PySRRegressor( niterations=100, binary_operators=["+", "-", "*", "/"], unary_operators=["square", "inv"], # 平方，倒数 complexity_of_constants=2, maxsize=20, # 表达式最大复杂度 ) model.fit(X_sample, y_sample) print(model.equations) # 查看找到的最佳表达式

这个过程可能发现I ≈ 0.5*(vx**2 + vy**2) - 1/sqrt(x**2+y**2)，这正是能量的表达式；或者发现I ≈ x*vy - y*vx，这是角动量的z分量。

方法2：网络权重分析与可视化对于简单的网络，可以直接分析其权重。例如，如果输入层到第一个隐藏层的某个权重只与x和vy以及y和vx强相关，而与其他变量权重接近0，这可能暗示网络学到了类似x*vy - y*vx的组合。更系统的方法是使用输入梯度显著性图（Saliency Map）或积分梯度，计算输出I对每个输入变量的敏感度。如果∂I/∂x与vy强相关，∂I/∂y与-vx强相关，这同样是角动量形式的强烈提示。

注意事项：符号回归的结果需要仔细进行物理量纲检查。网络输出I是一个无量纲的数（取决于权重初始化、激活函数等），但真实的守恒量（如能量、角动量）有明确的量纲。符号回归找到的表达式可能差一个常数因子或加上一个常数偏置。需要结合物理背景判断其形式是否正确。例如，能量表达式在势能零点选择不同的情况下可以差一个常数，但其变量依赖关系（动能+势能）应是确定的。

4. 进阶应用与挑战：从经典到量子，从监督到无监督

上述流程展示了在经典力学系统中发现守恒量的基本方法。但该领域的前沿已远远超出这个范围，面临着更复杂的挑战。

4.1 处理量子多体系统

在量子系统中，状态由波函数或密度矩阵描述，守恒量是与系统哈密顿量对易的算符。机器学习的方法需要相应调整。

数据：数据可能来自量子蒙特卡洛模拟产生的样本构型（如自旋组态），或者是对易子[H, O]的测量结果。
方法：一种方法是利用受限玻尔兹曼机作为变分波函数。RBM的参数化波函数ψ(s; W)可以表示复杂的量子态。通过变分蒙特卡洛方法优化参数W以逼近基态。在这个过程中，分析RBM权重随外部参数（如磁场强度）的变化，有时可以揭示出与相变或守恒律相关的特征模式。另一种方法是直接处理量子可观测量数据，使用类似于经典案例中的对比学习框架，但输入是算符的期望值或测量投影。
挑战：量子系统的希尔伯特空间维度随粒子数指数增长（维度灾难）。机器学习模型必须能有效处理这种高维性，同时保持对量子纠缠等特性的表达能力。

4.2 无监督发现与相变识别

在许多情况下，我们连系统有哪些相都不知道，更不用说守恒量了。无监督学习，特别是自编码器，在这里发挥了巨大作用。

变分自编码器发现序参量：在相变研究中，我们将不同温度、压强下模拟得到的系统微观构型（如图像化的自旋排列）输入VAE。编码器将高维构型压缩到低维潜在空间。一个关键的发现是，在发生连续相变的系统（如伊辛模型）中，潜在空间中的一个维度（潜在变量z）的值会随着控制参数（如温度）变化而平滑变化，并且在临界点附近方差增大。这个潜在变量z的行为非常类似于序参量（如磁化强度）。通过分析z与系统宏观量的关系，可以确认它就是我们寻找的序参量。
操作流程：
1. 在跨越相变点的不同参数下，采集大量系统快照{X_i}。
2. 用VAE进行无监督训练，目标是重构输入X_i。
3. 训练完成后，将所有X_i通过编码器得到其潜在表示z_i。
4. 绘制z_i的统计量（如均值、方差）随控制参数的变化曲线。在相变点，通常会观察到均值发生跃变（一级相变）或方差出现峰（连续相变）。
5. 通过相关性分析，将潜在变量z与物理学家提出的候选序参量（如磁化强度、结构因子）进行对比验证。

实操心得：VAE的瓶颈层维度（潜在空间大小）需要仔细选择。太小会导致信息丢失，重构效果差；太大则可能引入噪声，使得序参量信号被淹没在无关维度中。通常从一个较小的维度（如2-10）开始尝试，并观察潜在变量是否呈现出清晰的、与物理参数相关的结构。此外，在潜在空间进行聚类（如k-means）有时可以直接揭示出不同的相。

4.3 发现未知对称性

这是更具探索性的任务：系统可能存在我们尚未知晓的连续或离散对称性。

连续对称性：可以训练一个神经网络T_θ(x)来预测对输入x进行“微小变换”后的结果。通过优化网络参数θ，使得某个目标函数F(T_θ(x))（例如系统的能量）在变换下保持不变。如果网络能学习到一个非平凡的、平滑的变换T_θ，并且该变换能保持目标函数不变，那么这个T_θ就可能生成一个连续对称变换的生成元。再结合诺特定理，就有可能推导出新的守恒量。
离散对称性：可以将其视为一个分类或匹配问题。训练一个网络来判断两个构型x和x'是否通过某个离散对称群（如空间反演、时间反演、旋转90度）中的操作相关联。网络学到的匹配规则，实质上就是在识别该对称群。
挑战：这类方法高度依赖于损失函数的设计和网络架构的约束。很容易学到恒等变换这样的平凡解。需要引入额外的正则化或对比损失来鼓励网络发现非平凡的对称性。

5. 常见问题、陷阱与调优实录

在实际操作中，会遇到各种各样的问题。以下是我在复现相关研究时踩过的一些“坑”及解决方案。

5.1 网络学不到守恒量，输出为常数

问题表现：无论输入什么状态，网络I(state)的输出都几乎是一个常数。正样本损失L_pos可以降得很低，但学到的量没有物理意义。
根本原因：负样本损失L_neg太弱或设计不合理，无法阻止网络坍缩到平凡解。
排查与解决：
1. 检查扰动强度：生成负样本的“物理扰动”必须足够“不合理”，以至于改变守恒量的值。对于力学系统，随机打乱位置和速度的关联是有效的。可以尝试多种扰动策略，如添加不满足运动方程的随机加速度、将速度向量旋转一个随机角度等。
2. 调整损失权重λ_neg和间隔margin：逐步增大λ_neg，观察L_neg是否开始上升。同时，监控正负样本对输出之间的距离分布。理想情况下，正样本对距离应集中在0附近，负样本对距离应大于margin。
3. 尝试不同的对比损失：除了上述的间隔损失（Triplet Loss），可以尝试InfoNCE损失（常用于对比学习），或者直接使用**“轨迹变形”** 方法。后者的思路是，轻微变形一条轨迹，生成一条物理上不可能的轨迹，然后要求网络在真实轨迹上输出恒定值，在变形轨迹上输出变化的值。这通常比简单的状态扰动更有效。

5.2 学到的量是真实守恒量的复杂组合或函数

问题表现：网络输出在单条轨迹上守恒性很好，但符号回归得到的表达式非常复杂，或者与多个真实守恒��都相关。
根本原因：如果系统存在多个独立守恒量（如能量和角动量），网络可能学到它们的任意函数f(E, L)，只要这个函数在单条轨迹（E和L固定）上是常数即可。这满足了训练目标，但不是我们想要的“基本”守恒量。
排查与解决：
1. 网络放缩法（Neural Deflation）：这是目前最有效的解决方案。首先训练第一个网络I1学习第一个守恒量。然后，在训练第二个网络I2时，在其损失函数中加入一项正则化项，强制I2的输出与I1的输出不相关（例如，最小化它们的协方差）。如此迭代，可以逐步发现一组相互独立的守恒量。
2. 分析跨轨迹变化：绘制不同轨迹对应的网络输出平均值<I>，与真实能量E和角动量L做三维散点图或两两二维图。如果<I>在E-L平面上呈现为一个光滑曲面，而不是沿着E或L轴方向的简单曲线，则说明网络学到了复合函数。此时需要采用上述方法进行解耦。

5.3 对噪声和数据集偏差过于敏感

问题表现：在模拟的干净数据上表现良好，但加入少量噪声或使用不同初始条件分布的数据集时，性能急剧下降。
根本原因：网络可能过拟合了数据中的特定模式或噪声，没有学到鲁棒的物理不变量。
排查与解决：
1. 数据增强：在训练数据中主动加入各种噪声（高斯噪声、随机丢失等）和扰动。这能迫使网络学习更本质的、对微小干扰不变的特征。
2. 模型正则化：在损失函数中加入L1或L2权重正则化，或者使用Dropout层，防止网络过于复杂。
3. 架构引入物理归纳偏置：如果已知守恒量可能是某些变量的低阶多项式（如能量是速度的二次型），可以在网络靠近输入的层使用多项式特征扩展，或使用更简单的模型（如多项式网络）。这能大大降低过拟合风险，提升泛化能力。
4. 集成学习：训练多个网络，取它们输出的平均或进行投票，可以提高稳定性。

5.4 可解释性分析失败

问题表现：网络性能很好，但符号回归得不到简洁公式，或者梯度分析结果混乱。
根本原因：网络学到的函数可能过于复杂，或者潜在表示与人类可理解的物理量之间存在非线性的、难以简化的映射。
排查与解决：
1. 简化网络：首先尝试用尽可能小的网络（如1-2个隐藏层，每层几个神经元）去解决问题。小网络的函数表达能力有限，更可能学到简单的关系，也更容易解释。
2. 分阶段训练：先训练一个大网络达到好的性能，然后用它作为“教师”，去蒸馏训练一个更小、更简单的“学生”网络。学生网络通常更容易解释。
3. 使用专为可解释性设计的架构：如相关器卷积神经网络。其卷积核被设计为直接计算物理系统中可能存在的局部关联函数（如最近邻自旋乘积）。网络的决策过程可以直接归结为这些关联函数的线性组合，物理意义清晰。
4. 关注变化趋势而非精确值：有时网络输出与真实守恒量之间存在一个复杂的单调映射。此时，可以更关注其相对顺序或导数行为。例如，在网络输出与温度的关系图中，关注其突变点是否对应相变临界温度，而不是其绝对数值。

机器学习为物理系统中对称性与守恒量的发现提供了强大的数据驱动工具。它并非万能，其成功严重依赖于如何将物理洞察转化为模型架构、损失函数和训练策略。从我的实践经验来看，最有效的方法往往是“物理引导的机器学习”：我们先利用物理知识提出假设（例如，守恒量可能是状态变量的多项式），然后设计一个具有相应归纳偏置的模型（例如，多项式网络或相关器网络）去验证或发现它。纯粹的“黑箱”方法虽然灵活，但解释和信任成本很高。这个领域的魅力恰恰在于这种“人机协作”——人类提供直觉和框架，机器负责从数据中挖掘细节和验证猜想，最终共同揭示出自然界更深层的简洁与优美。未来，随着可解释性AI和神经符号计算的发展，我们有望看到更多能直接输出简洁数学公式、并能与物理学家自然交互的“AI科学家”助手，这将从根本上加速基础科学的探索进程。

查看全文

http://www.jsqmd.com/news/882192/