当前位置：首页 > news >正文

原子尺度机器学习互操作性：metatensor与metatomic重塑计算化学工作流

news 2026/7/14 10:49:23

1. 原子尺度机器学习：从数据孤岛到生态互联的挑战与机遇

在计算化学和材料科学的前沿，我们正经历一场由机器学习驱动的静默革命。过去，我们依赖密度泛函理论（DFT）或经典分子力场进行模拟，模型的“智慧”固化在代码的物理方程里。如今，图神经网络、等变模型等机器学习方法，通过学习海量量子力学计算数据，能以前所未有的精度和速度预测原子系统的能量、力和性质。然而，这套新范式带来了一个根本性的矛盾：我们用来训练模型的“燃料”（数据）和产出的“引擎”（模型），在格式和接口上五花八门，形成了一个个新的数据与模型孤岛。

想象一下，你花费数周GPU时间训练了一个优秀的势函数模型，但当你想把它塞进LAMMPS做大规模分子动力学模拟，或者导入ASE进行结构优化时，却需要面对繁琐的模型转换、接口重写和格式适配。又或者，你从不同课题组收集了多个数据集，每个数据集的结构、能量、原子描述符存储方式各异，你想进行联合分析或训练一个通用模型，却不得不先进行一场耗时的“数据考古”工作。这正是当前原子尺度机器学习领域效率的瓶颈：创新的速度被互操作性的缺乏所拖累。

metatensor和metatomic的出现，正是为了打破这些壁垒。它们并非又一个机器学习模型或模拟软件，而是一套旨在成为领域内“通用语言”的基础设施。简单来说，metatensor定义了原子尺度数据（如结构、描述符、性质、梯度）应该如何被标准化地存储和交换；而metatomic则定义了训练好的机器学习模型（尤其是基于PyTorch的）应该如何被封装，以便被任何支持该标准的模拟软件直接调用。它们的核心使命是连接：连接不同的代码、不同的工作流、以及不同背景的研究者。

2. 生态核心解析：metatensor与metatomic如何重塑工作流

要理解这套生态的价值，我们需要深入其设计哲学。传统的数据存储（如NumPy数组、文本文件）只关心数值本身，丢失了关键的“语义”。例如，一个形状为(n_atoms, 3)的数组，它代表的是原子坐标、力，还是偶极矩？每个维度对应什么物理量？这些信息通常靠README文件或代码注释来维护，极易出错且难以自动化处理。

2.1 metatensor：为原子数据注入“灵魂”的标签化张量

metatensor的核心创新在于引入了“标签化张量”（Labeled Tensor）的概念。它不仅仅存储多维数组数据，还为每个维度附加了丰富的、机器可读的元数据标签。

一个具体的例子：假设我们有一个包含100个水分子（每个分子3个原子）的体系，我们计算了每个原子的电荷和每个原子对之间的键级。在metatensor中，这些数据不会被扁平化存储成几个大矩阵。相反，电荷数据可能被组织成一个张量，其维度标签明确指示：第一个维度对应“体系中的原子”（共300个原子），其标签就是每个原子的全局索引；数据块就是每个原子的电荷值（一个标量）。而键级数据则更复杂：它是一个稀疏张量，两个维度都对应“原子”，其标签是成对的原子索引，数据块是这对原子间的键级。系统会自动识别这两个张量共享“原子”维度，从而在逻辑上将它们关联起来。

这种设计的优势是颠覆性的：

自描述性：数据文件（.mts格式，基于NumPy的.npz）自身就包含了所有必要的上下文信息，无需外部文档也能被正确理解和使用。
稀疏性原生支持：对于像原子对相互作用这种天然稀疏的数据，metatensor能高效存储，避免内存浪费。
自动梯度传播：张量间的依赖关系通过标签关联得以记录，使得在现代自动微分框架中，梯度可以沿着这些关系正确传播，这对于基于梯度的优化和敏感性分析至关重要。
语言无关性：其底层由C库实现，并提供了Python、Rust等语言绑定。这意味着用Python生成的数据，可以被C++编写的传统高性能模拟代码直接读取，反之亦然。

在实际操作中，使用metatensor的Python接口创建这样一个带标签的张量非常直观：

import metatensor import numpy as np # 假设我们有3个原子的坐标 positions = np.array([[0.0, 0.0, 0.0], [1.0, 0.0, 0.0], [0.0, 1.0, 0.0]]) # 创建原子维度的标签（原子索引） atom_labels = metatensor.Labels(["atom"], np.array([[0], [1], [2]])) # 创建坐标张量。注意“property”维度，它标签是["x", "y", "z"]，表示这是一个三维矢量。 property_labels = metatensor.Labels(["property"], np.array([["x"], ["y"], ["z"]])) positions_block = metatensor.TensorBlock( samples=atom_labels, # 每个“样本”是一个原子 components=[], # 坐标是矢量，但本身不是由更基础的组件构成，所以为空列表 properties=property_labels, # 属性是x, y, z三个分量 values=positions, # 数值就是坐标数组 ) # 将Block包装成TensorMap positions_tensor = metatensor.TensorMap(keys=metatensor.Labels(["dummy"], np.array([[0]])), blocks=[positions_block]) # 现在positions_tensor就是一个完整的、自描述的metatensor对象，可以轻松保存和共享 metatensor.save("water_positions.mts", positions_tensor)

这段代码的关键在于，我们不仅存储了数字，还通过Labels对象明确声明了这些数字的含义。任何读取water_positions.mts文件的程序都能立刻知道这是一个包含3个原子三维坐标的张量。

2.2 metatomic：让ML模型成为即插即用的“黑盒”

如果说metatensor解决了数据的“方言”问题，那么metatomic解决的就是模型的“接口”问题。在原子尺度模拟中，一个机器学习模型的核心功能是：输入原子种类和坐标，输出系统的总能量、每个原子所受的力，有时还包括其他性质如应力、电荷等。

在没有metatomic之前，每个模拟软件（如LAMMPS、ASE、i-PI）都需要为每一种模型架构（如MACE、NequIP、SchNet）编写特定的接口插件。这导致了N×M的集成复杂度。metatomic通过定义一个基于TorchScript的统一容器格式，将模型变成一个标准的“黑盒”。

它的工作原理如下：

模型训练与导出：用户使用PyTorch训练好自己的原子势函数模型后，利用metatomic提供的工具，将模型（包括其架构定义和训练好的权重参数）导出为一个.pt文件（TorchScript格式）。这个导出过程会强制模型遵守metatomic定义的输入输出接口规范。
统一接口：这个导出的.pt文件对外暴露一组固定的函数，例如compute_energy_forces。无论模型内部是复杂的等变网络还是简单的多层感知机，模拟引擎都通过这组固定函数与之交互。
无缝集成：支持metatomic的模拟引擎（如LAMMPS、PLUMED、ASE）只需实现一次与metatomic容器的对接逻辑。之后，任何符合metatomic标准的模型文件都可以被直接加载和使用，无需修改模拟引擎的代码。

从用户视角看，这带来了极大的便利：

# 在LAMMPS输入文件中，调用一个metatomic模型变得如此简单 pair_style metatomic my_potential.pt pair_coeff * *

这里，my_potential.pt可以是任何用metatomic导出的模型，LAMMPS无需关心它内部是何种架构。这极大地降低了使用先进ML势函数的门槛，促进了模型在社区内的共享和应用。

注意：当��metatomic紧密依赖PyTorch和TorchScript，这既是优势也是限制。优势在于能直接利用PyTorch丰富的生态和部署优化；限制在于将非PyTorch框架（如JAX）的模型纳入其中需要额外的转换步骤。开发团队已明确将支持更多后端（如纯Python脚本、Julia模型）列为未来路线图。

3. 实战演练：构建一个端到端的原子尺度ML工作流

理解了核心概念后，我们通过一个具体的例子，展示如何利用metatensor和metatomic生态完成从数据准备、模型训练到模拟应用的全流程。假设我们的目标是训练一个用于小分子有机晶体的通用势函数。

3.1 数据准备与标准化：使用metatensor整合异构数据源

我们可能从多个渠道获取数据：一部分来自量子化学软件（如CP2K、VASP）的输出，另一部分来自公开数据库（如QM9、MD17），格式各异。第一步是利用metatensor将它们统一。

关键步骤与工具：

数据提取与解析：使用ase.io.read读取结构文件，使用各自计算软件的输出解析器提取能量、力、应力等。假设我们已经将数据整理成了ASE的Atoms对象列表和对应的属性字典。
转换为metatensor格式：利用metatensor库的API，将ASE对象转换为标准的TensorMap。这里，rascaline或featomic这样的库会起到关键作用，它们能计算各种原子描述符（如SOAP、ACSF），并将结果直接输出为metatensor格式。

import ase import metatensor from featomic import FeatomicCalculator from metatensor import TensorMap # 假设atoms_list是ASE的Atoms对象列表，energies和forces是对应的列表 all_data = [] for i, atoms in enumerate(atoms_list): # 1. 创建体系的基本信息块（如原子种类、坐标） # 这里简化处理，实际中可能需要用featomic先计算描述符 # 我们创建一个临时示例：存储每个原子的力 atom_labels = metatensor.Labels(["atom"], np.arange(len(atoms)).reshape(-1, 1)) property_labels = metatensor.Labels(["force_component"], np.array([["x"], ["y"], ["z"]])) forces_block = metatensor.TensorBlock( samples=atom_labels, components=[], properties=property_labels, values=forces[i], # forces[i] 是 (n_atoms, 3) 的数组 ) # 键（key）可以用来区分不同“类型”的块，例如不同原子对的环境。 # 对于简单的每原子量，我们通常用一个虚拟键。 force_tensor = metatensor.TensorMap( keys=metatensor.Labels(["dummy"], np.array([[0]])), blocks=[forces_block] ) # 同样地，创建能量张量（一个标量，对应整个体系） energy_block = metatensor.TensorBlock( samples=metatensor.Labels(["system"], np.array([[i]])), components=[], properties=metatensor.Labels(["energy"], np.array([[0]])), values=np.array([[energies[i]]]) ) energy_tensor = metatensor.TensorMap( keys=metatensor.Labels(["dummy"], np.array([[0]])), blocks=[energy_block] ) # 在实际工作流中，我们会用featomic计算描述符，并和能量、力一起保存 all_data.append({ "structure": atoms, "energy": energy_tensor, "forces": force_tensor }) # 3. 保存为统一的.mts文件 # 通常我们会将描述符、能量、力分别保存，或使用更高级的容器格式组织 metatensor.save("training_descriptors.mts", descriptor_tensor) metatensor.save("training_energies.mts", energy_tensor_all) # 将所有系统的能量合并

这个过程确保了无论原始数据来源如何，最终用于训练的数据都具有一致、自描述的格式，极大简化了后续数据加载和预处理代码的复杂性。

3.2 模型训练与导出：利用metatrain和metatomic

有了标准化的数据，我们就可以使用专为原子尺度ML设计的训练框架，如metatrain。metatrain构建在PyTorch之上，深度集成了metatensor数据格式，并提供了训练、验证、超参数优化的流水线。

训练流程要点：

配置训练任务：metatrain通常使用YAML文件来定义训练任务。你需要指定模型架构（如MACE、PET-MAD）、数据路径（指向.mts文件）、损失函数（能量、力的权重）、优化器参数等。
启动训练：通过命令行metatrain train config.yaml即可启动。metatrain会自动处理数据加载、小批量生成、损失计算和反向传播。
模型验证与选择：训练过程中会在验证集上监控性能。metatrain支持模型检查点保存和早停策略，确保获得最优模型。
导出为metatomic容器：训练完成后，使用metatrain或metatomic提供的工具将最终的PyTorch模型导出为.pt文件。

# 假设我们使用metatrain训练了一个PET-MAD模型 metatrain train pet_mad_config.yaml # 训练完成后，在输出目录找到最佳模型 checkpoint_best.pt # 使用metatomic工具将其转换为可部署的容器 python -m metatomic.export --model checkpoint_best.pt --output deployed_model.pt

这个deployed_model.pt文件就是我们的最终成果，它包含了模型的所有信息，并遵守metatomic接口，可以被任何兼容的模拟软件调用。

3.3 模拟部署与应用：在LAMMPS和ASE中使用模型

这是体现互操作性价值的时刻。我们将训练好的模型部署到两个最常用的模拟环境中。

在LAMMPS中运行分子动力学：

确保安装了支持metatomic的LAMMPS版本（可通过conda-forge安装lammps-metatomic包）。
准备LAMMPS输入文件：

# 基本设置 units metal atom_style atomic dimension 3 boundary p p p # 读取结构 read_data my_crystal.data # 使用metatomic势函数 pair_style metatomic deployed_model.pt pair_coeff * * # 设置温度并运行NVT动力学 velocity all create 300 12345 fix 1 all nvt temp 300 300 0.1 thermo 100 run 10000

只需这两行pair_style和pair_coeff命令，LAMMPS就能调用我们训练的复杂ML势函数进行动力学模拟，其易用性与内置的经典势函数无异。

在ASE中进行结构优化和振动分析： ASE通过其Calculator接口与metatomic模型交互，使用起来更加Pythonic。

from ase import Atoms from ase.optimize import BFGS from metatomic.ase import MetatomicCalculator # 创建或读取一个结构 atoms = Atoms(...) # 关键一步：将metatomic模型设置为ASE的计算器 atoms.calc = MetatomicCalculator(model_path="deployed_model.pt") # 现在可以像使用任何其他量子化学计算器一样使用它 # 1. 获取单点能和力 energy = atoms.get_potential_energy() forces = atoms.get_forces() # 2. 进行几何优化 opt = BFGS(atoms) opt.run(fmax=0.01) # 优化直到最大力小于0.01 eV/A # 3. 计算振动频率（需要安装相关插件） from ase.vibrations import Vibrations vib = Vibrations(atoms) vib.run() vib.summary()

这种无缝集成使得研究人员可以轻松地将最先进的ML势函数嵌入到他们熟悉的自动化工作流和脚本中。

3.4 数据可视化与洞察：使用Chemiscope探索高维数据

训练模型和运行模拟产生了大量高维数据（如原子描述符、模型中间表示）。理解这些数据对于调试模型、发现新规律至关重要。Chemiscope是这个生态中强大的可视化前端��

它可以直接读取metatensor格式的数据文件，并利用其内置的降维算法（如UMAP、t-SNE）或用户提供的特征（如用PET-MAD模型计算的特征），将高维数据投影到2D/3D空间，生成交互式散点图。

典型使用场景：

数据集探索：在��练前，加载你的数据集（结构+性质）到Chemiscope，查看结构在特征空间中的分布是否均匀，是否存在明显的聚类，这有助于发现数据偏差或离群点。
模型诊断：将模型在验证集上的预测误差作为颜色映射到Chemiscope可视化中。如果误差大的结构在特征空间中聚集在特定区域，说明模型在该区域的泛化能力不足，可能需要补充训练数据。
性质-结构关联分析：如图17所示，将MD22数据集中的分子用PET-MAD模型特征化并降维后，用内聚能着色。你可以直观地看到哪些结构特征（在2D映射中的位置）与高或低的内聚能相关。

在Jupyter Notebook中使用Chemiscope尤其方便：

import chemiscope import ase.io from featomic import FeatomicCalculator # 读取一组结构 frames = ase.io.read('my_structures.xyz', ':') # 使用featomic计算SOAP描述符，输出是metatensor格式 calc = FeatomicCalculator(soap_cutoff=5.0) descriptors = [calc.calculate(f) for f in frames] # 假设我们还有每个结构的带隙数据（作为性质） properties = {"band_gap": [get_band_gap(f) for f in frames]} # 一键创建交互式可视化 chemiscope.show(frames, properties, descriptors)

执行这段代码会在Notebook中生成一个交互式窗口，你可以缩放、旋转、点击每个点查看对应的原子结构，并根据任何数值性质进行着色。这种直观的探索对于材料发现和模型理解具有不可估量的价值。

4. 深入生态：关键工具与最佳实践

metatensor和metatomic并非孤立存在，它们是一个不断增长的软件生态的核心。理解并善用这些周边工具，能极大提升研究效率。

4.1 核心工具链介绍

rascaline / featomic：原子环境描述符计算库。rascaline提供了多种经典描述符（如SOAP、ACSF、LMBTR）的高效实现，并以metatensor格式输出。featomic是其一个更高级的封装，提供了更便捷的接口。它们是连接原始原子结构（坐标、种类）与机器学习模型的桥梁。
metatrain：如前所述，是专为原子尺度ML模型训练设计的框架。它支持分布式训练、超参数扫描、学习率调度等高级功能，并深度优化了与metatensor数据格式的配合。
torch-spex：实现了“N-body等变多项式”模型（如MACE架构中的核心组件），是构建现代等变神经网络势函数的重要基础库。
Atomistic Cookbook (https://atomistic-cookbook.org/)：这是生态的“食谱”大全。它不是一个软件库，而是一个包含大量实际案例和教程的网站。从“如何用rascaline计算SOAP描述符”到“如何用metatrain训练一个PET-MAD模型并在LAMMPS中运行模拟”，你都能找到 step-by-step 的Jupyter Notebook教程。这是新手入门和寻找解决方案的首选之地。

4.2 性能优化与部署考量

当模型和数据集规模变大时，性能和部署成为关键。

描述符计算的优化：rascaline底层用Rust编写，对多线程并行计算有良好支持。在计算大批量结构的描述符时，确保利用所有CPU核心。
模型推理的加速：metatomic模型本质是TorchScript，可以充分利用PyTorch的优化。对于GPU推理，确保安装支持CUDA的PyTorch版本。在LAMMPS中，通过编译支持GPU的版本，可以实现在分子动力学模拟中调用模型进行GPU加速。
模型压缩与量化：对于部署到资源受限环境或需要极致推理速度的场景，可以考虑使用PyTorch的模型量化工具对metatomic模型进行动态量化或静态量化，在几乎不损失精度的情况下显著减少模型大小和提升推理速度。
使用Spack在HPC集群部署：对于超算用户，metatensor生态提供了Spack安装包。你可以通过Spack轻松地在集群上安装包含GPU支持的、针对特定CPU架构优化的metatensor、metatomic以及相关软件，避免手动编译的繁琐。

4.3 数据管理与FAIR原则

遵循FAIR（可查找、可访问、可互操作、可重用）原则对于科学研究的复现性至关重要。metatensor格式天生支持FAIR：

可互操作/可重用：.mts文件是自描述的，且与语言无关，极大提升了数据的可重用性。
可查找/可访问：建议将数据集与对应的.mts文件一同发布在如Zenodo、Materials Cloud等数据仓库，并附上详细的元数据描述。由于数据格式统一，其他人可以轻松下载并立即在你的工作流中使用。

一个良好的实践是，在发表论文时，不仅提供原始数据，还提供处理好的、metatensor格式的数据集，以及用于训练模型的完整配置文件（metatrain的YAML文件）和最终导出的metatomic模型。这为同行验证和后续研究提供了极大的便利。

5. 常见问题与故障排除实录

在实际使用中，你可能会遇到一些典型问题。以下是我在项目实践中总结的一些经验和解决方案。

问题一：在将自定义PyTorch模型导出为metatomic格式时失败，提示接口不匹配。

原因分析：metatomic对模型的输入输出签名有严格规定。你的模型前向传播（forward）函数必须接受特定格式的输入（通常是包含原子类型、坐标、晶胞的张量字典），并返回一个包含至少“能量”和“力”的字典。
解决方案：
1. 仔细阅读metatomic文档中关于模型接口的定义。
2. 使用metatomic.checkpoint模块中的工具来验证和包装你的模型。通常，你需要用一个符合接口的“包装器”来包裹你的模型内部核心。
3. 一个常见的模式是，你的模型类继承自torch.nn.Module，但其forward方法只计算原子能量。你需要使用metatomic.models.EnergyForcesModel这样的辅助类，它会在你的模型基础上自动通过自动微分计算力。

import torch import metatomic class MyCustomPotential(torch.nn.Module): def __init__(self, ...): super().__init__() # 你的网络层定义 ... def forward(self, atomic_numbers, positions, cell): # 只返回每个原子的能量贡献或总能量 ... # 用metatomic的包装器封装 model = metatomic.models.EnergyForcesModel( model=MyCustomPotential(...), compute_forces=True, # 自动启用力的计算 ... # 其他参数 ) # 然后再导出这个包装后的model

问题二：在LAMMPS中使用metatomic势函数时，模拟速度异常缓慢。

原因分析：可能的原因有多个：(a) 模型本身很大且复杂；(b) LAMMPS未启用GPU支持或未链接优化的数学库；(c) 模拟盒子太小，导致频繁的邻居列表重建和模型调用开销占比过高。
排查步骤：
1. 检查模型规模：用Python加载模型，查看参数数量。过于庞大的模型可能不适合长时间MD。
2. 验证GPU使用：在LAMMPS输入文件开头或日志中，确认是否输出了GPU相关的信息。确保编译LAMMPS时启用了-D PKG_GPU=yes并链接了正确的CUDA。
3. 调整LAMMPS设置：适当增大neigh_modify中的delay参数，减少邻居列表更新的频率。对于金属单位，delay 5或delay 10通常是安全的。
4. 分析性能瓶颈：使用LAMMPS的timer命令或pair metatomic自身的计时输出，查看时间主要消耗在模型推理还是邻居列表构建上。

问题三：使用Chemiscope可视化大型数据集（>10k结构）时，浏览器卡顿或无响应。

原因分析：Chemiscope需要将所有的结构信息和属性数据加载到浏览器内存中，并进行实时渲染。当数据量极大时，会对客户端造成巨大压力。
解决方案：
1. 数据采样：在导入Chemiscope前，先对数据进行随机采样或基于某些��键性质进行分层采样，减少可视化的数据点数量。
2. 特征预降维：不要在Chemiscope内部使用chemiscope.explore的自动降维功能处理超大特征矩阵。可以先用Scikit-learn等库在Python端进行PCA或UMAP降维，将结果作为2D或3D坐标属性直接提供给Chemiscope。
3. 使用Standalone版本：对于极大的数据集，考虑使用Chemiscope的standalone查看器，它可能比Jupyter widget有更好的内存管理。或者，将数据上传到支持Chemiscope的在线平台（如Materials Cloud）进行查看。

问题四：从不同来源合并的metatensor数据，在训练时出现维度或标签不匹配错误。

原因分析：metatensor要求合并的数据在“键”和“属性”维度上必须兼容。如果两个数据集使用了不同的描述符参数（如不同的SOAP截断半径），它们的属性标签会不同，无法直接合并。
解决方案：
1. 标准化数据生成流程：确保所有数据使用完全相同的描述符计算器（rascaline/featomic）和参数生成。这是最根本的解决方法。
2. 使用元数据对齐工具：检查两个TensorMap的keys和properties的Labels。如果只是顺序不同，可以使用metatensor.equal_metadata检查并metatensor.sort进行排序对齐。如果本质不同，则需要回到上一步重新计算。
3. 设计可扩展的键空间：在定义描述符时，可以考虑使用更通用的键（例如，只区分中心原子种类，而不是所有原子对种类），虽然这会增加单个数据块的大小，但能简化数据合并。

问题五：训练好的metatomic模型在ASE中运行正常，但在LAMMPS中计算出的力明显不对，导致模拟崩溃。

原因分析：这通常是单位制不匹配的经典问题。ASE内部使用eV和Å，而LAMMPS的默认单位制（如metal）虽然能量是eV，但距离是Å。问题可能出在模型内部或导出环节。有些模型在训练时假设坐标输入是Å，但内部计算可能隐含了其他单位转换。
排查与解决：
1. 一致性检查：在ASE和LAMMPS中对同一个极小结构（如一个二聚体）计算单点能和力。在ASE中，用你的模型计算；在LAMMPS中，创建一个只包含这两个原子的盒子，用compute pair等命令输出力和能量。对比数值。
2. 审查模型训练配置：检查训练时数据预处理步骤。确保训练数据的坐标单位是Å，能量单位是eV。在metatrain的配置文件中，确认损失函数中力和能量的单位权重是合理的（例如，力权重远大于能量权重以平衡量级）。
3. 验证模型导出：在导出模型时，有些框架可能会对输入坐标进行标准化（如减均值除方差）。确保你清楚模型期望的输入是什么。一个可靠的调试方法是，在Python中手动创建一组原子坐标（单位Å），用加载的模型计算能量和力，然后与LAMMPS结果对比。如果差异巨大，很可能是模型内部或接口存在单位转换错误，需要检查模型源码和导出脚本。

原子尺度机器学习的互操作性之旅并非没有坎坷，但metatensor和metatomic提供的这套标准化工具链，无疑将大部分崎岖小路铺成了柏油大道。从我的经验来看，初期投入时间学习这套生态的数据处理和模型接口规范，会在后续的每一个合作项目、每一次模型迭代、每一次跨软件验证中带来数十倍的效率回报。它让研究者能更专注于科学问题本身，而非繁琐的“数据工程”和“软件适配”。随着生态的持续扩张（如对JAX、Julia后端的支持），这条路将会越走越宽，最终使得共享一个可复现、可立即使用的原子尺度机器学习模型，变得像今天分享一个Python脚本一样简单自然。

查看全文

http://www.jsqmd.com/news/884657/