当前位置：首页 > news >正文

机器学习揭示h-BN莫尔超晶格中滑动铁电的拓扑极化图案与调控

news 2026/7/17 16:17:02

1. 项目概述：当机器学习遇见莫尔物理

最近几年，但凡关注凝聚态物理前沿的人，都绕不开“莫尔超晶格”这个词。简单来说，就是把两层原子晶体（比如石墨烯、过渡金属硫化物）稍微扭一个角度，或者让它们的晶格常数有点不匹配，两层原子网格叠加起来就会形成一种像水波纹一样、周期远大于原胞的巨大超晶格图案。这个“莫尔图案”就像一个天然的量子调控平台，能压平电子能带，催生出关联绝缘体、超导、奇异磁序等一系列令人兴奋的新物态。

在这个大背景下，滑动铁电性的发现又打开了一扇新的大门。想象一下，你拿着两块六方氮化硼（h-BN）的薄片，它们本身都不是铁电体。但当你让其中一层相对于另一层滑动哪怕一个原子距离的几分之一，整个双层体系的对称性就被打破了，居然能产生出可观的电极化。这就像两块光滑的玻璃叠在一起没有磁性，但错开一点摩擦就能产生静电一样神奇。这种由层间滑移直接“摩擦”出来的铁电性，为在原子尺度上设计非易失性存储器提供了全新的思路。

然而，研究莫尔超晶格中的物理，尤其是像极化这种对局部原子结构极其敏感的物理量，面临一个巨大的技术瓶颈：尺度。一个典型的小角度扭转莫尔超晶格，其原胞可能包含上万个原子。用基于密度泛函理论（DFT）的第一性原理计算直接处理这么大的体系，计算量是天文数字，几乎不可能。过去的研究大多依赖于有效模型或直接映射的方法——即先计算小原胞滑动时的极化，然后假设莫尔超晶格中每个局部区域都近似于某种滑动构型，再把对应的极化“贴”上去。这种方法虽然高效，但丢失了局域原子环境的细节，特别是当扭转角度很小、莫尔周期很长时，局部对称性的破缺可能带来意想不到的物理效应。

这正是我们这项工作的切入点。我们面对的核心问题是：在真实的、大尺度的h-BN莫尔超晶格中，由滑动铁电性产生的极化究竟是如何在空间分布的？会形成怎样的拓扑图案？我们又能否通过外场（如电场）或应变来主动调控这些图案？为了解决计算尺度的问题，我们引入了机器学习（ML），具体来说是深度Wannier（Deep Wannier, DW）模型。这个模型的妙处在于，它通过学习有限数量的小体系DFT计算结果，可以高精度地预测超大体系中的Wannier函数中心（Wannier Centers），从而绕过直接进行海量原子DFT计算的困境，高效且准确地获取整个莫尔超晶格中每个原子位置的局域极化信息。

我们的目标很明确：利用机器学习这把“计算显微镜”，首次在原子尺度上“看清”h-BN莫尔超晶格中极化分布的拓扑纹理，并系统研究电场和应变对它的调控作用。这不仅是对滑动铁电性物理图像的深化，也为未来基于莫尔超晶格设计拓扑电子器件和新型存储器提供了关键的理论依据和设计思路。

2. 核心原理与方案设计：从滑动铁电到深度Wannier

要理解整个工作，得先拆解几个关键概念：滑动铁电性如何产生、极化如何计算、以及机器学习模型如何搭建。这部分我会结合自己的理解，尽量用直观的方式说清楚。

2.1 滑动铁电性的起源与极化空间

六方氮化硼单层本身具有中心反演对称性（点群D3h），不是铁电体。但是，当两层h-BN以特定方式堆叠时，情况就变了。我们考虑一种最简单的操作：保持两层晶体相对取向不变（即旋转操作O为单位操作E），只让其中一层在面内平移一个矢量τ。这个操作记为 {E|τ}。关键在于，这种纯平移操作会破坏体系原有的某些镜面对称性，从而允许净电极化（P）的出现。

我们可以把所有可能的平移矢量τ（在一个原胞范围内）构成的集合，想象成一个二维的“极化配置空间”。在这个空间里的每一个点，都对应一种特定的滑动构型，并有一个确定的极化矢量（包括面内分量P||和面外分量P⊥）。我们的计算（见图1b，c）清晰地描绘了这个空间：在AA堆叠（τ=0）附近滑动，主要诱导出面外极化；沿着某些高对称路径滑动，则主要产生面内极化。特别地，在配置空间中存在一些特殊的点（如M， N点），其面外极化方向相反；而在边界和对角线（G-G路径）上，只有面内极化。这个“极化地图”是我们理解一切莫尔图案的基础，因为一个莫尔超晶格可以被近似看作无数个具有不同τ的滑动双层结构的组合。

注意：这里有一个非常容易混淆的点。滑动铁电性产生的极化，是整个双层体系的净极化。它来源于两层之间电荷重分布的差异。在计算上，我们不能简单地将两层各自的极化相加，而必须从整体的电子结构出发。

2.2 极化计算的挑战与Wannier函数方案

计算极化在凝聚态物理中本身就是一个微妙的问题。传统的贝里相位（Berry Phase）方法对于周期性体系很有效，但它给出的是整个原胞的宏观平均极化，无法提供原子尺度的局域信息。而对于莫尔超晶格，我们迫切想知道的是：在超晶格中不同位置（比如靠近莫尔涡旋中心还是边界），极化的大小和方向有何不同？这就需要一种能定义局域极化的方法。

我们的武器是最大局域化Wannier函数（MLWFs）。Wannier函数可以看作是实空间中局域的“电子轨道”。通过计算，我们可以得到所有价电子的Wannier函数中心（WCs），这本质上就是电子电荷在实空间中的“重心”位置。同时，原子核的位置是已知的正电荷中心。这样，一个原胞的偶极矩就可以通过计算这些正负电荷中心的相对位置来得到（公式1）。这种方法的美妙之处在于，它可以自然地分配到每个原胞甚至每个原子上，为我们绘制莫尔超晶格的“极化像素图”提供了可能。

对于h-BN，由于氮原子（N）的电负性远强于硼原子（B），我们可以做一个合理的简化：假设所有价电子都局域在N原子周围。因此，我们选择用N原子的sp3轨道来构建Wannier函数，从而获得高质量的WCs。每个N原子被赋予一个局域偶极矩p，它由同一原胞内B原子、N原子和WCs的位置共同决定。

2.3 深度Wannier模型：用机器学习“学习”极化

虽然MLWFs方法能计算极化，但对包含上万个原子的莫尔超晶格直接进行DFT+Wannier90计算，仍然是不现实的。这时，机器学习登场了。

我们构建了一个深度Wannier（DW）神经网络模型。它的核心思想是：我们不需要对巨大的莫尔超晶格直接做第一性原理计算，而是先用DFT精确计算一小批不同滑动构型和应变下的h-BN双层小原胞（例如√3×√3的超胞），并提取它们的Wannier中心位置和对应的偶极矩。用这些数据作为“教材”去训练一个深度神经网络。

这个神经网络学习的是从原子结构信息（原子种类、位置）到Wannier中心位置的复杂映射关系。一旦模型训练好，我们就可以把莫尔超晶格中每个局部区域的原子坐标输入模型，模型会瞬间预测出该区域的Wannier中心，进而我们就能计算出该处的局域极化。这相当于让机器学习到了h-BN层间滑动与电荷重分布之间的“物理规律”，然后将其推广到任何复杂的滑动组合（即莫尔图案）上。

我们使用DP-JAX框架进行训练。数据集包含了从AA堆叠出发，沿晶格矢量滑动以及施加不同双轴应变生成的共500个数据点。损失函数定义为模型预测的偶极矩与DFT计算值之间的均方误差（公式2）。经过10万步训练，模型的预测精度极高，平均绝对误差（MAE）在10^-5 e·Å量级，远小于h-BN滑动铁电本身的极化强度（~10^-3 e·Å）。这意味着模型已经牢牢掌握了滑动与极化之间的关联，可以放心地用于大尺度预测。

实操心得：在训练这类物理性质的机器学习模型时，数据集的构建至关重要。不仅要覆盖足够的构型空间（不同的滑动矢量τ），还要考虑物理扰动，如应变。我们特意加入了双轴应变的数据，这使得模型能够同时学习滑动和晶格失配两种效应，为后续研究应变调控打下了基础。此外，验证集的MAE必须远小于所研究物理量的特征尺度，否则预测结果没有物理意义。

3. 扭转双层h-BN中的拓扑极化图案

有了训练好的DW模型，我们就可以开始探索真正的莫尔超晶格了。首先从扭转双层系统入手。

3.1 从小角度到大角度：极化图案的演变

我们首先计算了一个相对转角较大（θ = 6.01°）的扭转双层h-BN。图2a展示了其原子结构，莫尔波纹清晰可见。通过DW模型预测，我们得到了上下两层中每个N原子位置的局域极化矢量（图2b）。一个非常有趣的现象出现了：上下两层的极化（Player_up和Player_dw）都呈现出涡旋状（vortex）分布，并且它们的螺旋相位几乎是相反的。这很好理解，因为上下层是相对扭转的，局部的滑动方向自然也相反。

将上下层的极化矢量差（即净极化）在空间中画出来，就得到了整个莫尔超晶格的极化图案（图2c）。可以看到：

在莫尔图案的M点和N点（对应AA‘和AB/BA堆叠区域），出现了面外极化（P⊥）的涡旋，且M点和N点的涡旋旋转方向（手性）相反。
在莫尔原胞的边界和对角线（G-G路径）上，只有面内极化（P||）。
面内极化的最大值出现在A， B， C点。

这个结果与从“极化配置空间”直接映射的预期基本一致，证明了DW模型的有效性（与直接DFT计算结果的MAE仅为5.04×10^-5 e·Å）。但模型也揭示了一个细微差别：在M/N点附近，局域极化由三个相邻原子的贡献共同决定，而非简单双层滑动模型中的两个原子。这是因为扭转操作破坏了严格的平移对称性，使得局部原子环境无法与任何平移滑动构型完全等同。

当我们把转角减小到更小的1.54°（图2d， e），莫尔周期变得更大，极化图案的细节更加丰富，也更接近连续介质模型的描述。此时，图案呈现出清晰的拓扑非平庸纹理。

3.2 拓扑电荷与半子-反半子对

如何定量描述这种纹理的拓扑性质？我们引入了拓扑电荷密度q(r)和卷绕数Q（公式3）。这类似于磁性斯格明子（skyrmion）中的拓扑荷计算。将归一化的极化矢量场映射到一个球面上，其卷绕数Q可以取整数值，表征不同的拓扑结构。

计算发现，在零电场和无晶格失配的情况下，整个莫尔超晶格的净卷绕数Q=0。但是，如果我们分别观察以M点和N点为中心的三角形区域（图2e中虚线框），会发现每个区域的Q值分别为+1/2和-1/2。这对应着一种被称为**半子（meron）和反半子（antimeron）**的拓扑结构。你可以把它们想象成拓扑纹理的“半成品”：一个斯格明子（Q=1）可以被看作是一个半子（Q=+1/2）和一个反半子（Q=-1/2）的组合。在我们的极化场中，M点和N点正好承载了这样一对拓扑荷相反的“半子对”。

从极化矢量场来看，M点和N点是面外极化涡旋的核心（向外指或向内指），而围绕它们的面内极化矢量呈涡旋状排列。这种面外极化涡旋+面内极化涡旋的复合结构，正是Bloch型半子的特征。因此，h-BN莫尔超晶格中的极化图案，本质上是由一系列拓扑半子-反半子对构成的晶格。

深度解析：为什么是半子而不是完整的斯格明子？这是因为在无外场时，体系的总拓扑荷必须为零（这是由边界条件决定的）。半子-反半子对是一种能量上可能更稳定的拓扑缺陷对。它们的存在，使得极化场在莫尔超晶格内形成了周期性的拓扑纹理，这可能会影响电子的输运、光学响应等性质，是未来器件设计的潜在资源。

4. 晶格失配与垂直电场的调控作用

理解了静态的拓扑图案后，更关键的问题是如何动态调控它。我们研究了两种最直接的调控手段：晶格失配（应变）和垂直外加电场。

4.1 晶格失配：引入额外的面外极化

晶格失配（即一层被拉伸，另一层被压缩）同样能产生莫尔图案。我们构建了双轴应变η = 5%的失配双层模型（图3a）。一个与扭转双层显著不同的现象出现了：在A-N-C-M-B这条路径上，出现了未配对的N原子（图3b）。这是因为两层原子数不再严格相等，无法实现一一映射。

更重要的是，应变双层极化图案的面外分量（图3c）与从滑动构型直接映射的预期（图1b）并不完全一致，它像是叠加了一个均匀的、额外的面外极化。这个额外极化的根源在于晶格失配破坏了局部的镜面对称性。在理想的G点（AA堆叠），本应具有镜面对称，面外极化为零。但应变使得上下层原子无法精确对准，局部镜面对称被破坏，从而“激活”了面外极化。这个效应在传统的有效模型或直接映射中是被忽略的，但我们的机器学习模型由于其“第一性原理精度”，成功地捕捉到了它。

这个额外的面外极化，成为了调控拓扑结构的“开关”。我们计算了η = 1%应变下的情况（图3d）。此时，P⊥=0的等值线（图中虚线）向边界收缩。对应的拓扑电荷分布（图3e）发生了剧变：以N点为中心的三角形区域，其拓扑电荷Q_N从-1/2变成了-1；而以M点为中心的区域，Q_M从+1/2变成了0。这意味着，一个微小的额外面外极化，就使得N点的反半子（antimeron）演变成了一个完整的反斯格明子（antiskyrmion），而M点的半子（meron）则消失了。

当应变符号改变（拉伸变压缩）时，额外极化的方向反转，导致M和N点的角色互换（图3f）。这展示了通过控制应变的方向和大小，我们可以选择性地“创造”或“湮灭”特定的拓扑结构（斯格明子或反斯格明子），甚至实现两者之间的转换。

4.2 垂直电场：翻转极化与拓扑相变

垂直电场（Ez）提供了一种更干净、更易操作的调控方式。如图4a所示，外加电场对面外极化（P⊥）的调控非常显著，而对面内极化（P||）的影响很小。这很直观，因为电场沿着面外方向，直接与面外极化分量耦合。

我们研究了在1.085°扭转双层上施加电场的影响。当施加一个较小的正向电场（0.02 V/Å）时（图4b， e），整个体系的面外极化被部分压制，P⊥=0的等值线收缩至M点附近。拓扑结构随之改变：M点的半子（meron）转变成了完整的斯格明子（skyrmion， Q_M=1），而N点的反半子则消失了（Q_N=0）。这类似于应变调控，电场引入了一个全局的额外面外极化分量，打破了半子-反半子对的平衡。

当我们继续增大电场至0.03 V/Å时（图4c， f），发生了更彻底的拓扑相变：所有的面外极化都被电场“掰”成了同一个方向。此时，整个极化场失去了涡旋纹理，拓扑电荷密度q(r)处处为零，所有的拓扑结构（半子、斯格明子）都消失了。体系进入了一个拓扑平庸的极化单畴态。

关键发现与器件启示：电场对拓扑结构的调控具有非易失性的潜力。假设我们用电场将体系驱动到某个拓扑态（如斯格明子晶格），然后撤去电场，由于铁电极化的存在，体系可能会停留在那个亚稳态。这就为实现基于拓扑极化纹理的、电控的非易失性信息存储（例如，用斯格明子的有/无代表0/1）提供了原理上的可能性。其读写速度可能远超传统磁性斯格明子器件，因为这里调控的是电子极化，而非自旋。

5. 反平行堆叠中的局域极化：被忽略的细节

最后，我们探讨了一个常被有效模型忽略，但却至关重要的细节：反平行堆叠（AA‘堆叠）的扭转双层中，是否也存在极化？

根据对称性分析，AA‘堆叠本身具有反演对称性（I），因此无论怎么面内滑动（{I|τ}操作），理论上都不会产生净极化。所以，在基于对称性的有效模型中，AA‘堆叠的莫尔超晶格被认为是没有极化的。

然而，我们的DW模型计算给出了不同的答案。对于AA‘堆叠的扭转双层（图4g），我们依然观察到了清晰的面内极化图案（图4h），尽管其强度比平行堆叠（AA堆叠）小了一个数量级。这个极化的起源，再次归因于有限体系下，扭转操作无法完全等价于平移操作所导致的局域平移对称性破缺。在莫尔超晶格的局部，原子排列无法与任何具有完美反演对称性的AA‘滑动原胞完全匹配，从而在微观上产生了非零的偶极矩。

随着扭转角度θ减小，莫尔周期变大，这种局域的不匹配效应减弱，因此观测到的极化也随之减小（图4i）。这个发现提醒我们，在构建莫尔体系的简化模型时，必须谨慎对待由长波近似忽略掉的原子尺度细节，它们可能在物理性质上带来不可忽视的修正，尤其是在讨论极其微弱的信号或临界现象时。

6. 总结与展望

回顾整个工作，我们利用深度Wannier这一机器学习力场工具，成功地对大尺度h-BN莫尔超晶格中的滑动铁电性进行了高精度的原子尺度模拟，揭示了其中丰富的拓扑极化图案及其调控规律。

核心结论如下：

拓扑纹理的普遍性：在扭转或应变h-BN莫尔超晶格中，极化场会自发形成由半子（meron）和反半子（antimeron）对构成的拓扑晶格。这些拓扑结构来源于滑动铁电性在莫尔周期上的空间调制。
有效的调控手段：晶格失配（应变）和垂直电场都能通过引入一个全局或局部的额外面外极化分量，有效地调控这些拓扑结构。微小的扰动就足以让半子-反半子对演变为完整的斯格明子/反斯格明子，或使其完全消失，实现拓扑相变。
细节决定物理：在反平行堆叠的扭转双层中，由于局域平移对称性的破缺，依然存在微弱但不可忽略的面内极化。这指出了传统有效模型或直接映射方法在精度上的局限性。

从方法学角度看，这项工作展示了机器学习在解决凝聚态物理中大尺度计算难题上的强大能力。深度Wannier模型不仅提供了堪比DFT的精度，还将计算尺度提升了数个数量级，使得研究真实莫尔超晶格中的复杂现象成为可能。

对未来研究的启示：

材料拓展：这套方法可以无缝应用到其他具有滑动铁电性的二维材料体系，如扭曲双层过渡金属硫化物（WSe2， MoS2等），去探索更丰富的拓扑相图和物态。
多物理场耦合：可以进一步研究极化拓扑纹理与电子能带拓扑、谷物理、磁性之间的耦合，探索多自由度调控的新器件概念。
动力学过程：利用机器学习分子动力学，可以模拟电场驱动下斯格明子的产生、移动和湮灭过程，为设计拓扑电路提供动力学依据。
实验探测：我们的理论预测为实验探测提供了明确的目标。例如，利用压电力显微镜（PFM）可以直接观测面外极化的涡旋图案；利用二次谐波产生（SHG）可以探测面内极化的空间分布和对称性破缺。

个人体会：做这个课题最深的一点感受是，机器学习不仅仅是“黑箱”拟合工具。当它与清晰的物理图像（如滑动铁电性的配置空间、Wannier中心的物理意义）紧密结合时，它就成了延伸我们理论计算能力的“超级望远镜”。它让我们看到了以前因计算瓶颈而无法看到的风景——原子尺度下，拓扑纹理如何生动地生长在莫尔波纹的“山水”之间。另一个深刻的教训是，对于莫尔体系，任何基于完美周期性的近似都需要格外小心，因为“莫尔”本身就是一个打破完美周期性的产物，那些被近似忽略掉的局域细节，往往正是新奇物理的藏身之处。在下一步工作中，我们计划将这种方法与更高阶的电子关联效应（如GW近似）结合，探索拓扑极化对莫尔平带电子结构的修饰作用，这可能会通向更奇异的量子物态。

查看全文

http://www.jsqmd.com/news/875952/