当前位置：首页 > news >正文

持久性球面：拓扑数据分析的几何线性化新方法

news 2026/6/19 22:06:53

1. 持久性球面：拓扑机器学习的几何线性化新范式

在拓扑数据分析（TDA）领域，持久性图（Persistence Diagrams, PDs）作为描述数据拓扑特征的黄金标准，长期面临一个根本性挑战：如何将这种具有复杂几何结构的对象有效地嵌入线性空间，以便应用传统机器学习方法？2026年Pegoraro提出的持久性球面（Persistence Spheres）给出了一个令人耳目一新的解决方案——通过凸几何中的提升区域（lift zonoid）理论，将PDs映射到球面函数空间，同时保持与部分最优传输（Partial Optimal Transport, POT）距离的稳定性。

这个工作的突破性在于：首次为持久性图提供了具有逆映射连续性的显式向量化表示。这意味着我们不仅能将PDs线性化，还能在必要时从球面表示中稳定地重建原始拓扑特征。这种几何忠实性在聚类分析、回归建模等任务中展现出独特优势，特别是在处理功能数据、时间序列和三维点云等复杂数据时，其性能超越了传统的持久性图像和持久性景观等方法。

2. 核心概念与技术背景

2.1 持久性图与部分最优传输

持久性图是拓扑数据分析的核心输出，它将数据的拓扑特征（如连通分量、环状结构和高维空洞）表示为二维平面上的点集。每个点$(x,y)$的横坐标$x$表示特征的"出生时间"，纵坐标$y$表示"死亡时间"，而点到对角线$\Delta = {(x,x)|x\in\mathbb{R}}$的垂直距离$\text{Pers}(p)=(y-x)/2$则量化了该特征的"持久性"。

在比较两个PDs时，最自然的度量是1-Wasserstein部分最优传输距离（POT$_1$）。其独特之处在于：

允许将未匹配的点以等于其持久性的代价发送到对角线
反映拓扑特征之间的最优对应关系
满足稳定性定理：小的数据扰动引起PDs的POT$_1$距离变化有限

数学上，对于两个PDs $\mu,\nu$，POT$1$距离定义为： $$ \text{POT}1(\mu,\nu) = \inf{\gamma} \left[ \int |p-q|\infty d\gamma + \int \text{Pers}(p)d(\mu-\pi_1\gamma)(p) + \int \text{Pers}(q)d(\nu-\pi_2\gamma)(q) \right] $$ 其中$\gamma$是部分传输计划，$\pi_1,\pi_2$是投影映射。

2.2 提升区域与支撑函数

提升区域（lift zonoid）是凸几何中的经典概念。给定$\mathbb{R}^2$上的可积测度$\mu$，其提升区域$Z_\mu\subset\mathbb{R}^3$是通过将$\mu$的每个点$p=(x,y)$提升为$(1,x,y)\in\mathbb{R}^3$后形成的Minkowski和。这个凸体的支撑函数$h_{Z_\mu}:S^2\to\mathbb{R}$具有显式积分表示： $$ h_{Z_\mu}(v) = \int_{\mathbb{R}^2} \text{ReLU}(\langle v,(1,p)\rangle )d\mu(p) $$ 其中$\text{ReLU}(t)=\max(0,t)$是整流线性单元。

提升区域的关键性质包括：

注入性：$\mu\mapsto Z_\mu$是单射
连续性：在一致可积条件下，测度的弱收敛等价于提升区域的Hausdorff收敛
线性性：$Z_{\lambda_1\mu_1+\lambda_2\mu_2} = \lambda_1 Z_{\mu_1} \oplus \lambda_2 Z_{\mu_2}$

3. 持久性球面的构造与性质

3.1 签名提升区域变换

为了适应POT几何，作者引入了签名提升区域变换（Signed Lift-Zonoid Transform）。对于满足可积条件的签名测度$\sigma$，定义： $$ \Lambda(\sigma)(v) = \int_{\mathbb{R}^2} \text{ReLU}(\langle v,(1,p)\rangle )d\sigma(p) $$

这个线性算子扩展了经典提升区域变换，允许处理带符号的测度。特别地，对于PDs测度$\mu$，我们构造其增广测度： $$ \mu_{\text{aug}} = \mu - (\pi_\Delta)#\mu $$ 其中$(\pi\Delta)_#\mu$表示将$\mu$投影到对角线后得到的测度。

3.2 持久性球面的定义

持久性球面$S(\mu)$定义为签名提升区域变换在单位球面$S^2$上的限制： $$ S(\mu) = \Lambda(\mu_{\text{aug}})|_{S^2} $$

通过引入对角坐标$d(p)=(x+y)/2$和持久性坐标$\text{Pers}(p)=(y-x)/2$，可以显式写出球面函数的表达式： $$ S(\mu)(v) = \int_X \left[ \text{ReLU}(v_0 + s(v)d(p) + t(v)\text{Pers}(p)) - \text{ReLU}(v_0 + s(v)d(p)) \right] d\mu(p) $$ 其中$s(v)=v_1+v_2$, $t(v)=v_2-v_1$将球面坐标与PDs的几何特征联系起来。

3.3 关键理论性质

定理1（稳定性）：存在常数$C>0$使得对所有$\mu,\nu\in\mathcal{M}$： $$ |S(\mu)-S(\nu)|_{L^\infty(S^2)} \leq C \cdot \text{POT}_1(\mu,\nu) $$

定理2（逆连续性）：在紧支集测度类上，$S^{-1}$在像集上是连续的。具体地，对任何紧集$K\subset\mathcal{M}$，存在模函数$\omega_K$使得： $$ \text{POT}1(\mu,\nu) \leq \omega_K(|S(\mu)-S(\nu)|{L^\infty}) $$

这些性质保证了持久性球面不仅稳定地编码了PDs的拓扑信息，而且在必要时可以（在紧性条件下）从球面表示中重建原始PDs——这是其他向量化方法（如持久性景观、图像等）所不具备的特性。

4. 技术实现与算法细节

4.1 离散PDs的计算实现

对于离散PDs $\mu=\sum_{i=1}^n c_i\delta_{p_i}$，持久性球面有显式表达式： $$ S(\mu)(v) = \sum_{i=1}^n c_i \left[ \text{ReLU}(\langle v,(1,p_i)\rangle ) - \text{ReLU}(\langle v,(1,\pi_\Delta(p_i))\rangle ) \right] $$

实际计算时，通常需要在$S^2$上选取有限采样点（如通过HEALPix网格），然后预计算每个$p_i$在不同方向$v_j$上的贡献。这种离散化保持了理论保证，因为：

采样误差可通过增加采样点控制
ReLU的Lipschitz性质保证离散近似稳定性
计算复杂度与PDs点数呈线性关系

4.2 交叉增广技巧

比较两个PDs $\mu,\nu$的球面表示时，关键观察是： $$ S(\mu)-S(\nu) = \Lambda(\mu\oplus_\Delta \nu) - \Lambda(\nu\oplus_\Delta \mu)|{S^2} $$ 其中交叉增广测度定义为： $$ \mu\oplus\Delta \nu := \mu + (\pi_\Delta)_#\nu $$

这个等式将签名测度的问题转化为正测度的问题，使我们能利用经典最优传输理论中的工具（如Kantorovich-Rubinstein对偶性）来建立稳定性估计。