当前位置：首页 > news >正文

5种一维数据转图像的黑科技：GAFS/MTF/递归图实战对比（附Python代码）

news 2026/3/26 22:39:01

一维信号可视化：五种图像编码技术的深度解析与实战选型指南

在数据科学和算法工程的前沿，我们常常面对一个看似简单却充满挑战的问题：如何让机器“看见”一串数字？心电图、股价波动、传感器读数、音频波形……这些一维时间序列数据蕴含着丰富的模式与信息，但传统的统计图表或直接喂给一维卷积网络，有时总觉得“意犹未尽”。近年来，一个思路逐渐流行起来：将一维序列转化为二维图像。这不仅仅是数据形式的转换，更是一种视角的升维。通过将时间、频率、状态变迁等信息编码到像素空间，我们得以借用计算机视觉领域强大的特征提取能力（如CNN），去挖掘序列中那些用传统方法难以捕捉的深层关联和复杂模式。

然而，方法众多，各有千秋。格拉米角场（GAF）、马尔可夫变迁场（MTF）、递归图（RP）、短时傅里叶变换（STFT）……这些名词听起来都很酷，但在面对你的具体数据时，究竟该选哪一个？是追求对周期性特征的极致刻画，还是希望保留完整的时间动态？生成的图像是用于直观的人工分析，还是作为深度学习模型的输入？不同的选择，可能导致结果天差地别。

本文旨在为你拨开迷雾。我不会仅仅罗列公式和API调用，而是将深入这五种核心技术的内在逻辑、视觉特性及其与数据本质的契合度。我们将结合心电图（ECG）和金融时间序列的具体案例，通过大量的代码对比和生成图像的可视化分析，为你构建一套清晰的决策框架。最终，你将能自信地回答：对于我的数据，最适合的“翻译官”是谁？

1. 核心原理透视：五种方法如何“编织”图像

理解每种方法如何将一维线“编织”成二维面，是做出正确选择的第一步。它们的哲学和数学基础截然不同。

1.1 格拉米角场：在极坐标中捕捉时间相关性

格拉米角场的核心思想非常优雅：将时间序列映射到极坐标系，然后通过角度关系来编码时间点之间的相关性。它认为，时间序列中点的数值关系，可以通过它们在单位圆上的角度和与差来表征。

其过程可以分解为三步：

归一化：将原始序列值缩放到[-1, 1]或[0, 1]区间。这确保了所有点都能映射到单位圆上。
极坐标变换：将归一化后的值x̃_i视为余弦值cos(φ_i)，从而反解出角度φ_i。时间戳i则被映射为半径r_i。此刻，一个时间点(i, x_i)在直角坐标系中的信息，被转换为了极坐标系中的点(φ_i, r_i)。
生成格拉米矩阵：这是关键一步。通过计算每对点(i, j)的角度和或差，生成最终的图像矩阵。
- 格拉米角和场（GASF）：GASF = cos(φ_i + φ_j)。它本质上是转换后向量点积的表示，保留了序列的绝对时间关系。
- 格拉米角差场（GADF）：GADF = sin(φ_i - φ_j)。它更侧重于捕捉时间点之间的相对变化。

注意：GAF生成的图像是对称矩阵，其对角线（i=j）包含了原始序列的归一化信息。图像的整体纹理反映了序列的整体趋势和周期性。

让我们用一段模拟的周期性信号（类似简单的心跳）来直观感受一下：

import numpy as np import matplotlib.pyplot as plt from pyts.image import GramianAngularField # 生成一个简单的周期性序列（模拟ECG R峰） t = np.linspace(0, 4*np.pi, 200) signal = np.sin(t) + 0.5 * np.sin(3*t) # 基波加一个谐波 # 初始化GAF转换器 gasf_transformer = GramianAngularField(method='summation', image_size=100) gadf_transformer = GramianAngularField(method='difference', image_size=100) # 转换（注意输入需要是2D数组，形状 [n_samples, n_timestamps]） signal_2d = signal.reshape(1, -1) gasf_image = gasf_transformer.transform(signal_2d) gadf_image = gadf_transformer.transform(signal_2d) # 可视化 fig, axes = plt.subplots(1, 3, figsize=(15, 4)) axes[0].plot(t, signal) axes[0].set_title('原始信号') axes[0].set_xlabel('时间') axes[1].imshow(gasf_image[0], cmap='rainbow', origin='lower') axes[1].set_title('GASF图像') axes[1].set_xlabel('时间索引 i') axes[1].set_ylabel('时间索引 j') axes[2].imshow(gadf_image[0], cmap='rainbow', origin='lower') axes[2].set_title('GADF图像') axes[2].set_xlabel('时间索引 i') axes[2].set_ylabel('时间索引 j') plt.tight_layout() plt.show()

运行这段代码，你会看到原始信号被转换成了两种具有明显对称性和彩色纹理的“热图”。GASF图像沿主对角线通常有亮色条纹，而GADF的图像模式则更为复杂，对角线上信息较弱。

1.2 马尔可夫变迁场：刻画状态转移的概率图景

如果说GAF关注的是“值”的相关性，那么马尔可夫变迁场（MTF）关注的则是“状态”的演变。它将时间序列视为一个状态机，记录不同状态之间随时间推移的转移概率。

MTF的构建同样分为三步：

分箱离散化：将连续的时间序列值划分到Q个分位数区间（bins）中。每个时刻的数据点被赋予一个离散的状态标签q_i（1到Q之间的整数）。
构建马尔可夫转移矩阵：这是一个Q x Q的矩阵W。矩阵元素W_{ij}表示在整个序列中，状态i之后紧接着出现状态j的经验概率。它刻画了序列的一步转移特性。
扩展为变迁场：原始的转移矩阵W丢失了时间位置信息。MTF通过创建一个n x n的矩阵M来恢复它，其中M_{ij} = W_{q_i, q_j}。也就是说，矩阵M在位置(i, j)的值，是时刻i的状态转移到时刻j的状态的概率。

这种方法生成的图像，其像素值代表的是概率。图像中会呈现出块状结构，因为相同或相似状态在时间上聚集出现。

from pyts.image import MarkovTransitionField # 使用同样的信号 mtf_transformer = MarkovTransitionField(n_bins=8, image_size=100) # n_bins 控制状态数 mtf_image = mtf_transformer.transform(signal_2d) fig, axes = plt.subplots(1, 2, figsize=(10, 4)) axes[0].plot(t, signal) axes[0].set_title('原始信号') axes[1].imshow(mtf_image[0], cmap='viridis', origin='lower') axes[1].set_title('MTF图像 (Q=8)') axes[1].set_xlabel('时间索引 i') axes[1].set_ylabel('时间索引 j') plt.colorbar(axes[1].imshow(mtf_image[0], cmap='viridis', origin='lower'), ax=axes[1]) plt.tight_layout() plt.show()

你会看到MTF图像呈现出明显的棋盘格状斑块，颜色代表转移概率的高低。斑块的分布和大小直接反映了原始信号在不同幅值状态间停留和跳转的节奏。

1.3 递归图：揭示动力系统的相空间轨迹

递归图源于非线性时间序列分析和混沌理论，它不关心具体的数值或状态，而是关注序列在重构相空间中的轨迹是否“ revisited”（递归）。它回答的问题是：系统的状态在时间演化中，是否会接近它曾经到达过的状态？

其计算基于相空间重构：

重构相空间：通过时间延迟τ和嵌入维度m，将一维序列{x_t}重构成一系列m维向量X_i = (x_i, x_{i+τ}, ..., x_{i+(m-1)τ})。这试图恢复系统潜在的动力学。
计算递归矩阵：对于一个阈值ε，递归矩阵R的元素定义为：R_{ij} = Θ(ε - ||X_i - X_j||)其中Θ是赫维赛德阶跃函数（距离小于ε则为1，否则为0）。简单说，如果两个时刻i和j的系统状态向量在相空间中足够接近，就在(i, j)点画一个黑点。

递归图中的典型结构（如对角线、垂直线、矩形块）对应着不同的动力学特性，如周期性、平稳性、突变等。

from pyts.image import RecurrencePlot # 递归图对参数非常敏感 rp_transformer_1 = RecurrencePlot(dimension=3, time_delay=2, threshold='point', percentage=10) rp_image_1 = rp_transformer_1.transform(signal_2d) rp_transformer_2 = RecurrencePlot(dimension=5, time_delay=5, threshold='distance', epsilon=0.1) rp_image_2 = rp_transformer_2.transform(signal_2d) fig, axes = plt.subplots(1, 3, figsize=(15, 4)) axes[0].plot(t, signal) axes[0].set_title('原始信号') axes[1].imshow(rp_image_1[0], cmap='binary', origin='lower') axes[1].set_title('RP图像 (dim=3, delay=2, 百分比阈值)') axes[1].set_xlabel('时间索引 i') axes[1].set_ylabel('时间索引 j') axes[2].imshow(rp_image_2[0], cmap='binary', origin='lower') axes[2].set_title('RP图像 (dim=5, delay=5, 距离阈值)') axes[2].set_xlabel('时间索引 i') axes[2].set_ylabel('时间索引 j') plt.tight_layout() plt.show()

递归图是二值图像（黑白点）。你会看到一条明亮的主对角线（因为每个点与自身距离为0），以及平行于主对角线的短线，这反映了信号的周期性。参数dimension、time_delay和threshold对图像形态影响巨大。

1.4 短时傅里叶变换：经典的时频分析视图

STFT可能是信号处理领域最广为人知的时频表示方法。它的思路直观：既然全局傅里叶变换丢失了时间信息，那我就用一个滑动窗口，每次只分析一小段时间内的信号，得到该片段的频率谱。将所有片段的频谱按时间排列，就得到了频谱图。

其数学表达为：STFT{x(t)}(τ, ω) = ∫ [x(t) * w(t-τ)] * e^{-jωt} dt其中w(t)是窗函数（如汉宁窗）。

STFT生成的图像（频谱图）的横轴是时间，纵轴是频率，像素的亮度或颜色代表该时刻该频率成分的幅度（通常取模值）。它完美地展示了信号频率成分如何随时间变化。

from scipy import signal # 生成一个频率变化的信号（啁啾信号） fs = 1000 # 采样率 T = 2.0 # 时长 t_chirp = np.linspace(0, T, int(T*fs)) # 频率从20Hz线性增加到100Hz chirp_signal = np.sin(2*np.pi * (20 + 40*t_chirp/T) * t_chirp) # 计算STFT nperseg = 256 # 窗口长度 noverlap = nperseg // 2 # 重叠50% frequencies, times, Zxx = signal.stft(chirp_signal, fs, nperseg=nperseg, noverlap=noverlap) fig, axes = plt.subplots(1, 2, figsize=(12, 4)) axes[0].plot(t_chirp, chirp_signal) axes[0].set_title('线性调频信号') axes[0].set_xlabel('时间 (s)') # 绘制频谱图 pcm = axes[1].pcolormesh(times, frequencies, np.abs(Zxx), shading='gouraud', cmap='inferno') axes[1].set_title('STFT频谱图') axes[1].set_ylabel('频率 (Hz)') axes[1].set_xlabel('时间 (s)') fig.colorbar(pcm, ax=axes[1], label='幅度') plt.tight_layout() plt.show()

STFT图像清晰地显示了一条从低频到高频的斜线，这正是我们构造的线性调频信号的特征。对于非平稳信号（如音乐、语音、振动信号），STFT的时频视图具有无可替代的价值。

1.5 连续小波变换：多分辨率的时频显微镜

虽然不在原始标题中，但作为STFT的有力补充和对比，连续小波变换（CWT）值得在此一提。STFT的窗口大小是固定的，这导致了时间分辨率和频率分辨率在全局固定（不确定性原理）。CWT则使用可伸缩和平移的小波基函数，实现了多分辨率分析：在高频部分，时间分辨率高；在低频部分，频率分辨率高。

CWT的系数C(a, b)表示尺度a（对应频率）和平移b（对应时间）下，信号与小波基函数的相似程度。其生成的小波尺度图也是一种时频图像，但能更好地分析瞬态特征和不同尺度的现象。

import pywt # 使用一个包含瞬态脉冲和振荡的信号 t_cwt = np.linspace(0, 1, 400) signal_cwt = np.sin(2*np.pi*15*t_cwt) signal_cwt += (t_cwt>0.5) * np.sin(2*np.pi*40*t_cwt) # 0.5秒后增加一个高频成分 signal_cwt[200] = 2.0 # 在中间加入一个瞬态脉冲 # 计算连续小波变换 scales = np.arange(1, 128) coefficients, frequencies = pywt.cwt(signal_cwt, scales, 'morl', sampling_period=1/400) fig, axes = plt.subplots(1, 2, figsize=(12, 4)) axes[0].plot(t_cwt, signal_cwt) axes[0].set_title('含瞬态和变频的信号') axes[0].set_xlabel('时间 (s)') axes[0].axvline(x=0.5, color='r', linestyle='--', alpha=0.5) axes[0].axvline(x=t_cwt[200], color='g', linestyle='--', alpha=0.5) im = axes[1].imshow(np.abs(coefficients), extent=[0, 1, 1, 128], cmap='PRGn', aspect='auto', vmax=abs(coefficients).max(), vmin=-abs(coefficients).max()) axes[1].set_title('CWT尺度图 (Morlet小波)') axes[1].set_ylabel('尺度 (越大频率越低)') axes[1].set_xlabel('时间 (s)') fig.colorbar(im, ax=axes[1], label='系数绝对值') plt.tight_layout() plt.show()

在小波尺度图中，你可以同时看到低频振荡的宽条纹、0.5秒后出现的高频振荡的细密条纹，以及在0.5秒位置（绿色虚线）那个瞬态脉冲产生的垂直亮线。这种同时捕捉长时间趋势和短时突变的能力，是CWT的独特优势。

2. 实战对比：心电图与股价序列的编码实验

理论需要实践的检验。我们选取两类极具代表性的一维数据——心电图（ECG）和股价日收益率序列，来观察五种方法生成图像的差异，并理解其背后的原因。

2.1 心电图分析：捕捉周期性生理信号

心电图是典型的准周期性生物电信号，包含P波、QRS波群、T波等特征波形。我们使用公开的MIT-BIH心律失常数据库中的一段正常窦性心律数据。

# 假设我们已经加载了一段ECG信号数据 `ecg_signal`，采样频率为360Hz，时长约10秒。 # 这里我们用模拟的典型ECG波形代替 def simulate_ecg(length=3600, hr=60): # 简化模拟，用于演示 t = np.arange(length) / 360.0 # 模拟心跳周期 beat_freq = hr / 60.0 # 一个简单的心跳模板（P-QRS-T复合波） template = np.zeros(200) template[20:50] = 0.1 * np.sin(np.linspace(0, np.pi, 30)) # P波 template[60:100] = np.concatenate([np.linspace(0, 1, 20), np.linspace(1, -0.2, 20)]) # QRS template[110:180] = 0.3 * np.exp(-np.linspace(0, 5, 70)) * np.sin(np.linspace(0, 2*np.pi, 70)) # T波 # 将模板按心率重复 signal = np.zeros(length) beat_samples = int(360 / beat_freq) for i in range(0, length-beat_samples, beat_samples): end_idx = min(i+200, length) signal[i:end_idx] += template[:end_idx-i] signal += np.random.normal(0, 0.02, length) # 加入少量噪声 return t, signal t_ecg, ecg_signal = simulate_ecg(3600, hr=72) ecg_2d = ecg_signal.reshape(1, -1) # 为节省计算，我们截取一小段（约3秒）进行可视化 segment = ecg_2d[:, :1000] # 初始化各转换器（调整参数以适应ECG） image_size = 100 gasf_ecg = GramianAngularField(method='summation', image_size=image_size, sample_range=(-1,1)).transform(segment) gadf_ecg = GramianAngularField(method='difference', image_size=image_size, sample_range=(-1,1)).transform(segment) mtf_ecg = MarkovTransitionField(n_bins=10, image_size=image_size).transform(segment) rp_ecg = RecurrencePlot(dimension=5, time_delay=10, threshold='point', percentage=5).transform(segment) # STFT freqs, times, Zxx_ecg = signal.stft(ecg_signal[:1000], fs=360, nperseg=128, noverlap=64)

生成图像后，我们进行对比分析：

方法	ECG图像特征	反映的ECG特性	适用场景
GASF/GADF	呈现明显的、规则的对角线或棋盘格纹理。GASF对角线亮，GADF对角线暗。	强烈反映了ECG的准周期性。纹理的规则性对应心跳的规律性。对角线附近的模式可能对应QRS波的形状。	心律失常分类。周期性的破坏（如早搏、房颤）会在图像中产生明显的纹理断裂或异常斑块，非常适合CNN捕捉。
MTF	显示出纵向和横向的条带，颜色块状分布。	反映了ECG信号幅值（电压）状态的转移概率。QRS波的高幅值状态会形成独特的亮块或暗块。	心跳形态分类（如正常搏动、室性早搏）。MTF对信号的幅值分布和状态转移敏感，能区分不同形态的波形。
RP	除了主对角线，还有大量短平行对角线和垂直/水平结构。	揭示了ECG动力学的递归特性。清晰的平行线表示稳定的周期性。垂直/水平线可能对应P波或T波等特定相位。	分析心率变异性（HRV）或混沌特性。RP对动力系统的微小变化敏感，可用于检测自主神经系统状态。
STFT	时频谱图，在心跳频率（约1-2Hz）及其谐波处有能量集中，随时间周期性出现。	清晰展示了ECG信号的频率成分及其随时间的变化。QRS波对应高频能量爆发，T波对应低频能量。	检测高频噪声、分析信号质量、或研究心率振荡。能直观看到工频干扰（50/60Hz）或肌电噪声。
CWT	多分辨率视图，在QRS波出现的时间点，所有尺度（尤其是小尺度/高频）都有强烈响应，呈垂直亮线。	同时提供了高时间分辨率下的瞬态特征（QRS波）和低时间分辨率下的低频振荡（T波、基线漂移）。	QRS波精准检测、胎儿ECG分析、去除基线漂移。多尺度特性使其能同时处理信号中的快变和慢变成分。

提示：对于ECG，如果目标是端到端的异常分类（如房颤检测），GAF和MTF因其生成的图像纹理与CNN兼容性极佳，往往是首选。如果目标是信号成分分析或预处理，STFT和CWT则能提供更直观的物理洞察。

2.2 股价序列分析：处理非平稳金融时间序列

金融时间序列（如股价、收益率）通常具有趋势性、波动聚集性、尖峰厚尾等特征，且是非平稳的。我们使用一段标普500指数的日收益率序列。

import yfinance as yf # 需要安装：pip install yfinance import pandas as pd # 下载一段历史数据 ticker = '^GSPC' data = yf.download(ticker, start='2020-01-01', end='2023-01-01') # 计算日对数收益率 data['Returns'] = np.log(data['Close'] / data['Close'].shift(1)) returns_series = data['Returns'].dropna().values[-500:] # 取最近500个交易日 # 为了可视化，我们直接使用收益率序列。注意金融序列通常需要去趋势或标准化。 price_2d = returns_series.reshape(1, -1) # 初始化转换器（参数可能需要针对金融数据调整） image_size_f = 100 gasf_f = GramianAngularField(method='summation', image_size=image_size_f).transform(price_2d) gadf_f = GramianAngularField(method='difference', image_size=image_size_f).transform(price_2d) mtf_f = MarkovTransitionField(n_bins=12, image_size=image_size_f).transform(price_2d) # 更多bins捕捉波动 rp_f = RecurrencePlot(dimension=3, time_delay=5, threshold='distance', epsilon=0.5*np.std(returns_series)).transform(price_2d) # STFT - 对收益率序列，我们更关心低频波动模式，使用较长窗口 freqs_f, times_f, Zxx_f = signal.stft(returns_series, fs=1, nperseg=64, noverlap=32) # fs=1 表示每日一个点

金融序列的图像化分析：

方法	股价收益率图像特征	反映的金融特性	适用场景
GASF/GADF	图像纹理复杂，无明显严格周期，但可能存在大尺度的“宏观”纹理，反映长期趋势或波动率变化。	捕捉收益率序列的自相关性和波动聚集性。高波动时期会在图像中形成颜色对比强烈的区域。	市场状态识别（牛市、熊市、高波动期）。图像的整体纹理模式可用于训练CNN进行 regime switching 检测。
MTF	呈现出不规则的块状和斑点状结构。在平稳波动期，块状较大且均匀；在剧烈波动期（如黑天鹅事件），会出现小而孤立的异常色块。	直接刻画收益率幅值状态（涨跌幅度）的转移概率。可以可视化波动率的持续性（高波动后倾向于高波动）。	波动率预测、极端风险事件检测。MTF图像中的异常斑块可能对应着市场的恐慌或狂热情绪。
RP	主对角线外有大量散乱的点，可能形成短暂的垂直/水平线或小方块，但缺乏长期平行线。	表明金融序列的动力学是混沌且高维的，缺乏严格的周期性。短暂的递归结构可能对应着短期的趋势或均值回复。	检验市场有效性、探测混沌结构。可用于研究市场是否具有确定性混沌成分，或用于异常检测（如闪电崩盘）。
STFT	时频谱能量主要集中在极低频（接近0Hz），代表长期趋势。能量随时间分布不均匀，在某些时段（危机期）高频能量（短期波动）会增强。	清晰地将收益率序列分解为不同时间尺度的波动成分（长期趋势、中期周期、短期噪声）。	多尺度风险分析、投资组合构建。可以分离出不同频率的风险因子，用于资产配置或风险管理模型。
CWT	在小尺度（高频）上，能量爆发点对应着单日的大涨大跌。在大尺度（低频）上，可以看到持续的牛市或熊市波段。	完美展示了金融时间序列的多尺度特征和局部奇异性。股灾等事件会在几乎所有尺度上产生响应。	拐点检测、事件驱动分析、构建多尺度交易信号。CWT能精准定位价格突变的时间点，并分析其影响的持续时间。

关键洞察：对于金融数据，MTF和GAF生成的图像更适合作为深度学习模型的输入，进行市场走势分类或波动率预测。而STFT和CWT则更适用于量化研究员进行信号分析和因子构建。RP在金融领域的应用相对前沿，更多用于学术研究，探索市场的非线性动力学。

3. 技术选型决策树与参数调优指南

面对具体任务，如何快速选择并调优？下面这个决策流程和参数指南或许能帮你理清思路。

3.1 根据任务目标选择方法

首先问自己：我转化图像的目的是什么？

目的A：作为深度学习（尤其是CNN）的输入，进行端到端的分类/回归。
- 首选GAF或MTF。它们生成的图像是方形的、结构化的，与自然图像有相似之处，CNN容易提取纹理特征。
- 子选择：
  - 如果任务与序列的周期性、趋势性强相关（如机械故障预测、人体活动识别），选GAF。
  - 如果任务与序列的幅值分布、状态跳变强相关（如心电图形态分类、金融状态识别），选MTF。
- 备选：RP。对于某些具有明显递归特性的分类问题（如不同工况下的振动信号），RP也可能表现优异，但图像是二值的，信息密度较低。
目的B：进行人工可视化分析，辅助特征工程或模式发现。
- 首选STFT或CWT。它们提供的时频视图最符合人类的直觉，能直接看到频率成分随时间的变化。
- 子选择：
  - 如果关心固定的时频分辨率，且信号成分相对稳定，选STFT。
  - 如果信号包含瞬态冲击和不同时间尺度的现象（如轴承故障的冲击信号、脑电波的瞬态事件），选CWT。
- 备选：RP。如果你想研究系统的动力学稳定性、周期性或混沌特性，RP是专业工具。
目的C：进行时间序列的异常检测。
- 这取决于异常的类型：
  - 点异常（单个异常点）：MTF可能很敏感，因为异常点会创建独特的转移概率。CWT也能在特定尺度上突出异常点。
  - 模式异常（子序列异常）：GAF和RP可能更好，因为它们编码了子序列之间的关系。异常模式会破坏图像的整体纹理或递归结构。
  - 频域异常：STFT是显而易见的选择。

3.2 关键参数调优实战

每种方法都有其核心参数，调优对结果影响显著。

GAF 参数调优：

method:'summation'(GASF) 或'difference'(GADF)。GASF保留更多全局信息，GADF对局部变化更敏感。通常先尝试GASF。
sample_range: 归一化区间，(-1, 1)或(0, 1)。(-1, 1)能利用整个角度范围[0, π]，区分度可能更好。
image_size: 输出图像的尺寸。如果原始序列很长（如数万点），直接生成n x n的图像计算量大且可能过于稀疏。务必使用image_size参数进行下采样，或先对序列进行分段聚合近似（PAA）。

# GAF参数调优示例 from pyts.preprocessing import StandardScaler long_sequence = np.random.randn(1, 10000) # 超长序列 # 方法1：使用image_size下采样 gaf_large = GramianAngularField(image_size=224) # 直接缩放到CNN常用输入尺寸 image_large = gaf_large.transform(long_sequence) print(f“下采样后图像尺寸：{image_large.shape}”) # (1, 224, 224) # 方法2：先进行PAA预处理 from pyts.approximation import PiecewiseAggregateApproximation paa = PiecewiseAggregateApproximation(window_size=50) # 将每50个点聚合成1个 sequence_paa = paa.transform(long_sequence) gaf_paa = GramianAngularField() # 不指定image_size，则输出为聚合后长度的方阵 image_paa = gaf_paa.transform(sequence_paa) print(f“PAA后序列长度：{sequence_paa.shape[1]}, 图像尺寸：{image_paa.shape}”) # (1, 200, 200)

MTF 参数调优：

n_bins: 分箱数量Q。这是最重要的参数。Q太小会丢失信息，图像模糊；Q太大会引入噪声，图像过于稀疏。一个经验法则是尝试Q在 5 到 20 之间，可以通过分析序列值的分位数分布来辅助决定。
image_size: 同GAF，用于控制输出尺寸。
strategy: 分箱策略，如'uniform'（等宽）、'quantile'（等频）、'normal'（基于高斯分位数）。对于非均匀分布的数据，'quantile'通常是更安全的选择。

RP 参数调优：

dimension(m) 和time_delay(τ)：这两个参数共同决定相空间重构的质量。需要谨慎选择，常用方法有互信息法（找τ）和虚假最近邻法（找m）。对于初学者，可以尝试m=3-10,τ=1（对于没有明显周期性的序列）或一个周期长度的1/4。
threshold: 决定两个状态多“近”才算递归。'point'按距离百分比阈值，'distance'按绝对距离阈值。'point'更常用，percentage参数通常设置在5%-20%。
percentage/epsilon: 阈值大小。百分比越小或epsilon越小，递归条件越严格，图像越稀疏。

STFT 参数调优：

nperseg: 窗口长度。这是时频分辨率权衡的关键。长窗口 → 高频率分辨率，低时间分辨率（适合分析缓慢变化的频率成分）。短窗口 → 高时间分辨率，低频率分辨率（适合分析瞬态信号）。需要根据信号中感兴趣成分的持续时间来选择。
noverlap: 窗口重叠长度。通常设置为nperseg // 2（50%重叠），这是较好的折衷，能减少频谱泄漏并提供更平滑的时频图。
window: 窗函数类型。'hann'（汉宁窗）是最常用的，旁瓣衰减好。'boxcar'（矩形窗）频率分辨率最高但旁瓣严重。

CWT 参数调优：

wavelet: 小波基函数。'morl'（Morlet小波）适用于一般性时频分析；'cmor'（复Morlet小波）能提供相位信息；'db'系列（Daubechies）适用于信号压缩和去噪。对于特征提取，'morl'或'cmor'是好的起点。
scales: 尺度序列。尺度与频率成反比。可以通过pywt.scale2frequency将尺度转换为近似频率。通常使用对数间隔的尺度，以覆盖宽广的频率范围：scales = np.arange(1, 128)或scales = np.logspace(np.log2(1), np.log2(128), num=100, base=2)。

4. 高级应用与性能优化策略

掌握了基础选型和调参后，我们来看看如何将这些技术应用到更复杂的场景，并解决实际工程中的性能瓶颈。

4.1 融合多种表示：构建多通道图像输入

为什么非要只选一种呢？对于复杂的任务，我们可以将多种转换方法生成的图像堆叠起来，形成一个多通道的“超图像”，作为CNN的输入。这类似于彩色图像的RGB三通道，每个通道提供了数据的不同视角。

例如，对于心电图心律失常分类，一个三通道的图像可以这样构建：

通道1 (R): GASF图像– 捕捉周期性和趋势。
通道2 (G): MTF图像– 捕捉状态转移和幅值分布。
通道3 (B): RP图像– 捕捉动力学递归特性。

这样，CNN可以同时从多个维度学习特征，往往能取得比单通道更好的效果。

import numpy as np from pyts.image import GramianAngularField, MarkovTransitionField, RecurrencePlot def create_multi_channel_image(series, image_size=224): """将一维序列转换为三通道图像 (GASF, MTF, RP)""" series_2d = series.reshape(1, -1) # 通道1: GASF gasf = GramianAngularField(method='summation', image_size=image_size) ch1 = gasf.transform(series_2d)[0] # 形状 (image_size, image_size) # 通道2: MTF mtf = MarkovTransitionField(n_bins=12, image_size=image_size, strategy='quantile') ch2 = mtf.transform(series_2d)[0] # 通道3: RP rp = RecurrencePlot(dimension=3, time_delay=10, threshold='point', percentage=10, image_size=image_size) ch3 = rp.transform(series_2d)[0] # 堆叠成三通道图像 multi_channel_img = np.stack([ch1, ch2, ch3], axis=-1) # 形状 (image_size, image_size, 3) # 可选：归一化各通道到[0,1]区间，便于网络训练 for i in range(3): min_val, max_val = multi_channel_img[:,:,i].min(), multi_channel_img[:,:,i].max() if max_val > min_val: multi_channel_img[:,:,i] = (multi_channel_img[:,:,i] - min_val) / (max_val - min_val) return multi_channel_img # 使用示例 sample_ecg = ecg_signal[:1000] # 取一段ECG multi_channel_ecg = create_multi_channel_image(sample_ecg, image_size=128) print(f“多通道图像形状：{multi_channel_ecg.shape}”) # (128, 128, 3) # 可以像处理普通图像一样，输入到CNN中 # 例如，使用TensorFlow/Keras # input_layer = tf.keras.layers.Input(shape=(128, 128, 3)) # ... 后续CNN层 ...

4.2 处理超长序列：分段与聚合策略

工业传感器数据或长时间序列动辄数十万、百万点。直接转换会生成巨大的、稀疏的、计算昂贵的图像。以下是几种实用策略：

分段转换，然后池化或堆叠：将长序列切成固定长度的片段，对每个片段分别进行图像转换，然后：
- 池化：对每个片段图像提取特征（如用预训练的CNN），然后对所有片段的特征进行平均或最大池化，得到一个全局特征向量。
- 堆叠：将片段图像在通道维度或空间维度堆叠，形成一个“图像立方体”，输入到3D CNN或CNN+RNN混合模型中。
使用PAA（分段聚合近似）进行降维：如之前代码所示，在图像转换前，先用PAA将序列压缩到 manageable 的长度（如256或512点）。
调整image_size参数：pyts库中的图像转换器都支持image_size参数，它内部会使用插值或聚合方法将图像缩放到指定尺寸。这是最简单直接的方法，但可能会损失细节。

# 策略1：分段转换示例 def segment_and_convert(long_series, segment_len=500, image_size=64, method='gasf'): """将长序列分段并转换为图像列表""" n_segments = len(long_series) // segment_len images = [] for i in range(n_segments): seg = long_series[i*segment_len:(i+1)*segment_len] seg_2d = seg.reshape(1, -1) if method == 'gasf': transformer = GramianAngularField(image_size=image_size) elif method == 'mtf': transformer = MarkovTransitionField(image_size=image_size) elif method == 'rp': transformer = RecurrencePlot(image_size=image_size) else: raise ValueError("Method not supported") img = transformer.transform(seg_2d)[0] images.append(img) return np.array(images) # 形状 (n_segments, image_size, image_size) # 策略3：直接调整image_size long_series = np.random.randn(1, 50000) gaf_fast = GramianAngularField(image_size=64) # 直接输出64x64的小图 small_image = gaf_fast.transform(long_series) print(f“直接缩放后的图像尺寸：{small_image.shape}”)

4.3 与深度学习框架的集成

生成的图像可以无缝集成到主流深度学习框架中。这里以PyTorch为例，展示一个简单的数据加载器：

import torch from torch.utils.data import Dataset, DataLoader from pyts.image import GramianAngularField import numpy as np class TimeSeriesImageDataset(Dataset): """自定义数据集，将时间序列实时转换为图像""" def __init__(self, time_series_data, labels, image_size=224, method='gasf'): self.data = time_series_data # 形状 (n_samples, seq_len) self.labels = labels self.image_size = image_size self.method = method if method == 'gasf': self.transformer = GramianAngularField(image_size=image_size) # ... 可以扩展其他转换方法 def __len__(self): return len(self.data) def __getitem__(self, idx): series = self.data[idx].reshape(1, -1) # 保持2D输入 image = self.transformer.transform(series)[0] # 转换为图像，形状 (H, W) image = torch.FloatTensor(image).unsqueeze(0) # 增加通道维 -> (1, H, W) label = torch.LongTensor([self.labels[idx]]) return image, label # 模拟数据 n_samples = 1000 seq_len = 1000 X_train = np.random.randn(n_samples, seq_len) y_train = np.random.randint(0, 3, n_samples) # 3个类别 # 创建数据集和数据加载器 dataset = TimeSeriesImageDataset(X_train, y_train, image_size=128, method='gasf') dataloader = DataLoader(dataset, batch_size=32, shuffle=True) # 在训练循环中使用 for batch_imgs, batch_labels in dataloader: # batch_imgs: (32, 1, 128, 128) # batch_labels: (32, 1) # ... 输入到CNN模型 ... pass

4.4 计算效率考量与加速技巧

对于大规模数据集，图像转换可能成为训练流程的瓶颈。以下是一些加速建议：

并行化：pyts库的transform方法本身支持对多个样本进行批量处理，内部有优化。确保一次性传入形状为(n_samples, n_timestamps)的数据，而不是在循环中单个处理。
缓存：如果数据集固定且转换参数不变，强烈建议预先计算并保存所有图像，而不是在每次训练epoch中实时转换。这能极大减少I/O和计算开销。
使用更快的实现：对于GAF，有研究指出可以通过三角恒等式优化计算，避免昂贵的三角函数运算。也可以探索基于NumPy向量化或CUDA的自定义实现。
降低图像分辨率：在模型精度允许的范围内，使用较小的image_size。64x64或128x128的图像通常已经能为CNN提供足够的信息，并且计算和内存开销远小于224x224。
选择性转换：在多通道融合策略中，并非所有通道都同等重要。可以通过消融实验，只保留对任务贡献最大的1-2种转换方法，减少计算量。

将一维数据转化为图像，远不止是简单的格式变换。它是一次思维的跨界，让我们得以用计算机视觉的利器，去解决时间序列领域的难题。从GAF的极坐标美学，到MTF的概率图景，从RP的动力学洞察，到时频分析的经典与多尺度视角，每一种方法都是一扇独特的窗口，照亮了数据的不同侧面。在实际项目中，我常常会先快速生成所有五种方法的图像进行人工观察，看看哪种图像的纹理模式与我的业务直觉最吻合，然后再进行大规模的自动化实验。这个过程本身，就是加深对数据理解的过程。记住，没有“最好”的方法，只有“最合适”的场景。希望本文提供的对比框架和实战指南，能帮助你在下一次面对蜿蜒曲折的序列数据时，能更自信地选择那位最得力的“图像翻译官”，从而解锁更深层次的洞察与更强大的模型性能。

查看全文

http://www.jsqmd.com/news/473686/