当前位置: 首页 > news >正文

Vision Transformer在径向速度法系外行星探测中的应用与实现

1. 项目概述:当ViT遇见恒星光谱

在系外行星猎手的工具箱里,径向速度法(Radial Velocity Method)无疑是一把历经考验的“老枪”。它的原理优雅而直接:一颗看不见的行星在绕其母星公转时,其引力会使恒星产生微小的周期性摆动。通过分析恒星光谱线的多普勒频移,我们就能反推出这颗行星的存在,甚至估算其质量。自1995年首次发现飞马座51b以来,这个方法已经发现了数百颗系外行星。

然而,这把“老枪”正面临着一个越来越棘手的敌人:恒星抖动(Stellar Jitter)。想象一下,你试图在波涛汹涌的海面上,用肉眼观测远处一艘小船产生的微小涟漪。恒星表面的黑子、耀斑、对流活动等,就像海面上的风浪,会产生与行星引力信号频谱重叠的“噪声”。对于像地球这样,仅能引起太阳约9厘米/秒速度摆动的行星信号,当前的观测精度(约1米/秒)和恒星抖动带来的干扰,使得探测工作如同大海捞针。

传统上,天文学家依赖Lomb-Scargle周期图等工具,在观测数据中寻找周期性信号。但面对低振幅信号和复杂的恒星活动噪声,这些方法的灵敏度常常捉襟见肘,导致需要耗费数年甚至更长的观测基线来确认一个候选信号,极大地消耗了宝贵的望远镜时间。

近年来,机器学习,特别是深度学习,为这个经典问题带来了新的曙光。卷积神经网络(CNN)已在处理光谱数据上展现出潜力。而我们这次要深入探讨的,是一个更具颠覆性的架构:Vision Transformer。最初为图像识别而生的ViT,如何被巧妙地“移植”到一维时序光谱数据分析中,并实现了对低至35厘米/秒信号的检测能力?这背后不仅是对工具的跨界应用,更是对数据本质和问题建模方式的重新思考。本文将带你拆解这个基于ViT的径向速度行星信号检测框架,从数据预处理、模型设计到训练策略,完整呈现其如何成为传统周期图方法的一个强劲而稳健的替代方案。

2. 核心挑战与方案设计思路

2.1 恒星抖动:信号提取的“终极干扰”

要理解机器学习方案的价值,首先得看清传统方法面临的“天花板”。恒星抖动并非白噪声,它具有复杂的时空相关性。例如,恒星黑子的出现、穿越和消失,会在光谱中引入与恒星自转周期相关的准周期性信号。这些信号的特征(如形状、强度、演化)与行星开普勒轨道产生的纯粹多普勒频移截然不同,但在仅观测径向速度时间序列时,它们的频谱特征可能非常相似。

传统的数据驱动方法,如高斯过程(Gaussian Process)建模,通过构建协方差函数来拟合这种相关性噪声。虽然有效,但其性能严重依赖于先验核函数的选择,且计算成本高昂。另一种思路是利用活动指标(如Hα线、Ca II H&K线强度)与径向速度变化进行解相关。然而,这些指标与径向速度抖动之间的关系并非总是线性的,且不同恒星、不同活动周期的表现差异很大。

问题的核心在于,传统方法大多在“径向速度点”的层面进行操作,即先对每张光谱进行复杂的处理,提取出一个代表该时刻恒星视向速度的标量值,然后再在这些点构成的时间序列上进行分析。这个过程中,大量蕴含在原始光谱线轮廓、形状、不对称性中的物理信息被丢弃或平均掉了。而这些被丢弃的信息,恰恰可能是区分行星信号和恒星活动噪声的关键。

2.2 Vision Transformer:从图像到光谱的范式迁移

Vision Transformer的突破性在于其“自注意力”(Self-Attention)机制。与CNN的局部感受野不同,自注意力机制允许模型在序列的任意两个位置之间建立直接联系,无论它们相距多远。这使得ViT能够全局地理解一张图像的各个部分是如何关联的。

那么,如何将一维的时间序列光谱数据“喂”给一个为二维图像设计的模型呢?这里的创新点在于数据表示。研究团队没有直接使用原始光谱(那将是百万像素级的超长一维向量),也没有直接使用径向速度点序列(信息损失太大)。他们设计了一个中间表示:拼接交叉相关函数(Concatenated Cross-Correlation Function, 1D-CCCF)向量

简单来说,这个过程是:

  1. 光谱线分组:从光谱中挑选出大量(如数千条)有代表性的吸收线。根据其深度(与形成高度和温度相关)将这些谱线分成若干组(例如10组)。
  2. 分组计算CCF:对每一组谱线,计算其平均的交叉相关函数(CCF)。CCF可以看作是该组谱线平均轮廓的另一种表示,它有一个中心凹陷(对应谱线中心),轮廓形状包含了谱线的宽度、不对称性等信息。
  3. 拼接与裁剪:将10组CCF在速度轴方向(通常是-12.5到+12.5 km/s的窗口)裁剪后,首尾拼接起来,形成一个长的1D向量。同时,将几条对恒星活动特别敏感的谱线(如Ca II H&K, Hα)的归一化强度值也拼接到这个向量末尾。
  4. 构建“光谱图像”:对于一个包含100次观测(100个epoch)的时间序列,将每个epoch对应的1D-CCCF向量作为一行,堆叠起来,就形成了一个100行、1722列的二维矩阵。这个矩阵,就是输入给ViT的“图像”。

注意:这种表示法的精妙之处在于,它既大幅压缩了数据量(从百万像素到千像素级),又保留了光谱线的轮廓信息和活动指标。每一行(一个epoch)是一个静态的“光谱快照”,而从上到下的行序列则构成了随时间变化的“电影”。ViT的任务,就是从这部“电影”中,识别出由行星轨道运动引起的、有规律的全局平移模式,并将其与恒星活动引起的局部轮廓扭曲和变化区分开来。

2.3 分类而非回归:提升低信噪比下的稳定性

另一个关键设计选择是将一个回归问题(预测连续的轨道周期和半振幅)转化为一个分类问题。初步实验表明,在低信噪比条件下,让模型直接输出连续的参数值(回归)会导致训练不稳定、难以收敛。

因此,团队将参数空间离散化:

  • 轨道周期(P):在12到365天的范围内,按对数尺度均匀划分为10个区间(bin),标签为0-9。
  • 半振幅(K):在0.05到3 m/s的范围内,按线性尺度均匀划分为5个区间,标签为0-4。

模型的任务变为:输入一个100x1722的“光谱图像”,输出两个概率分布,分别表示该信号属于各个周期区间和半振幅区间的可能性。这种“分桶”策略带来了多重好处:

  1. 训练稳定:分类任务的损失函数(如交叉熵)通常比回归的均方误差更易于优化。
  2. 提供不确定性度量:模型输出的概率分布本身就可以作为预测置信度的一种衡量。例如,如果模型对“周期在bin 5”的概率是90%,而对其他bin的概率都很低,那么这个预测就很可信;如果概率分布很平缓,则说明模型不确定。
  3. 更符合实际需求:在行星搜寻的早期阶段,天文学家往往更需要知道“是否存在一个周期在100-150天、振幅约0.5 m/s左右的信号”,而不是一个精确到小数点后很多位的具体数值。分类输出提供了一个粗糙但稳健的“信号地图”,可以高效地筛选出需要后续跟进的候选体。

3. 数据工程:从原始光谱到模型可读的“图像”

3.1 数据源与预处理:打造干净的训练样本

本项目使用的是NEID光谱仪在2020年12月至2022年6月期间���取的太阳“星象”观测数据。将太阳当作一颗普通恒星来观测,可以获得高质量、高时间分辨率的数据,并且其物理特性我们了如指掌,是验证方法的绝佳试验场。

原始数据不能直接使用,必须经过严格的清洗和预处理:

  1. 晴空筛选:太阳是一个有视面的天体,云层遮挡部分日面会严重扭曲光谱线。团队利用与望远镜配套的日射强度计数据,通过计算每日辐照度曲线与当月“晴空模板”的滚动标准差,设定阈值(3 W/m²),自动筛选出受云影响小的观测数据。
  2. 数据质量过滤:仅保留高分辨率模式的光谱,并剔除信噪比低于300的曝光,确保数据质量基线。
  3. 连续谱归一化与日心校正:去除光谱仪光栅的闪耀函数影响,并对地球绕日公转和太阳系行星引力引起的多普勒效应进行校正,让光谱回到“静止”的太阳参考系。
  4. 抑制p模振荡:太阳表面存在周期约5分钟的全局振荡(p模),这本身也是一种噪声。通过对连续4个样本(约6分钟窗口)进行局部平均,可以在保留原始采样率的同时,平滑掉这种高频振荡的影响。

3.2 构建1D-CCCF向量:信息浓缩的艺术

这是整个数据流水线的核心步骤,目的是将高维光谱信息浓缩为富含物理意义的低维向量。

  1. 谱线选择与拟合:使用ESPRESSO光谱仪提供的G2V型星(类似太阳)谱线掩模,选取数千条清晰、未严重混合的吸收线。对每条线用高斯轮廓进行拟合,评估其强度和混合程度。
  2. 按深度分组:将筛选后的谱线按其归一化深度分成10组。深度相似的谱线形成于光球层中相近的高度和温度,其行为具有物理相关性。分组计算CCF,相当于对具有相似物理起源的谱线进行“集体投票”,能增强信号,抑制随机噪声。
  3. 生成CCF与裁剪:对每一组谱线计算CCF,得到一个以速度(如-200到+201 km/s)为横轴、相关度为纵轴的轮廓。为了聚焦于行星信号可能存在的速度范围(通常很小),将每个CCF在中心凹陷附近对称裁剪。前7组(较窄的线)用100像素窗口(±12.5 km/s),后3组(较宽深的线)用140像素窗口(±17.5 km/s)。
  4. 拼接与添加活动指标:将10个裁剪后的CCF首尾拼接,得到一个1120维的向量。最后,将6条对恒星活动敏感的谱线(见表1)的归一化强度值追加到向量末尾,形成最终的1722维1D-CCCF向量。这就像为每个观测时刻的光谱制作了一个独特的“指纹”。

3.3 合成数据生成与数据集构建

真实的系外行星观测数据是稀缺的,且我们不知道“标准答案”。因此,需要用“数据合成”的方法来创建带标签的训练集。

  1. 构建时间序列:从清洗后的数据池中,随机抽取100个1D-CCCF向量,代表100次观测。有两种构建方式:一是保持它们原始的时间顺序和间隔(模拟真实不规则采样);二是将它们随机打乱,并赋予一个在1-2年内随机生成的时间戳。
  2. 注入开普勒信号:使用radvel工具,为这个“虚拟”的行星系统生成一组轨道参数(周期P、半振幅K、偏心率e、近心点幅角ω),参数在预设范围内随机抽取。然后,根据每个观测对应的时间戳,计算该时刻行星引起的多普勒速度,并将这个速度对应的频移“注入”到该观测的1D-CCCF向量中。具体实现上,是对CCF轮廓进行相应的平移。
  3. 生成“差异图像”:将100个处理后的向量堆叠成100x1722的矩阵(2D-CCCF)。为了突出观测间的变化,并减少系统误差,计算每一行与第一行的差值。这样,我们得到了一个99x1722的矩阵,这就是最终输入ViT的“图像”。矩阵的每一行代表一次观测相对于参考观测的变化,这种变化既包含了行星信号引起的系统性平移,也包含了恒星活动引起的随机扭曲。
  4. 模拟观测间隙:真实的巡天项目不可能每天观测。为了模拟这一点,在1-2年的观测时间窗内,随机插入一段持续4-6个月的“停机时间”,在此期间没有数据点。

通过这种方式,可以生成海量的、带有精确轨道参数标签的训练样本。在本研究中,生成了约84万个训练样本和50万个验证样本。

3.4 精心设计的数据集划分策略

为了避免模型过拟合到特定时间模式或采样规律,研究团队设计了多层次的数据划分策略,确保评估的严谨性:

  • 划分1(主训练/验证集):将全部35757个1D-CCCF向量按时间不重叠的原则,分为训练集(26777个)和验证集V1(6949个)。在此基础上生成打乱时间戳的样本。
  • 划分2(日间分离验证集V3):从整个19个月的观测中,专门挑出2031个向量,这些向量对应的观测日期与划分1中的任何数据都不同。用这些数据生成验证集V3,用于测试模型对全新时间段的泛化能力。
  • 划分3(月间分离):另一种划分方式是将奇数月的观测用于训练,偶数月的观测用于验证集M。这进一步增加了验证集的时间跨度多样性。

此外,验证集本身也分为不同类别:

  • V1:时间戳打乱的样本(与训练集生成方式相同)。
  • V2:使用划分1的验证集向量,但保持其原始时间顺序,仅将时间轴缩放至与训练集相同的范围。
  • V3/M:使用划分2或划分3的向量,保持其原始时间顺序和绝对时间戳

这种设计使得我们能够全面评估模型:在V1上看它是否学会了识别开普勒信号本身;在V2和V3/M上看它能否在真实的、有时序相关性的恒星活动噪声背景下,依然保持识别能力。

4. 模型架构与训练策略详解

4.1 Vision Transformer模型适配

标准的ViT处理图像时,会将图像分割成固定大小的图块(如16x16像素)。在我们的场景中,“图像”是99x1722的矩阵。一个自然的适配方式是:将每一行(即一个观测epoch的1D-CCCF差分向量)视为一个“图块”

模型的工作流程如下:

  1. 图块嵌入:每个长度为1722的行向量,通过一个可训练的线性投影层,被映射到一个更高维的嵌入空间(例如,512维)。这个嵌入向量代表了该次观测的抽象特征。
  2. 位置编码:由于Transformer本身不考虑输入序列的顺序,必须显式地加入位置信息。这里添加的是可学习的位置编码,与每个“图块”(即每个观测epoch)一一对应。即使输入数据的时间戳是打乱的,模型也能通过学习知道每个数据点在序列中的“位置”。
  3. Transformer编码器:嵌入向量与位置编码相加后,送入由多个Transformer编码器层堆叠而成的核心模块。每个编码器层都包含一个多头自注意力机制和一个前馈神经网络
    • 自注意力机制:这是模型理解“全局上下文”的关键。对于每一个“图块”,自注意力机制会计算它与序列中所有其他“图块”的关联度(注意力权重)。例如,模型可能会学到,第50次观测和第75次观测的特征变化模式,与一个周期为25天的行星信号高度相关。它能够同时关注所有epoch之间的关系,而不是像循环神经网络那样逐次处理。
    • 前馈网络:对自注意力层的输出进行非线性变换,增加模型的表达能力。
  4. 分类头:最后一个编码器层输出的第一个特殊标记([CLS] token)的嵌入向量,被认为聚合了整个序列的全局信息。这个向量被送入两个独立的分类头(全连接层+Softmax),分别输出10维(周期)和5维(半振幅)的概率分布。

4.2 两阶段训练:先学本质,再适应现实

这是本方案训练策略中最精妙的一环,直接决定了模型能否区分行星信号和恒星活动。

第一阶段:在打乱数据上预训练

  • 输入:使用时间戳完全随机打乱的训练样本(V1风格)。这意味着相邻的两行“图像”可能来自相隔数月的真实观测。
  • 目标:在这种设置下,恒星活动引起的时序相关性被彻底破坏。模型无法通过记忆时间模式来作弊。它被迫去学习数据中唯一剩下的、与时间顺序无关的规律:即由同一个开普勒轨道参数所决定的、在不同相位下CCF轮廓应有的系统性平移模式
  • 效果:模型学会了识别“开普勒信号指纹”的本质——一种在速度空间上有规律的偏移模式,而不关心这种模式在时间轴上出现的顺序。这相当于让模型掌握了行星信号最核心的“静态”特征。

第二阶段:在有序数据上微调

  • 输入:使用保持原始时间顺序的样本(V2风格)进行微调。
  • 目标:此时,数据中恢复了真实的恒星活动噪声的时序结构(如与太阳自转周期27天相关的准周期变化)。模型需要在已经学会识别“开普勒指纹”的基础上,学习如何抵抗这种具有时间相关性的干扰。
  • 效果:微调过程让模型适应真实观测场景。它学会了忽略那些虽然随时间变化,但不符合开普勒轨道运动规律的、由活动引起的轮廓扭曲和漂移。实验发现,如果直接从有序数据开始训练,模型容易过拟合到恒星活动的周期性模式上,反而降低了检测真实行星信号的能力。

实操心得:这种“先解耦,再耦合”的训练策略在处理时序信号与噪声分离问题时非常有效。其核心思想是,先在一个简化的、噪声与信号统计独立的设定下,让模型抓住信号最本质的特征。然后再将它置于复杂的真实环境中,进行“适应性训练”。这比一开始就在复杂环境中“摸爬滚打”更容易学到稳健的特征。

4.3 损失函数与优化细节

模型采用交叉熵损失函数,分别计算周期分类和半振幅分类的损失,并将两者加权求和(通常权重各为0.5)作为总损失。优化器选用带动量的随机梯度下降(SGD),初始学习率设为1e-3,并可能配合学习率调度器。

训练过程中,在独立的验证集(如V1)上监控损失和准确率。保存验证集性能最好的模型权重,用于最终的测试和推理。

5. 结果分析与性能评估

5.1 在打乱数据上的表现:验证核心能力

在时间戳打乱的验证集(V1)上,模型的分类准确率达到了86%。这是一个非常强劲的结果,它证明了模型确实成功地学会了从“光谱图像”中提取开普勒轨道信号的关键特征,而不依赖于任何时间序列的先后顺序。

为了更直观地展示模型的性能,可以构建混淆矩阵回收率(Recovery Rate)曲线

  • 混淆矩阵:可以清晰显示模型在哪些周期区间或振幅区间容易混淆。例如,模型可能会将周期在bin 4(例如~80天)的信号误判为bin 5(~110天),但很少会误判为bin 1(很短周期)或bin 9(很长周期)。这说明模型学到了周期的大致尺度。
  • 回收率曲线:这是评估探测能力的关键指标。对于不同半振幅(K)和周期(P)的注入信号,统计模型能正确检测出(即分类到正确或相邻区间)的比例。结果显示,即使在半振幅低至0.65 m/s时,模型仍能保持较高的回收率。在信噪比极低(K < 0.5 m/s)的区域,模型的性能显著优于传统的Lomb-Scargle周期图。

5.2 在有序数据上的表现:对抗恒星活动噪声

真正的考验在于有序数据(V2, V3)。这里,模型需要面对具有真实时间相关性的太阳活动噪声。

研究团队进行了注入-回收测试:从NEID太阳数据中随机选取100个观测epoch的子集,注入模拟的行星信号,然后用训练好的模型和Lomb-Scargle周期图分别进行检测对比。

核心结论:对于低振幅系统(半振幅 < 1 m/s),本方法相比传统Lomb-Scargle周期图,将行星候选体的识别率提高了约两倍。特别是在较长轨道周期的区域,优势更加明显。这是因为长周期信号在有限的观测时间窗内周期数少,传统周期图的分辨率有限,而ViT模型通过分析全局的、与相位相关的谱线变化模式,对周期不完整性有更好的鲁棒性。

更令人印象深刻的是,即使在真实的太阳噪声和不规则采样的条件下,模型对信号的检测下限可以达到35 cm/s。这已经逼近了未来旨在探测类地行星的极端精密径向速度(EPRV)仪器的目标精度。

5.3 与传统方法的对比优势

  1. 信息利用更充分:传统周期图仅在提取的径向速度点序列上操作,丢失了光谱轮廓信息。ViT模型直接处理包含谱线轮廓和活动指标的CCCF“图像”,利用了全部可用信息。
  2. 对不规则采样不敏感:周期图在不规则采样数据上的性能会下降,需要复杂的窗函数校正。Transformer的自注意力机制天然地处理序列,对数据点之间的时间间隔没有均匀性要求。
  3. 抗相关噪声能力强:通过两阶段训练,模型被明确教导去区分与时间顺序无关的行星信号和与时间相关的恒星活动模式。而周期图容易将恒星旋转等周期性活动误判为行星信号。
  4. 提供概率化输出:模型输出的是分类概率分布,这为后续的统计验证(如贝叶斯模型比较)提供了自然的先验或似然估计,而周期图只提供一个功率值。

6. 常见问题、局限性与未来展望

6.1 实操中可能遇到的问题与排查

  1. 数据预处理不一致导致性能下降

    • 问题:自己处理的光谱数据生成的1D-CCCF向量,与论文中使用的数据分布有差异,导致训练好的模型直接应用时效果很差。
    • 排查:首先确保使用的谱线列表、分组方式、CCF计算窗口、活动线归一化方法与原文完全一致。可以尝试在少量经过严格按论文流程处理的数据上运行模型,看性能是否恢复。建议开源代码和数据处理脚本,以保证可复现性。
    • 心得:天文机器学习项目中,数据流水线的复现往往比模型代码的复现更困难、也更重要。建立一个与训练数据生成完全一致的预处理管道是成功应用模型的前提。
  2. 模型对新的恒星类型泛化能力不足

    • 问题:模型在太阳数据上训练得很好,但应用到另一颗活跃的M型矮星数据时,检测能力骤降。
    • 排查:太阳是一颗G型星,其活动特性(黑子周期、耀斑频率等)与M型矮星差异巨大。模型可能过拟合了太阳活动特有的模式。
    • 解决思路:需要进行迁移学习或领域自适应。一种策略是使用物理模拟或数据增强技术,生成包含多种恒星活动类型和强度的人工数据集进行预训练,然后再用目标星的少量真实数据(或高质量模拟数据)进行微调。在微调时,可以冻结模型的前几层(学习通用特征),只训练最后的分类头。
  3. 计算资源与训练时间

    • 问题:Transformer模型参数量���,训练需要大量GPU内存和时间。
    • 优化建议
      • 降低“图像”尺寸:可以考虑减少CCCF向量的长度(如通过PCA进一步降维)或减少观测epoch的数量(如从100减至50),但这可能会损失信息。
      • 使用更小的ViT变体:如ViT-Small或ViT-Tiny。
      • 混合精度训练:使用PyTorch的AMP(自动混合精度)模块,可以大幅减少GPU内存占用并加速训练。
      • 梯度累积:当GPU内存不足以容纳大的批次时,可以通过多次前向传播累积梯度,再一次性更新参数,模拟大批次训练的效果。

6.2 当前方法的局限性

  1. 对多行星系统的处理:当前模型被设计为检测单一行星信号。对于多行星系统,开普勒信号是多个周期性信号的叠加,情况更为复杂。一种扩展思路是将任务改为“是否存在信号”的二元分类,然后配合周期图或其他方法进行后续分析。或者,探索多标签分类,让模型同时预测多个周期/振幅区间的存在概率。
  2. 偏心率与轨道相位:目前模型只预测周期和半振幅,忽略了偏心率(e)和近心点幅角(ω)。高偏心率轨道产生的径向速度曲线并非正弦波,模型可能无法准确识别。未来可以将偏心率也纳入分类参数,或者开发能输出完整轨道参数的回归-分类混合模型。
  3. 对极端活动星的适应性:对于比太阳活跃得多的恒星,其活动噪声的幅度和复杂度可能远超模型在太阳数据上学到的模式。这需要更多样化的训练数据。
  4. 解释性问题:Transformer模型是“黑箱”,我们难以理解它究竟依据“光谱图像”中的哪些具体特征做出了判断。未来可以结合注意力权重可视化等方法,尝试理解模型的决策依据,这不仅能增加可信度,还可能反过来帮助天体物理学家发现新的、对活动不敏感的光谱诊断指标。

6.3 未来发展方向与应用前景

  1. 实时候选体筛选工具:该框架最大的应用前景在于成为EPRV巡天项目的实时或近实时数据处理管道的一部分。望远镜每晚获得的新光谱,可以快速与历史数据一起组成时间序列,输入模型进行快速扫描。模型可以给出存在潜在行星信号的置信度及大致参数区间,帮助天文学家优先安排对高置信度候选体的后续跟踪观测,极大优化望远镜时间分配。
  2. 与其他方法的融合:机器学习方法并非要完全取代传统方法,而是与之互补。例如,可以用ViT模型进行初筛,快速从数百个目标中找出几十个最有可能的候选体。然后,对这些候选体使用更耗时但更精确的贝叶斯方法(如高斯过程回归结合开普勒轨道模型)进行深入分析和参数精确测定。
  3. 扩展到直接光谱分析:当前方法依赖于CCCF这个中间表示。一个更激进的思路是探索端到端的模型,直接将多历元的光谱(或经过初步归一化的光谱)作为输入,让模型自己学习最有利于区分行星和活动的特征表示。这需要更庞大的模型和计算资源,但可能是终极解决方案。
  4. 构建社区基准与开源生态:推动此类研究发展的关键是开源的数据集、基准测试和预训练模型。未来可以建立一个包含不同恒星类型、不同活动水平、不同信噪比注入信号的标准化数据集,用于公平比较各种机器学习算法的性能。

这项工作清晰地展示了,当现代机器学习架构与深厚的天体物理领域知识相结合时,能够为解决传统方法遭遇瓶颈的经典科学问题开辟新的道路。将Vision Transformer应用于径向速度分析,不仅仅是一次成功的技术迁移,更代表了一种思维模式的转变:从“提取数字,再分析数字”到“让算法直接从原始数据中学习物理规律”。尽管前路仍有挑战,但这条道路无疑为在恒星活动的“波涛”中,更敏锐地聆听那些来自遥远地球的“微小涟漪”,带来了新的希望。

http://www.jsqmd.com/news/882104/

相关文章:

  • 别再死磕光线追踪了!用Unity Shader Graph 5分钟搞定皮肤/玉石SSS次表面散射效果
  • Windows Subsystem for Android深度技术解析:开发者视角的跨平台集成方案
  • Keil C166中xhuge指针与内存模型问题解决方案
  • Unity在Ubuntu上播放本地视频踩坑记:从‘路径无效’到‘编码转换’的完整解决流程
  • FSM-DQN混合控制:仿蚁群机器人集群去中心化空间分离策略
  • 【问题】IDEA import导入的类明明存在却报异常飘红
  • Comba架构:基于双线性RNN的高效序列建模新方法
  • 2026年4月TD6-140钢扣板实力厂家推荐,钢楼承板/压型钢板/钢结构楼承板/镀锌楼承板,钢扣板企业选哪家 - 品牌推荐师
  • Godot逆向工具链:PCK解包与GDScript反编译实战指南
  • Unity ASW风格格斗Shader实战:描边、阴影与受击反馈系统
  • Unity项目发布踩坑记:从Mono切换到IL2CPP,我解决了哪些环境配置问题?
  • 电梯定位新思路:融合物理模型与机器学习,实现高精度连续位置追踪
  • git的使用技巧汇总
  • SLED框架:边缘计算中的LLM推理加速方案
  • 告别黑屏和进度条卡住:深度排查Unity WebGL在360、Chrome等浏览器的兼容性问题
  • 量子机器学习与参数化量子电路的创新突破
  • 随机奖励机SRMI:处理非马尔可夫与随机奖励的强化学习新框架
  • 拉格朗日与哈密顿力学在物理系统建模中的等价性与应用
  • HTTPS抓包失败的七层根因与实战定位法
  • OPENFACE 3.0:轻量级多任务人脸行为分析技术解析
  • 不贵其师,不爱其资,SAP HANA 开发里的师与资
  • 机器学习力场泛化难题:测试时训练与半径精修技术解析
  • 基于时间序列与机器学习的杠铃深蹲智能诊断系统构建
  • 机器学习加速宇宙学参数估计:从神经代理模型到贝叶斯推断实战
  • pyuv API参考手册:掌握异步网络、文件系统和定时器核心接口
  • FuncGNN:基于图神经网络的集成电路分析新方法
  • 自动驾驶多摄像头三平面令牌化技术解析
  • RTXv5迁移中netInitialize()硬件错误的解决方案
  • 如何轻松配置洛雪音乐音源:免费获取全网无损音乐的完整指南
  • AI联动IDA Pro实现本地化APK通信包解密