当前位置: 首页 > news >正文

1998-2026年EarthScope波形数据集

摘要本数据集为通过 EarthScope NSF SAGE Facility Web Services 获取的 IU.ANMO 台站连续地震波形数据。波形数据由 fdsnws-dataselect 服务返回并保存为 miniSEED 文件,台站与仪器响应元数据由 fdsnws-station 服务返回并保存为 StationXML 及文本清单。此数据集共 10028 个 .mseed 文件,总体量约 60.04 GB(55.92 GiB),已保存文件名覆盖的时间范围为 1998-10-26T20:00:00Z 至 2026-04-08T00:00:00Z。数据查询参数为网络、台站、位置码、通道标识以及起止时间,适用于地震事件波形截取与回放、震相拾取、频谱分析、噪声分析、仪器响应校正以及后续机器学习样本构建等研究工作。

关键词:地震波形数据;miniSEED;fdsnws;StationXML

引 言

连续地震波形记录是地震学研究、台站运行评估和地球内部结构分析的重要基础数据。与事件目录不同,连续波形以时间序列方式记录地面运动,可在后续分析中按照研究需要截取任意时间窗,支持从单次事件回放到长期背景噪声监测的多类任务。

本数据集聚焦 IU 网络 ANMO 台站的 00 位置码宽频通道组,台站元数据清单显示当前开放历元相关通道坐标约为纬度 34.94591,经度 -106.4572,历史采样率包含 20.040.0 Hz。数据时间跨度长、文件粒度清晰,便于开展跨年度的连续波形检索、质量检查和再加工。

1数据采集和处理方法

1.1数据采集方法

本数据集通过本地脚本 download_continuous_waveforms.py 调用 EarthScope Web Services 获取。波形服务接口为 https://service.earthscope.org/fdsnws/dataselect/1/,台站服务接口为 https://service.earthscope.org/fdsnws/station/1/。波形请求使用 net=IU、sta=ANMO、loc=00、cha=BH?,所有起止时间均采用 UTC。台站元数据通过 station 服务获取,清单查询示例为:https://service.earthscope.org/fdsnws/station/1/query?net=IU&sta=ANMO&loc=%2A&cha=BH%3F&level=channel&format=text。本地 inventory_summary.csv 显示,位置码 00 下与 BH? 对应的主要通道包括 BH1、BH2 和 BHZ,采样率包含 20.0、40.0 Hz,传感器记录包括 Geotech KS-54000 Borehole Seismometer、Streckeisen STS-6A VBB Seismometer。

1.2数据处理

下载过程按 UTC 时间块组织请求,主体历史数据以日为单位保存,部分边界或测试时间窗为小时级或不足一天的时间块。服务返回成功后,波形以 miniSEED 原始格式写入 mseed 目录;台站响应元数据写入 stationxml 目录;每次请求的状态、HTTP 状态码、字节数、查询参数、保存路径和保存时间写入 manifest.jsonl。

2数据样本描述

本数据集共包含 10028 个 miniSEED 文件,总体量约 60.04 GB(55.92 GiB)。单个文件大小最小约 0.012 MB,平均约 5.99 MB,最大约 13.63 MB。已保存文件名记录的波形时间范围为 1998-10-26T20:00:00Z 至 2026-04-08T00:00:00Z。manifest 查询窗口范围为 1998-10-26T20:00:00Z 至 2026-04-08T05:29:39Z,其中最后一个查询窗口返回 no_data,因此未形成对应波形文件。文件命名格式为“网络.台站.位置码.通道组.开始时间_结束时间.mseed”。例如 IU.ANMO.00.BHQ.1998-10-26T200000Z_1998-10-27T000000Z.mseed 表示 IU.ANMO.00.BH? 通道组在 1998-10-26T20:00:00Z 至 1998-10-27T00:00:00Z 时间段内的波形数据。

manifest.jsonl 当前共记录 10035 条请求,其中 downloaded 为 10028 条,no_data 为 7 条。no_data 时段主要包括 2000-11-10 至 2000-11-12、2022-05-07 至 2022-05-08、2025-03-22 至 2025-03-25 以及 2026-04-08 的部分查询窗口。

3 数据质量控制和评估

本数据集的基础质量控制首先依赖 EarthScope 服务端返回结果与本地 manifest 记录。HTTP 200 的请求被保存为 downloaded,HTTP 204 等无数据响应被记录为 no_data,不以空文件替代。manifest 中的字节数与 mseed 目录中文件总量一致,可用于核对下载完整性和排查重复请求。

台站与仪器响应信息以 StationXML 和 inventory 清单形式保留,可用于检查通道可用性、采样率、传感器类型、方位角、倾角和响应系数。对于正式科研分析,建议在读取 miniSEED 后进一步执行缺测、重叠、突跳、饱和、异常振幅和响应恢复检查,并以 UTC 时间作为所有切片和事件匹配的统一时间基准。

本地目录名 IU.ANMO.00.BHQ 中的 BHQ 是整理时使用的通道组标签,不应理解为单一标准通道名。实际下载查询使用 BH? 通配符,后续读取 miniSEED 时应结合 StationXML 或文件内部 trace header 识别具体通道。当前说明未对波形做重采样、滤波或事件截取,数据仍保持为服务返回的连续波形文件。

需要注意的是,本数据集是连续波形数据而非“一个事件一条记录”的结构化事件目录。no_data 时间块在长期连续归档中较常见,分析时应根据 manifest 和实际 trace coverage 明确可用时间窗。

4数据价值

本数据集的价值在于提供了 ANMO 台站较长时间跨度的连续宽频波形及配套元数据。相较于只保存事件截取波形的数据产品,连续 miniSEED 文件允许研究者根据任意地震目录、震相到时或自定义触发条件回溯截取波形,并可重复开展滤波、谱分析、仪器响应校正和噪声互相关等处理。

EarthScope 提供的 FDSN Web Services 是地震波形和台站元数据获取的标准化接口。本数据集利用其中的 dataselect 服务下载连续波形,利用 station 服务补充通道、采样率、传感器和仪器响应信息,使波形文件与元数据能够在 ObsPy、SeisComP、SAC 等常用地震学软件中配套使用。

数据同时保留了请求清单、StationXML 响应和通道清单,便于复现实验流程、评估数据覆盖度,并为事件检测、震相识别、背景噪声监测、台站长期运行状态分析和机器学习样本构建提供稳定的数据底座。

参考文献

[1] EarthScope Consortium. FDSN Web Services 总入口:https://service.earthscope.org/fdsnws/.

[2] EarthScope Consortium. fdsnws-dataselect 波形服务:https://service.earthscope.org/fdsnws/dataselect/1/.

[3] EarthScope Consortium. fdsnws-station 台站服务:https://service.earthscope.org/fdsnws/station/1/.

http://www.jsqmd.com/news/674999/

相关文章:

  • GLM-4.1V-9B-Base与Claude对比分析:多模态理解与代码生成能力评测
  • 04-12-02 技术小组长 - 学习笔记
  • 图片旋转判断在增强现实中的关键作用
  • VOOHU:组合电感在多相DC-DC变换器中的选型与应用解析
  • 2026年知名的家居除尘印花抹布/宁波印花抹布批量采购厂家推荐 - 行业平台推荐
  • AI+3D赋能文科教学:15个可直接使用的高质量可视化Prompt(历史/地理/文化)
  • AI修图师行业落地:教育领域课件插图智能编辑实践
  • quot;健身会员管理系统:一键注册预约全攻略quot;
  • Phi-3-mini-128k-instruct部署指南:vLLM引擎配置参数详解(tensor-parallel等)
  • 04-12-03 管理员工 - 学习笔记
  • 为什么要学习AI大模型?掌握AI大模型:抢占未来职场制高点,成为高薪抢手人才!
  • 鸿蒙6设备数破5500万!今日正式发布鸿蒙6.1,40+系列机型可体验
  • Python的__getattribute__方法性能瓶颈与属性访问缓存优化在热点路径
  • CSS如何实现响应式图片懒加载动画_结合CSS关键帧与占位符技术
  • 企业级开源治理的进阶选择:深度解析Gitee CodePecker SCA的核心优势
  • 华为坤灵,如何解闽商智能化之需? - 科技行者
  • 集成测试多步骤 Agent 工作流
  • egergergeeert惊艳效果:12张干净背景+高细节插画的生成效果合集
  • 保姆级教程:手把手教你修改展讯Android设备的蓝牙、Wi-Fi热点和运营商名称
  • 盛科CTC8096 40G交换芯片常用命令
  • 《JVS-APS全景解读:算法驱动+低代码融合的智能排产系统》
  • M12连接器的线缆材质怎么选?PUR还是PVC的实战对比
  • Real-Anime-Z实战教程:用Jupyter Lab动态加载不同LoRA并批量生成对比图
  • 第14篇:嵌入式核心控制外设:TI C2000 HRPWM模块原理与工业应用
  • 前端基础:form和input用法详解
  • C3 vs Zig:2026年,谁才是真正能“修复”C语言的救星?
  • Phi-3.5-mini-instruct高性能部署:device_map=‘auto‘自动分配多GPU负载方案
  • 2026年比较好的扬州老房翻新装修公司/扬州现代简约装修公司回头客推荐 - 品牌宣传支持者
  • 每日一篇:AgentDR
  • 2026年GEO排名优化服务商实力测评,看完不踩坑