mseed

miniSEED 是SEED 格式的子集，一般用于地震学时间序列数据的归档和交换。DolphinDB 的 mseed 插件可以读取 miniSEED 文件的数据到 DolphinDB 的内存表中，且可以将 DolphinDB 的一段连续时间的采样值写入到 miniSEED 格式的文件中。本插件使用了 IRIS 的 libmseed 开源库的读写接口。

安装插件

版本要求

DolphinDB Server: 2.00.10 及更高版本，支持 Linux x86-64, Windows x86-64。

安装步骤

在 DolphinDB 客户端中使用 listRemotePlugins 命令查看插件仓库中的插件信息。

注意：仅展示当前操作系统和 server 版本支持的插件。若无预期插件，可自行编译（请自行选择对应分支下的插件）或在 DolphinDB 用户社区进行反馈。

login("admin", "123456")
listRemotePlugins()

使用 installPlugin 命令完成插件安装。

installPlugin("mseed")

使用 loadPlugin 命令加载插件。

loadPlugin("mseed")

接口说明

read

语法

read(file)

详情

读取一个 miniSEED 文件。

返回一个内存表，包含如下字段：

value：列类型为 INT, FLOAT 或 DOUBLE，读取到的采样值。
time：列类型为 TIMESTAMP，采样值对应的时间戳。
id：列类型为 SYMBOL，采样值所在块的 sid。

参数

file STRING 类型标量，表示需要读取的 miniSEED 文件所在的绝对路径。

例子

ret=read("<FileDir>/SC.JZG.00.BHZ.D.2013.001");

write

语法

write(file, sid, startTime, sampleRate, value, [overwrite=false])

详情

将一段连续的采样值写入到 miniSEED 文件。

返回一个布尔标量，返回 true 时表示是否成功写入。

参数

file STRING 类型标量，表示需要写入的 miniSEED 文件所在的绝对路径。

sid STRING 类型标量，表示写入到 miniSEED 文件的一个块的 sid。

startTime TIMESTAMP 类型标量，表示写入到 miniSEED 文件一个块的 startTime。

sampleRate INT, LONG, FLOAT 或 DOUBLE 类型标量，表示写入到 miniSEED 文件的 sampleRate。

value INT, FLOAT, DOUBLE 类型向量，写入 miniSEED 文件的采样值的向量。

overwrite BOOL 类型标量，表示是否覆盖之前写入的数据。默认为 false，代表不覆盖。

例子

time=timestamp(2013.01.01);
sampleRate=100.0;
vec=rand(100, 100);
ret=write("/home/zmx/aaa", "XFDSN:SC_JZG_00_B_H_Z", time, sampleRate, vec);

parse

语法

parse(data)

详情

解析 miniseed 格式的字节流。

返回一个内存表，包含如下字段：

value：列类型为 INT, FLOAT 或 DOUBLE，读取到的采样值。
time：列类型为 TIMESTAMP，采样值对应的时间戳。
id：列类型为 SYMBOL，采样值所在块的 sid。

参数

data STRING 或 CHAR 类型的向量，表示 miniseed 格式的字节流。

例子

fin=file("/media/zmx/aaa");
buf=fin.readBytes(512);
ret=parse(buf);

stringBuf=concat(buf);
ret=parse(stringBuf);

parseStream

语法

parseStream(data)

详情

解析 miniseed 格式的字节流，返回一个字典，包含一个内存表和成功解析的字节流长度。如果解析失败，返回一个仅包含成功解析的字节流长度的字典。字典包含如下键值:

"data"：一个内存表，包含如下字段：
- value：列类型为 INT, FLOAT 或 DOUBLE，读取到的采样值。
- time：列类型为 TIMESTAMP，采样值对应的时间戳。
- id：列类型为 SYMBOL，采样值所在块的 sid。
"size"：LONG 类型标量，表示成功解析的字节流的长度。
"metaData"：一个内存表，包含如下字段
- id：列类型为 SYMBOL，采样值所在块的 sid。
- startTime：列类型为 TIMESTAMP，采样开始时间。
- receivedTime：列类型为 TIMESTAMP，接收数据时间。
- actualCount：列类型为 INT，实际解析出来的数据个数。
- expectedCount：列类型为 INT，miniSEED 包头指定的采样值个数。
- sampleRate：列类型为 DOUBLE，miniSEED 采样率。

参数

data STRING 或 CHAR 类型的向量，表示 miniseed 格式的字节流。

例子

fin=file("/media/zmx/aaa");
buf=fin.readBytes(512);
ret=parseStream(buf);

stringBuf=concat(buf);
ret=parseStream(stringBuf);

parseStreamInfo

语法

parseStreamInfo(data)

详情

解析 miniseed 格式的字节流的块信息，返回一个字典，包含一个内存表和成功解析的字节流长度。

字典包含如下键值:

"data": 一个内存表，包含如下字段：
- sid：列类型为 STRING 类型，读取到的 mseed 块的分量名称。
- blockLen：列类型为 INT，读取到的 mseed 块的长度。
"size": INT 类型标量，表示成功解析的字节流的长度。

参数

data STRING 或 CHAR 类型的向量，表示 miniseed 格式的字节流。

例子

fin=file("/media/zmx/aaa");
buf=fin.readBytes(512);
ret=parseStreamInfo(buf);

stringBuf=concat(buf);
ret=parseStreamInfo(stringBuf);

streamize

语法

streamize(data, sampleRate, [blockSize])

详情

按照所在行数的顺序将表中的采样数据转换成 miniseed 格式的 CHAR Vector。需要提前对 sid 列、时间戳进行排序。

参数

data 采样数据信息的一张表，必须包含如下列：

第一列类型为 SYMBOL 或 STRING，表示 sid。
第二列类型为 TIMESTAMP，表示时间戳。
第三列类型为 INT, FLOAT 或 DOUBLE，表示采样数值。
只会取前三列作为输入参数，第四列及其以后不做处理。

sampleRate INT, LONG, FLOAT, DOUBLE 类型标量，表示采样频率。

blockSize INT 类型标量，表示 miniSEED 格式的块大小，单位为字节。默认值是 512。

使用

sidVec = take("XFDSN:SN_C0059_40_E_I_E", 1000).symbol()
tsVec = now() + 1..1000
dataVec = 1..1000
data = table(sidVec as sid, tsVec as ts, dataVec as data)
ret = streamize(data, 1000)