时序滑动窗口系列(tm 系列)
在涉及到时序数据的窗口计算场景,往往需要窗口根据时间列滑动进行指标的计算,为此 DolphinDB 引入了 tm 系列函数。tm 系列函数的窗口计算和 m 系列函数 window 取 DURATION 的情况类似,但 tm 系列函数不需要基于索引向量或索引矩阵的索引进行滑动,应用在 SQL 中可以直接对数据表的列进行滑动窗口计算。
tm 系列函数介绍
tm 系列函数对应的高阶函数 tmoving:
tmoving(func, T, funcArgs, window)
注: tm 系列函数为各自的计算场景进行了优化,因此比 tmoving 高阶函数有更好的性能。
内置的 tm 系列函数的通用参数模板如下:
tmfunc(T, X, window)
tmfunc(T, X, Y, window)
参数
-
T 是一个非严格递增的时间类型或整型的向量,且不能包含 NULL 值。
-
X (Y) 是一个与 T 长度相同的向量。
-
window 是正整型或 DURATION 标量。表示滑动窗口的长度。
注: 该系列函数不支持使用向量元组作为参数值。
tm 系列函数如下:
单目:
双目:
窗口确定规则
tm 系列函数的 window 长度以时间衡量。window 可以是正整数类型或者 DURATION 类型。
对于 T 中每个元素 Ti:
-
当 T 为整型时,确定的窗口区间为 (Ti - window, Ti ]
-
当 T 为时间类型时, 确定的窗口区间为 (temporalAdd(Ti, -window), Ti]
其计算规则如下图:
上图的对应代码,这里以 tmsum 为例:
T = [2022.01.01, 2022.01.02, 2022.01.03, 2022.01.06, 2022.01.07, 2022.01.08, 2022.01.10, 2022.01.11]
X = 1..8
print tmsum(T, X, window=3)
# output
[1, 3, 6, 4, 9, 15, 13, 15]