groupby

语法

groupby(func, funcArgs, groupingCol)

funcArg func:G groupingCol

func:G(funcArgs, groupingCol)

详情

groupingCol 排序后分组,然后在每个分组中计算 func(funcArgs)。每组的计算结果可以是标量,向量或字典。该函数的输出结果是一个表,它的行数与分组数相等。

参数

  • func 是一个函数。
  • funcArgs 是函数 func 的参数。如果有多个参数,则用元组表示。
  • groupingCol 表示分组变量。可以是向量,表示一个分组列;也可以是等长向量组成的元组,表示多个分组列。

groupingCol funcArgs 中的每个参数都是相同长度的向量。

注: 对于第二种情况,func 表示的函数只能有一个参数。

例子

sym=`IBM`IBM`IBM`MS`MS`MS$symbol;
price=172.12 170.32 175.25 26.46 31.45 29.43;
qty=5800 700 9000 6300 2100 5300;
trade_date=2013.05.08 2013.05.06 2013.05.07 2013.05.08 2013.05.06 2013.05.07;
groupby(avg, price, sym);
sym avg_price
IBM 172.563333
MS 29.113333
price avg :G sym;
sym avg_price
IBM 172.563333
MS 29.113333
groupby(wavg, [price, qty], sym);
// 计算每个股票标记数量加权后的平均价格
sym avg_price
IBM 173.856129
MS 28.373869
sym = `C`MS`MS`MS`IBM`IBM`C`C`C$SYMBOL
price= 49.6 29.46 29.52 30.02 174.97 175.23 50.76 50.32 51.29
qty = 2200 1900 2100 3200 6800 5400 1300 2500 8800
timestamp = [09:34:07,09:36:42,09:36:51,09:36:59,09:32:47,09:35:26,09:34:16,09:34:26,09:38:12]

groupby(max, price, [sym,minute(timestamp)])
sym groupingKey max_price
C 09:34m 50.76
C 09:38m 51.29
IBM 09:32m 174.97
IBM 09:35m 175.23
MS 09:36m 30.02