byColumn

语法

byColumn(func, X, [Y])

func:V(X)

func:V(X, [Y])

参数

  • func 一个单目函数,支持以部分应用的形式传入。该函数可以是向量函数(输入与输出为等长的向量),亦可为聚合函数。

  • X 一个矩阵、表、元组、数组向量、列式元组

  • Y 矩阵、表、元组、数组向量、列式元组。

详情

func 为单目函数时,X 的每一列应用指定函数;func 为双目函数时,对 XY 的每列执行 func(Xi, Yi) 。

同时指定 X 和 Y 时,则对 X 和 Y 的每列执行 func(Xi, Yi) 。

支持在响应式状态引擎中使用 byColumn 函数。

计算规则

  • 如果 X/Y 是矩阵、表或元组,byColumn 对 X/Y 的每一列数据应用指定的函数。

  • 如果 X/Y 是数组向量或列式元组:byColumn 首先将对象转置,然后对转置后的对象的每一行应用指定函数。

    • func 是向量函数时,byColumn 会把 func 的计算结果转置后输出。

    • func 是聚合函数时,输出结果是一个向量。特别地,当 func 是以下聚合函数时,由于 byColumn 不对 X/Y 进行转置,从而提高了计算性能:sum, sum2, avg, min, max, count, imax, imin, imaxLast, iminLast, prod, std, stdp, var, varp, skew, kurtosis, any, all, corr, covar, wavg, wsum, beta, euclidean, dot, tanimoto

返回值

  • func 是聚合函数时,

    • 如果 X/Y 是矩阵、数组向量或列式元组,则输出结果是一个向量。向量的长度与 X/Y 的列数相同。

    • 如果 X/Y 是元组,则输出结果是一个元组。

    • 如果 X/Y 是表,则输出结果是一个表。

  • func 是向量函数时,输出结果的形式、维度和 X/Y 的形式、维度相同。

计算规则

  • 如果 X/Y 是矩阵、表或元组,byColumn 对 X/Y 的每一列数据应用指定的函数。

  • 如果 X/Y 是数组向量或列式元组:byColumn 首先将对象转置,然后对转置后的对象的每一行应用指定函数。

    • func 是向量函数时,byColumn 会把 func 的计算结果转置后输出。

    • func 是聚合函数时,输出结果是一个向量,无需进行转置操作。特别地,当 func 是以下聚合函数时,byColumn 进行了优化,不会对 X/Y 进行上步的转置操作,从而提高了计算性能:sum, sum2, avg, min, max, count, imax, imin, imaxLast, iminLast, prod, std, stdp, var, varp, skew, kurtosis, any, all, corr, covar, wavg, wsum, beta, euclidean, dot, tanimoto。

例子

对于不支持矩阵运算的单目向量函数,通过 byColumn 进行按列计算,等效于 each

def myvfunc(x): var(x).log()
m = matrix(1.1 2.3 2.1 3.5 4.2, 3.3 2.5 4.2 5.1 0, -1 3.3 2 1.7 2.3)
byColumn(myvfunc, m)

输出返回: [0.3974329364109,1.334211281249665,0.945072533299607]

传入多元函数时,需要把该函数的其他参数通过部分应用进行固定,然后传入 func

byColumn(autocorr{,2},m)

返回:[-0.05,-0.28,-0.06]

输出返回:

col1 col2 col3
3.1  5.3  1
4.3  4.5  5.3
4.1  6.2  4
5.5  7.1  3.7
6.2  2    4.3
byColumn(add{1 2 3 4 5}, m)

输出返回:

col1 col2 col3
2.1  4.3  0
4.3  4.5  5.3
5.1  7.2  5
7.5  9.1  5.7
9.2  5    7.3

func 是一个自定义函数。

def my_func(x){
   return iif(x > 0, 1, -1)
}
m = matrix(3 -6 5 0, 2 -9 -4 5)
byColumn(my_func, m)

输出返回:

col1 col2
 1    1
-1   -1
 1    -1
-1    1

func 是一个嵌套函数。

m = matrix(1 5 3 , 7 5 2)
byColumn(accumulate{def (x, y):iif(x > 5, y-1, y+1), ,1}, m)

输出返回:

col1 col2
2    8
6    4
2    3

入参是矩阵:

m=matrix([1 3 4 2,1 2 2 1])
max:V(m)
[4,2]

cummax:V(m)

col1	col2
1	1
3	2
4	2
4	2

n=matrix([11 5 9 2,8 5 3 2])
corr:V(m,n)
[-0.09,-0.21]

入参是表:

qty1 = 2200 1900 2100 3200 6800 5400 1300 2500 8800
qty2 = 2100 1800  6800 5400 1300 2400 8500 4100 3200
t = table(qty1, qty2);
max:V(t) 

qty1	qty2
8,800	8,500

cummax:V(t) 

qty1	qty2
2,200	2,100
2,200	2,100
2,200	6,800
3,200	6,800
6,800	6,800
6,800	6,800
6,800	8,500
6,800	8,500
8,800	8,500


qty3 = 7800 5400 5300 2500 1800 2200 3900 3100 1200
qty4 = 3200 2800 6400 8300 2300 3800 2900 1600 2900
t1 = table(qty3, qty4);

corr:V(t,t1)   

qty1	qty2
-0.7267	0.4088

入参是元组:

tp=[1 3 4 2,1 2 2 1]
sum:V(tp)  
(10,6) 

cummax:V(tp) 
([1,3,4,4],[1,2,2,2]) 

tp1=[11 23 14 21,10 12 32 21]

corr:V(tp,tp1)  
(0.25,0.37)

入参是数组向量:

a=array(INT[], 0, 10).append!([1 2 3, 4 5 4, 6 7 8, 1 9 10]);
sum:V(a) 
[12,23,25] 

cummax:V(a)
[[1,2,3],[4,5,4],[6,7,8],[6,9,10]]

b=array(DOUBLE[], 0, 10).append!([11.8 21.2 23.9, 83.3 90.2 78.2, 86.5 52 36.5, 10.1 12.4 16.8])
corr:V(a,b)  

[0.95,-0.13,-0.46]

入参是列式元组:

ctp=[1 3 4 2,1 2 2 1]
ctp.setColumnarTuple!()
sum:V(ctp)  
[2,5,6,3]

cummax:V(ctp)
([1,3,4,2],[1,3,4,2])

ctp1=[11 23 14 21,10 12 32 21]
ctp1.setColumnarTuple!()

corr:V(ctp,ctp1) 
[,1,-1,]