oneHot
语法
oneHot(obj, encodingColumns)
参数
obj 是一个内存表。
encodingColumns 是一个字符串或者字符串向量,指定用于编码的列名。
详情
对指定的列进行独热编码(one-hot),返回编码后的表,列的顺序为编码列,非编码列。其中,编码列的列名格式为:原字段名_值。
例子
t = table( take(`Tom`Lily`Jim, 10) as name, take(true false, 10) as gender, take(21..23,10) as age);
oneHot(t, `name`gender);
输出返回:
name_Tom | name_Lily | name_Jim | gender_1 | gender_0 | age |
---|---|---|---|---|---|
1 | 0 | 0 | 1 | 0 | 21 |
0 | 1 | 0 | 0 | 1 | 22 |
0 | 0 | 1 | 1 | 0 | 23 |
1 | 0 | 0 | 0 | 1 | 21 |
0 | 1 | 0 | 1 | 0 | 22 |
0 | 0 | 1 | 0 | 1 | 23 |
1 | 0 | 0 | 1 | 0 | 21 |
0 | 1 | 0 | 0 | 1 | 22 |
0 | 0 | 1 | 1 | 0 | 23 |
1 | 0 | 0 | 0 | 1 | 21 |