GroupBy
GroupBy 类是用于数据分组和聚合操作的关键工具。它允许用户按照一个或多个列的值将数据集拆分成多个组,可以对每个分组进行聚合、转换和分析操作。
使用 DolphinDB pandas GroupBy 时需要注意以下问题:
- groupby 的列数据必须类型一致。
- 除 cumcount 外的其它函数分组计算后的结果和原始输入数据的顺序不同。结果中组内的数据和原始数据顺序保持一致,但每组之间按照 groupby 的列排序。
目前 DolphinDB pandas 实现了 GroupBy 类的以下函数:
函数应用
方法 | 兼容性说明 |
---|---|
apply |
计算/描述性统计
方法 | 兼容性说明 |
---|---|
rolling | 仅支持参数 window, min_periods |
cumprod | 不支持所有参数 |
cumsum | 不支持所有参数 |
diff | 不支持所有参数 |
max | 仅支持参数 numeric_only。窗口长度至少为2 |
min | 仅支持参数 numeric_only |
mean | 仅支持参数 numeric_only |
std | 仅支持参数 numeric_only |
sum | 对于文本类型以及 POINT, UUID, IPADDR, INT128, COMPLEX 类型数据应用 sum 函数,总是返回空值。 |
shift | 不支持参数 axis |
var | 仅支持参数 numeric_only |