GroupBy
GroupBy 类是用于数据分组和聚合操作的关键工具。它允许用户按照一个或多个列的值将数据集拆分成多个组,可以对每个分组进行聚合、转换和分析操作。
使用 DolphinDB pandas GroupBy 时需要注意以下问题:
- groupby 的列数据必须类型一致。
- 除 cumcount 外的其它函数分组计算后的结果和原始输入数据的顺序不同。结果中组内的数据和原始数据顺序保持一致,但每组之间按照 groupby 的列排序。
目前 DolphinDB pandas 实现了 GroupBy 类的以下函数:
函数应用
| 方法 | 兼容性说明 |
|---|---|
| apply |
计算/描述性统计
| 方法 | 兼容性说明 |
|---|---|
| rolling | 仅支持参数 window, min_periods |
| cumprod | 不支持所有参数 |
| cumsum | 不支持所有参数 |
| diff | 不支持所有参数 |
| max | 仅支持参数 numeric_only。窗口长度至少为2 |
| min | 仅支持参数 numeric_only |
| mean | 仅支持参数 numeric_only |
| std | 仅支持参数 numeric_only |
| sum | 对于文本类型以及 POINT, UUID, IPADDR, INT128, COMPLEX 类型数据应用 sum 函数,总是返回空值。 |
| shift | 不支持参数 axis |
| var | 仅支持参数 numeric_only |
