GroupBy

GroupBy 类是用于数据分组和聚合操作的关键工具。它允许用户按照一个或多个列的值将数据集拆分成多个组,可以对每个分组进行聚合、转换和分析操作。

使用 DolphinDB pandas GroupBy 时需要注意以下问题:

  • groupby 的列数据必须类型一致。
  • cumcount 外的其它函数分组计算后的结果和原始输入数据的顺序不同。结果中组内的数据和原始数据顺序保持一致,但每组之间按照 groupby 的列排序。

目前 DolphinDB pandas 实现了 GroupBy 类的以下函数:

函数应用

方法兼容性说明
apply

计算/描述性统计

方法兼容性说明
rolling仅支持参数 window, min_periods
cumprod不支持所有参数
cumsum不支持所有参数
diff不支持所有参数
max仅支持参数 numeric_only。窗口长度至少为2
min仅支持参数 numeric_only
mean仅支持参数 numeric_only
std仅支持参数 numeric_only
sum对于文本类型以及 POINT, UUID, IPADDR, INT128, COMPLEX 类型数据应用 sum 函数,总是返回空值。
shift不支持参数 axis
var仅支持参数 numeric_only