首页常见问题正文

数据聚合与分组运算:通过列名进行分组

更新时间:2022-11-30 来源:黑马程序员 浏览量:

IT培训班

  在Pandas对象中,如果它的某一列数据满足不同的划分标准,则可以将该列当做分组键来拆分数据集。例如,创建一个DataFrame对象,具体代码如下。

In [1]: import pandas as pd
        df = pd.DataFrame({"Key": ['C', 'B', 'C', 'A', 'B', 'B', 'A', 'C', 'A'],
                           "Data":[2,4,6,8,10,1,14,16,18]})
        df
Out[1]:
  Key Data
0   C    2
1   B    4
2   C    6
3   A    8
4   B    10
5   B    1
6   A    14
7   C    16
8   A    18

  然后,调用groupby()方法时把列名Key传给by参数,代表将Key作为分组键,让df对象按照Key列进行分组,具体示例代码如下:

In [2]: # 按key列进行分组
          df.groupby(by='Key')
Out[2]: <pandas.core.groupby.groupby.DataFrameGroupBy object at
         0X0000000006E274A8>

  从输出的结果可以看出,DataFrame经过分组后得到了一个DataFrameGroupBy对象,该对象是一个可迭代的对象,即只有在真正需要的时候才会执行执行计算(采用惰性计算)。

分享到:
在线咨询 我要报名
和我们在线交谈!