更新时间:2022-11-30 来源:黑马程序员 浏览量:
在Pandas对象中,如果它的某一列数据满足不同的划分标准,则可以将该列当做分组键来拆分数据集。例如,创建一个DataFrame对象,具体代码如下。
In [1]: import pandas as pd
df = pd.DataFrame({"Key": ['C', 'B', 'C', 'A', 'B', 'B', 'A', 'C', 'A'],
"Data":[2,4,6,8,10,1,14,16,18]})
df
Out[1]:
Key Data
0 C 2
1 B 4
2 C 6
3 A 8
4 B 10
5 B 1
6 A 14
7 C 16
8 A 18
然后,调用groupby()方法时把列名Key传给by参数,代表将Key作为分组键,让df对象按照Key列进行分组,具体示例代码如下:
In [2]: # 按key列进行分组
df.groupby(by='Key')
Out[2]: <pandas.core.groupby.groupby.DataFrameGroupBy object at
0X0000000006E274A8>
从输出的结果可以看出,DataFrame经过分组后得到了一个DataFrameGroupBy对象,该对象是一个可迭代的对象,即只有在真正需要的时候才会执行执行计算(采用惰性计算)。