groupby() 用法
pandas 可以很方便的对DataFrame中的数据进行分组处理,可以按单列、多列进行分组,可以对分组的内容通过agg方法进行sum、min、max、 count等聚合运算,在应用当中,使用率非常的高,下面通过代码对这个方法的使用进行详细解说
默认df.groupby()后,返回的是对象内存地址,看起来不直观 ,通过list进行列表转换,可以看到,列表的大小是2,里面包含,两个元组类型的数据,每个元组由分组列的值和DataFrame组成
也可以通过for ... in 从里面读取出对应的数据
看到这要的数据,在实际应用当中,没有太大的意义,一般真正实用的,就是把分组后的数据,再进行agg方法处理,进行对应的列聚合,可以对一列,或者多列进行聚合。
这个数据 看着跟DataFrame不是太像,可读性不是太好,有没有更直观的表现哪?可以,只用把索引重置一下就可以了,df.reset_index()
之所有出现上面的数据情况,是因为,groupby后,默认把分组的列做为索引 ,当不想用重置索引,可以在分组的时候,指定,不以分组列做为索引(默认是做为索引的)