一个月前更新了一本书,到第6章。然后停滞了,中间更新了一个实战文。原因很悲惨…过了将近一个月非人生活~就是在忙学位论文。终于在学术不端检测之后就要送外审了,我也松了一口气。
这一个月发生了什么呢?就不细说了,就是不停的忙着写论文,改论文这些~但是,这期间我中奖了!!!!!我中了一本书,也是Excel和python结合的书!!!中奖绝缘体的我居然中了!!!
待我这本书的笔记写完之后,我在更新那本书~~
感觉大家更喜欢笔记啊,这本书里面的Excel部分被我略过了,因为木有什么特别的东西~可能以后会更新一下Excel的内容吧~
叨叨完毕,开始更新这本书内容的第7-9章。
前面的几章内容分别是数据的获取,数据清洗,数据筛选等。属于是前中期的过程啦。第7-9章的内容是数据汇总、统计及输出,是最后的一部分。
数据汇总主要使用两个函数,一个是groupby函数和pivot_table。前者和SQL里面的内容比较类似,就是通过分类汇总达到的。后者是和Excel的数据透视表类似。
首先是分类汇总
df_inner.groupby(‘city’).count()
这个意思是通过按照city来进行分类,并统计个数
结果
但是这个是对于整个的内容进行了分类汇总,可是如果只想对于年龄进行汇总应该怎么办呢?
df_inner.