
Pandas基础
么心learning
nothing
展开
-
Pandas基础(一):数据的存取和查看
使用pandas做数据分析,首先导入pandas库:import pandas as pdpandas的数据结构有两种:Series和DataFrame。前者可以理解为数组,后者可以理解为表格。我们主要讲解DataFrame。1.创建DataFrame:由等长列表构成。包含列名和每行该列的值。data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Neva...原创 2018-10-15 11:07:13 · 886 阅读 · 0 评论 -
Pandas基础(二):DataFrame的行、列与数据类型
建立DataFrame数据:data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'], 'year': [2000, 2001, 2002, 2001, 2002, 2003], 'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}df = pd.Dat...原创 2018-10-15 11:50:39 · 12941 阅读 · 0 评论 -
Pandas基础(三):数据的筛选
导入pandas库后,初始一个DataFrame:data = pd.DataFrame(np.arange(16).reshape((4, 4)), index=['Ohio', 'Colorado', 'Utah', 'New York'], columns=['one', 'two', 'three...原创 2018-10-19 10:38:13 · 930 阅读 · 0 评论 -
Pandas基础(四):分组groupby的用法
首先采用kesci的第三套练习作为groupby的初步用法介绍,后面有什么收获或者心得再补充。原文链接:kesci数据分析练习题导入库和数据:import pandas as pddrinks = pd.read_csv('/drinks.csv')用head方法查看下导入的数据,如下图1.查看平均消耗的啤酒(beer)最多的大陆(continent):drinks.group...原创 2018-10-22 17:47:18 · 5175 阅读 · 2 评论 -
Pandas基础:查看各列数据类型
看到很多人查这个问题,刚好这两天在项目上也用到这一点。要查看各列的数据类型,因为数据处理时,首先就是要高清手里的数据都是什么类型的,尤其要关注字符型,因为很多算法都是不支持字符类型的。当数据维度和数据量都很少的时候,可以很直观的看出来,但是数据量一大,很难肉眼观测,而且很多时候是看不出隐藏的数据问题的。所以要用代码,其实代码很简单。一、读取数据df = pd.read_csv('da...原创 2019-02-15 13:48:43 · 75466 阅读 · 0 评论