
pandas
baidu_252253
这个作者很懒,什么都没留下…
展开
-
pandas中三大对象
1.pandas的Series对象pandas的Series对象是一个带索引数据构成的一维数组。可以用一个数组创建Series对象import pandas as pddata=pd.Series([0.25,0.5,0.75,1.0])print(data)# output:0 0.25# 1 0.50# 2 0.75# ...转载 2019-11-29 17:05:10 · 656 阅读 · 0 评论 -
numpy和pandas 各种比较常见的用法总结
一、numpy1、numpy中reshape的用法经常会遇到np.reshape(a,-1) 或者np.reshape(-1,a) 这样的情况(a=1,2,3,4,5),-1是一个比较神奇的功能,意思是我只要确定需要分成a行后者a列,剩下的数据你随便分,反正结果都一样。例:arr =np.array([1,2,3,4,5,6,7,8,9,10,11,12])一个一维的ndarry数...转载 2019-11-29 16:41:02 · 737 阅读 · 0 评论 -
Pandas中的拼接操作(concat,append,join,merge)
Pandas提供了concat、append、join和merge四种方法用于dataframe的拼接,其大致特点和区别见下表:.concat() pandas的顶级方法,提供了axis设置可用于df间行方向(增加行,下同)或列方向(增加列,下同)进行内联或外联拼接操作.append() dataframe数据类型的方法,提供了行方向的拼接操作.join() datafr...转载 2019-11-29 15:53:39 · 660 阅读 · 0 评论 -
group分组与agg聚合
作者:xusworld来源:优快云原文:https://blog.youkuaiyun.com/u012706792/article/details/80892510版权声明:本文为博主原创文章,转载请附上博文链接!转载 2019-07-12 17:53:13 · 983 阅读 · 0 评论 -
python pandas 中 loc & iloc 用法区别
https://blog.youkuaiyun.com/qq_21840201/article/details/80725433转载 2019-07-14 15:09:37 · 294 阅读 · 0 评论 -
Pandas(最基础)
Pandas是基于Numpy开发出的,专门用于数据分析的开源Python库Pandas的两大核心数据结构Series(一维数据)Series创建Series的方法允许索引重复DataFrame(多特征数据,既有行索引,又有列索引)DataFrame索引方法 # 创建一个3行4列的DataFrame类型数据 ...转载 2019-07-14 15:23:18 · 303 阅读 · 0 评论 -
pandas.group by
group by函数在使用Python进行分组分析时使用非常频繁,使用group by可以对数据进行简单的分组分析。一、分组列一列,计算列一列的写法一组分组列,一组计算列,一种计算方式aggResult = data.groupby(by=['年龄分层'])['年龄'].agg({'人数': numpy.size})1grouped = data.年龄.groupby(data...转载 2019-07-11 18:04:17 · 207 阅读 · 0 评论 -
pandas中的concat和append
作者:hsc_1来源:优快云原文:https://blog.youkuaiyun.com/hsc_1/article/details/79588858版权声明:本文为博主原创文章,转载请附上博文链接!转载 2019-07-11 18:07:35 · 302 阅读 · 0 评论 -
python学习——pandas 唯一值unique( ),计数值value_counts( )及成员资格isin( )
作者:如是雨林来源:优快云原文:https://blog.youkuaiyun.com/qq_23418043/article/details/82556305版权声明:本文为博主原创文章,转载请附上博文链接!转载 2019-07-11 18:09:13 · 771 阅读 · 0 评论 -
pandas合并数据merge
转自:SnailTyan:http://blog.youkuaiyun.com/quincuntial/article/details/70990990https://blog.youkuaiyun.com/u011799895/article/details/79257908文章作者:Tyan博客:noahsnail.com|优快云|简书本文主要是关于pandas的一些基本...转载 2019-07-11 18:11:25 · 152 阅读 · 0 评论 -
pandas中的isin函数详解
原文链接:http://www.datastudy.cc/to/68https://blog.youkuaiyun.com/Tracy_Lee1993/article/details/78923389https://blog.youkuaiyun.com/W_weiying/article/details/84618685https://blog.youkuaiyun.com/weixin_44056331/articl...转载 2019-07-11 18:13:33 · 1990 阅读 · 0 评论 -
Pandas的 loc iloc ix 区别
import pandas as pd data = [[1,2,3],[4,5,6]] index = [0,1] columns=['a','b','c'] df = pd.DataFrame(data=data, index=index, columns=columns) 1. loc——通过行标签索引行数据df.loc[1] '''''a 4b ...转载 2019-07-11 18:14:50 · 171 阅读 · 0 评论 -
groupby、agg,对表格数据分组与统计(超全的)
https://blog.youkuaiyun.com/u013317445/article/details/85268877转载 2019-07-12 17:51:32 · 1972 阅读 · 0 评论 -
value_counts计算DataFrame,Series的数据频率
在pandas里面常用用value_counts确认数据出现的频率。Series 情况下import numpy as npimport pandas as pdfrom pandas import DataFramefrom pandas import Seriesss = Series(['Tokyo', 'Nagoya', 'Nagoya', 'Osaka', 'Toky...转载 2019-07-12 17:48:25 · 677 阅读 · 0 评论 -
agg函数的用法(一般与groupby函数连用)
为了了解agg这个函数 我们先以下数据集作为研究对象 (截图的一部分)agg:这里一般都与groupby函数作为比较pandas引入了agg函数,它提供基于列的聚合操作。而groupby可以看做是基于行,或者说index的聚合操作通过这里介绍我们可以交接 groupby函数是基于行操作的 而agg是基于列操作的这个说可能太抽象,什么是行操作 什么是列操作呢最简单的理解就是 基...转载 2019-07-12 17:27:20 · 29869 阅读 · 2 评论 -
pandas中的两种数据类型Series和DataFrame区别
https://blog.youkuaiyun.com/u012474716/article/details/785503911. Series相当于数组numpy.array类似s1=pd.Series([1,2,4,6,7,2])s2=pd.Series([4,3,1,57,8],index=['a','b','c','d','e'])print s2obj1=s2.values# pri...转载 2019-02-13 11:27:40 · 1216 阅读 · 0 评论 -
pandas(二)
https://blog.youkuaiyun.com/lzw2016/article/details/79508332pandas学习(两种数据结构DataFrame & Series)DataFrame(类似numpy的二维数组,是一种带标签的二维对象)有行索引&列索引(默认从0开始,可根据索引选值) 1. 创建方式:从另一个DataFrame创建从具有二维形状的Numpy...转载 2019-02-13 11:32:02 · 255 阅读 · 0 评论 -
pandas(三)
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas的主要功能:具备对齐功能的数据结构DataFrame、Series集成时间序列功能提供丰富的数学运算和操作灵活处理缺失数据中文文档:http://python.usyiyi.cn/translate/Pan...转载 2019-02-13 15:59:33 · 199 阅读 · 0 评论 -
pandas筛选表格数据
https://blog.youkuaiyun.com/yj1556492839/article/details/80075214虽然去年就开始用pandas筛选数据,但有些方法还是容易忘记,工作中写的代码差点出错了,所以把这些内容记下来。其实英文官方文档上的内容非常详细,可以多看看。多条件筛选这里的筛选方法,是根据不同字段的不同条件,对行进行筛选,每个条件得到一个index集合, 求不同index...转载 2019-02-19 15:36:15 · 1325 阅读 · 1 评论 -
Pandas对Excel行和列进行操作
获取行数据:filename = '测试表.xlsx'df = pd.DataFrame(pd.read_excel(filename))df2 = df[(df['状态'] == '等待付款')|(df['状态'] == '已提交')]print(df.loc[6000].tolist())//输出第6000行数据,将Series转化为list获取列数据:filename ...原创 2019-02-20 15:54:51 · 6549 阅读 · 0 评论 -
pandas将列表写入Excel
import numpy as npimport pandas as pdfrom pandas import DataFramenum_lis = [ 'BXD-201812-00053593','BXD-201812-00053550','BXD-201812-00053532',]data_x = pd.read_excel("测试表.xlsx",usecols=[0,1,2,3,...原创 2019-02-20 15:56:51 · 15958 阅读 · 0 评论 -
pandas将Excel的所有行转化为列表list
首先使用np.array()函数把DataFrame转化为np.ndarray(),再利用tolist()函数把np.ndarray()转为list,示例代码如下:import numpy as npimport pandas as pddata_x = pd.read_csv("E:/Tianchi/result/features.csv",usecols=[2,3,4])#pd.da...转载 2019-02-20 16:05:05 · 10205 阅读 · 0 评论 -
pandas(四)
https://blog.youkuaiyun.com/xiaomifanhxx/article/details/82498176https://blog.youkuaiyun.com/qq_32005671/article/details/61199628https://blog.youkuaiyun.com/u011089523/article/details/60341016转载 2019-02-20 16:27:17 · 138 阅读 · 0 评论 -
Pandas概念(一)
– Start什么是 Pandas?Pandas 是 Python 的外部模块,它非常像 Excel,提供了分析数据的功能。它提供了两个数据类型 Series 和 DataFrame。什么是 Series?Series 是 Pandas 提供的一种数据类型,你可以把它想象成 Excel 的一行或一列。import numpy as npimport pandas as pd#...转载 2019-02-26 15:55:27 · 259 阅读 · 0 评论 -
读取和保存Excel表
filename = 'test.xlsx'df = pd.DataFrame(pd.read_excel(filename))df2 = df[(df['状态'] == '等待付款')|(df['状态'] == '已提交')]df1= df[['所属公司', '单据编号', '表单名称','事由', '本位币', '状态','申请金额', '核定报销金额', '已付金额']]d...原创 2019-02-21 09:55:29 · 192 阅读 · 0 评论 -
value_counts()的用法
https://blog.youkuaiyun.com/weixin_33950035/article/details/91272268value_counts()是一种查看表格某列中有多少个不同值的快捷方法,并计算每个不同值有在该列中有多少重复值。value_counts()是Series拥有的方法,一般在DataFrame中使用时,需要指定对哪一列或行使用。 import pandas as ...转载 2019-07-12 17:23:25 · 9472 阅读 · 0 评论 -
pandas(一)
https://blog.youkuaiyun.com/qq_41221743/article/details/81172952 1.Series的reindex()方法能修改Series的index,如果修改的index与创建的index没有对应的话,就会引入缺失值import pandas as pdimport numpy as np obj=pd.Series([4.1,4.2,...转载 2019-02-13 11:25:44 · 126 阅读 · 0 评论