
pandas
Mr-Joe
这个作者很懒,什么都没留下…
展开
-
DataFrame和Series排序问题
#coding=utf-8 import pandas as pd import numpy as np #以下实现排序功能。 series=pd.Series([3,4,1,6],index=['b','a','d','c']) frame=pd.DataFrame(np.random.randn(3, 4),columns=['b','a','d','c'],index=['one'...原创 2018-06-06 10:51:16 · 2482 阅读 · 0 评论 -
jupyter notebook风格变换
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。 ...转载 2019-08-21 16:00:28 · 1906 阅读 · 0 评论 -
python2读取csv文件报编码错误
问题:python2 pandas读取csv文件报编码错误解决方式:可以尝试在 pd.read_csv() 将encoding="gbk"设置原创 2019-08-16 11:45:10 · 647 阅读 · 0 评论 -
python科学计算常用api
之前的文章里面谈到过,我...转载 2019-08-21 10:13:00 · 312 阅读 · 0 评论 -
pandas 降低内存
pandas如何存储不同的数据类型,并大幅度降低内存使用:1、如果有日期类型一定默认为 object类型,此时一定要转换为 datetime类型,内存优化极为有效。2、如果有数值类型,可以转化更为高效的数值类型3、如果有object类型,在条件允许的情况下可以转换为类别类型。如果你还想使用 pandas 处理更大规模的数据,可以参与这个交互式课程:https://www.dataq...转载 2019-04-28 15:04:15 · 235 阅读 · 0 评论 -
pandas杂记
1、今天碰到一个问题,从mysql导出一个CSV文件,用pandas读取,文件结构如下:接下来我想用倒数第一行除以倒数第二行,结果得到的结果全为0(不贴图了)。一开始我以为是数据类型的,就查看了各列数据类型:结果数据类型为 float,google查找资料,也没找到原因。。。。等找到原因后在此续上。 2、pandas删除列操作DataFrame.drop(l...原创 2018-12-17 17:05:27 · 116 阅读 · 0 评论 -
iloc和loc的区别
pandas以类似字典的方式来获取某一列的值,比如df['A'],这会得到df的A列,返回的也是一个Series对象。如果想要获取部分行的话就得用到切片例如:df'[:3],获取前三行;df[3:4],获取第四行。但是如果想要获取部分行部分列的上述两种方法就无能为力了。这时就得用到 ix, loc, iloc方法(ix已弃用)loc是指location的意思,iloc中的i是指integer。il...原创 2018-06-28 15:24:24 · 15639 阅读 · 0 评论 -
pandas汇总和描述性统计
import pandas as pdimport numpy as npIn [3]:df = pd.DataFrame([[1.4, np.nan], [7.1, -4.5], [np.nan, np.nan], [0.75, -1.3]], index=['a', 'b', 'c', 'd'], ...转载 2018-06-28 11:51:56 · 16413 阅读 · 0 评论 -
十分钟pandas
转自:https://blog.youkuaiyun.com/Yan_Joy/article/details/7809511510 Minutes to pandas10分钟pandas教程对于数据处理分析的新手,花十分钟熟悉pandas很有必要,一起开始吧~第一步要会导入pandas和其好基友们:In [1]: import pandas as pdIn [2]: import numpy as np...转载 2018-06-27 17:38:45 · 215 阅读 · 0 评论 -
pandas简单分组和聚合
一、举例的数据假设我有个六列的dataframe:一列是销售员,一列是所属团队,其它四列分别是四个季度的销售额。1新增列-基于原有列的全年销售额首先df['Total ']确保了你在该df内新增了一个column,然后累加便可。df['Total'] = df['Q1']+df['Q2']+df['Q3']+df['Q4']你可能想使用诸如sum()的函数进行这步,很可惜,sum()方法只能对...转载 2018-06-27 15:55:43 · 1445 阅读 · 0 评论 -
pandas透视表
介绍也许大多数人都有在Excel中使用数据透视表的经历,其实Pandas也提供了一个类似的功能,名为pivot_table。虽然pivot_table非常有用,但是我发现为了格式化输出我所需要的内容,经常需要记住它的使用语法。所以,本文将重点解释pandas中的函数pivot_table,并教大家如何使用它来进行数据分析。如果你对这个概念不熟悉,wikipedia上对它做了详...转载 2018-07-02 10:03:48 · 197 阅读 · 0 评论 -
pandas操作
带有重复值的轴索引: obj = Series(range(5), index=['a', 'a', 'b', 'c']) obj.index.is_unique # 判断索引是否唯一,返回bool值 对于含有多个索引,在选取数据时,如果某个索引对应多个值,返回一个Series, 而对应单个值得,返回一个标量值。 对于 DataFrame对象与Series方法相似,选个单个唯一索引...原创 2018-06-06 17:40:25 · 483 阅读 · 0 评论 -
pandas to_csv碰到的权限问题
windows下保存to_csv文件会出现没有权限的问题,解决方法:先创建文件,再使用to_csv( )# 先创建文件并打开file = open("D:\\test\\census90.csv", "w")data.to_csv(file, index_label=False, index=False)# 关闭文件file.close()...原创 2019-10-04 21:46:15 · 2692 阅读 · 0 评论