
pandas学习
求知者_123
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Pandas DataFrame重置索引
Pandas DataFrame重置索引import pandas as pdimport numpy as npa=pd.DataFrame(np.random.randint(1,10,20).reshape(4,5))print(a)0 1 2 3 40 1 3 2 7 61 8 2 2 7 22 2 6 6 2 53 4 1 6 8 9b=a.sort_values(by=4)print(b) 0 1 2 3 41原创 2021-08-03 16:54:16 · 458 阅读 · 0 评论 -
python字符串的连接与合并
日常使用python经常要对文本进行处理,无论是爬虫的数据解析,还是大数据的文本清洗,还是普通文件的处理,都是要用到字符串. Python对字符串的处理内置了很多高效的函数,非常方便功能很强大.下面是经常用的操作方法。...原创 2018-12-15 22:36:56 · 794 阅读 · 0 评论 -
pandas 统计数据频率函数value_counts
value_counts默认参数如下:value_counts(values, sort=True, ascending=False, normalize=False, bins=None, dropna=True)### Series类型import pandas as pddata=pd.Series(['python','java','python','php','php'...原创 2018-07-19 15:11:33 · 18993 阅读 · 2 评论 -
Python 数据清洗之缺失数据填充fillna()
缺失数据比较多的情况下,可以直接滤除,缺失数据比较少时,对数据进行填充就很有必要了。数据填充函数fillna()默认参数如下:fillna(self, value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)import numpy as npfrom numpy...原创 2018-07-12 12:17:06 · 58959 阅读 · 1 评论 -
Python 数据清洗之缺失数据滤除dropna()
实际应用中,在得到原始数据时,经常碰到数据缺失问题,对数据进行加工或清洗就非常有必要了import numpy as npfrom numpy import nanimport pandas as pddata=pd.DataFrame(np.arange(3,19,1).reshape(4,4),index=list('abcd'))print(data)print(data.i...原创 2018-07-11 20:04:59 · 29601 阅读 · 2 评论 -
pandas 之数据合并concat
import pandas as pds1=pd.Series(['a','b'])s2=pd.Series(['c','d']) concat( ) 参数如下:concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, ve...原创 2018-07-09 18:16:37 · 487 阅读 · 0 评论 -
python 数据合并函数merge( )
python中的merge函数与sql中的 join 用法非常类似,以下是merge( )函数中的参数:merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), cop...原创 2018-07-08 22:32:45 · 160096 阅读 · 8 评论 -
python pandas 中 loc & iloc 用法区别
### 随机生DataFrame 类型数据import pandas as pdimport numpy as npframe = pd.DataFrame(np.random.rand(4,4),index=list('abcd'),columns=list('ABCD'))frame A B C D a 0.560094 0.3526...原创 2018-06-18 18:39:32 · 36240 阅读 · 0 评论 -
python中DataFrame、Series数据类型 sort 排序
1、DataFrame类型排序DataFrame类型sort_index()函数参数如下:sort_index(self, axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True, by=No...原创 2018-06-17 20:40:11 · 10367 阅读 · 0 评论 -
python DataFrame类型数据排序问题
1、首先随机生成一个4*4数组,为DataFrame类型import pandas as pdimport numpy as npdata = pd.DataFrame(np.random.randn(4,4),columns=['a','b','c','d'])dataOut[24]:[24]: a b c d 0 -1.827002 ...原创 2018-06-15 17:00:47 · 3612 阅读 · 0 评论 -
pandas 分组、聚合函数groupby
分组过程如下图所示:import numpy as npimport pandas as pddf=pd.DataFrame({'key1':list('aabbab'), 'key2':list('cccddd'), 'value1':np.arange(1,7), 'value...原创 2018-07-24 13:55:22 · 1032 阅读 · 0 评论 -
pandas中DataFrame类型转成numpy中array类型
import pandas as pdimport numpy as npdf=np.array([[1,2,3],[4,5,6],[7,8,9]])dfdf1=pd.DataFrame(df)df1 0 1 20 1 2 31 4 5 62 7 8 9df1.valuesarray([[1, 2, 3], [4, 5, 6]...原创 2018-11-26 17:46:01 · 1503 阅读 · 0 评论 -
pandas之DataFrame类型文件保存
详细官网文档:https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_csv.html原创 2018-12-16 22:37:39 · 5689 阅读 · 0 评论 -
pandas之read_csv
import pandas as pd### 默认 header=0,第一行作为表头table=pd.read_csv('D:/test.csv',encoding="gbk")table.head() 序号 部门 职务 姓名 工作日期 基本工资 奖金 住房基金 保险费 实发工资0 1 办公室 主任 陈鹏 2002/9/1 7000.0 3700.0 130.0 100.0 10470....原创 2019-11-19 11:30:50 · 332 阅读 · 0 评论 -
pandas之groupby
import pandas as pdpath = 'https://raw.githubusercontent.com/HoijanLai/dataset/master/PoliceKillingsUS.csv'data = pd.read_csv(path,index_col=None)data.head()`` name date race ...原创 2019-11-20 17:58:48 · 400 阅读 · 0 评论 -
pandas之删除函数drop()
import pandas as pdimport numpy as npdf=pd.DataFrame(np.arange(12).reshape(3,4),index=list('EFJ'),columns=list('ABCD'))`#### 删除列(方法一)df.drop(columns=list('AB'))`` C DE 2 3 F 6 7 J 10 11 ### ...原创 2019-11-19 17:51:37 · 561 阅读 · 0 评论 -
pandas基本操作 python 排序
https://blog.youkuaiyun.com/chichoxian/article/details/53160301print(data)print(data[0]) ### 这种方法只能取一列数据print(data[[0,1]]) ###这样可以取多列数据print(data[0:3]) ### 取3行数据 0 1 2 3a ...原创 2019-12-09 14:49:40 · 331 阅读 · 0 评论