数据处理
文章平均质量分 83
a_2435542821
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Series中str属性的方法用途
在使用pandas框架的DataFrame的过程中,如果需要处理一些字符串的特性,例如判断某列是否包含一些关键字,某列的字符长度是否小于3等等这种需求,如果掌握str列内置的方法,处理起来会方便很多。 下面我们来详细了解一下,Series类的str自带的方法有哪些。1、cat() 拼接字符串例子:>>> Series([‘a‘, ‘b‘, ‘c‘]).str.ca...原创 2018-12-25 18:24:04 · 3878 阅读 · 0 评论 -
Pandas的set_index和reset_index用法
set_index():函数原型:DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)参数解释:keys:列标签或列标签/数组列表,需要设置为索引的列drop:默认为True,删除用作新索引的列append:默认为False,是否将列附加到现有索引inplace...转载 2019-07-30 19:05:54 · 555 阅读 · 0 评论 -
python和pandas空值不同之处以及缺失值空值的处理方法总结(一)
空值:python‘’,[],(),None,Null,等容器对象只要是空的默认就是falsepandas当类型为数值型时,Nan代表代表为空值,当类型为字符型的时候,None代表的是空字符串isnull(),notnull()函数只会识别这两个为空,‘’,[],(),Null都默认为是有值的,而又在 python中,nan又会认为是有值的字符串,它们是不能相互包容的。下面我们用例子来...原创 2019-05-09 11:29:23 · 2565 阅读 · 0 评论 -
详解Python中where()函数的用法
where()的用法首先强调一下,where()函数对于不同的输入,返回的只是不同的。0.返回的是一个数组元素的元组对象1当数组是一维数组时,返回的值是一维的索引,所以只有一组索引数组2当数组是二维数组时,满足条件的数组值返回的是值的位置索引,因此会有两组索引数组来表示值的位置例如? 1 2 3 4 5 6 7 ...转载 2019-02-11 14:42:44 · 7491 阅读 · 0 评论 -
DataFrame的创建---多级索引
多级索引:在一个轴上有多个(两个以上)的索引,能够以低维度形式来表示高维度的数据。单级索引是Index对象,多级索引是MultiIndex对象。一、创建多级索引方法一:隐式创建,即给DataFrame的index或columns参数传递两个或更多的数组。 df1 = pd.DataFrame(np.random.randint(80, 120, size=(2, 4)), ...转载 2019-01-18 16:38:27 · 5400 阅读 · 0 评论 -
数据处理常用到的一些方法/drop_duplicates()/映射map()/replace()/rename()/分箱/过滤异常值/随机抽样take()/random.permutation()
1、删除重复元素使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每个元素对应一行,如果该行不是第一次出现,则元素为Trueimport numpy as npimport pandas as pdfrom pandas import Series,DataFrameimport matplotlib.pyplot as plt%matplotli...转载 2018-12-25 18:35:20 · 501 阅读 · 0 评论 -
Pandas中resample方法详解,处理datetime 分时间段统计问题
Pandas中的resample,重新采样,是对原样本重新处理的一个方法,是一个对常规时间序列数据重新采样和频率转换的便捷的方法。方法的格式是:DataFrame.resample(rule, how=None, axis=0, fill_method=None, closed=None, label=None, convention=‘start’,kind=None, loffset=No...原创 2019-08-01 18:12:10 · 10082 阅读 · 0 评论
分享