
pandas 总结
妖白
0 0 -
展开
-
利用python对数据时间转换过程中,datetime和pandas库中的时间函数区别与联系
数据格式如下:首先我们先了解datetime库与pd时间序列的区别与联系 可以看下博文https://blog.youkuaiyun.com/qq_24753293/article/details/80954840首先不管是datetime中的strptime strftime 还是pandas中的pd.to_datetime 都需要对数据格式进行统一即我们的 %Y-%m-%d %...原创 2019-10-29 10:40:02 · 2048 阅读 · 0 评论 -
python 数据清理时的常用函数
1 drop删除表中的某一行或者某一列更明智的方法是使用drop,它不改变原有的df中的数据,而是可选择性的返回另一个dataframe来存放删除后的数据。drop函数的使用:(1)删除行、列print(frame.drop(['a']))print(frame.drop(['b'], axis = 1))#drop函数默认删除行,列需要加axis = 1(2)inplac...原创 2019-10-24 15:01:42 · 2128 阅读 · 0 评论 -
pandas中字符串和日期的相互转换
原文地址:http://blog.youkuaiyun.com/luoganttcc/article/details/77585038?locationNum=8&fps=1将数字转化成时间格式from dateutil.parser import parsea=20170825b=str(a)c=parse(b)12345print(c)2017-08-25 0转载 2017-11-08 09:49:12 · 3996 阅读 · 0 评论 -
panda中contains函数的用法
contains函数就是检查数据中是否包含某种设定的字符df['Discount_rate'].str.contains(':') 比如这个就是赛选df文件下Discount_rate标签是否包含‘:’这个符号 有的话返回Ttue 没有的话返回False实际情况就是:contains筛选的其实是正则表达式运行结果就是0 False1 True2原创 2017-10-24 19:49:54 · 18101 阅读 · 0 评论 -
Pandas的 loc iloc ix 区别
原文地址 http://blog.youkuaiyun.com/roamer314/article/details/52179191import pandas as pd data = [[1,2,3],[4,5,6]] index = [0,1] columns=['a','b','c'] df = pd.DataFrame(data=data,转载 2017-10-25 08:51:58 · 412 阅读 · 0 评论 -
python3中的groupby函数用法
原文地址:http://www.cnblogs.com/zhangzhangwhu/p/7219651.html前言Python的pandas包提供的数据聚合与分组运算功能很强大,也很灵活。《Python for Data Analysis》这本书第9章详细的介绍了这方面的用法,但是有些细节不常用就容易忘记,遂打算把书中这部分内容总结在博客里,以便复习查看。根据书中的章转载 2017-10-25 10:29:43 · 120123 阅读 · 2 评论 -
python3 中的sort_values函数
首先 这个函数是对列进行排序的 即对values进行排序单列的大家都明白 这里我们讨论下多列的举个例子df = pd.DataFrame({ 'col1' : ['A', 'A', 'B', np.nan, 'D', 'C'], 'col2' : [2, 1, 9, 8, 7, 4], 'col3': [0, 1, 9, 4, 2, 3],})print(df)输出为 col1...原创 2018-06-14 14:59:09 · 24676 阅读 · 1 评论 -
python3中的rank函数
网上存在这么一个例子 obj = pd.Series([7,-5,7,4,2,0,4])obj.rank()输出为:0 6.51 1.02 6.53 4.54 3.05 2.06 4.5dtype: float64之前一直没弄懂是啥意思 这里解释下rank 表示在这个数在原来的向量中排第几名,有相同的数,按最小排序,取平均(默认)。这里解释...原创 2018-06-14 16:41:34 · 6916 阅读 · 1 评论