
pandas
文章平均质量分 71
数据分析与统计学之美
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
DataFrame(14):对比MySQL学习“Pandas的groupby分组聚合”(超详细)
本文叙述使用的“数据集”链接下载地址如下:http://note.youdao.com/noteshare?id=5f44492149116cb6c52233786c1ca98d&sub=6C35AFC6AF9441648F245393DCAC61CB1、MySQL和Pandas做分组聚合的对比说明1)都是用来处理表格数据不管是mysql,还是pandas,都是处理像excel那样...原创 2020-02-09 11:15:48 · 5060 阅读 · 0 评论 -
DataFrame(12):数据转换——apply(),applymap()函数的使用
1、apply()函数1)apply()函数作用① apply()函数作用于Series 和Series的map()方法作用是一样的,依次取出Series中的每一个元素作为参数,传递给function函数,进行一次转换。② apply()函数作用于DataFrame 依次取出DataFrame中的每一个元素作为参数,传递给function函数,进行转换。注意:DataFrame中的每...原创 2020-02-07 23:01:44 · 2609 阅读 · 0 评论 -
DataFrame(11):数据转换——map()函数的使用
1、map()函数1)map()函数作用 将序列中的每一个元素,输入函数,最后将映射后的每个值返回合并,得到一个迭代器。2)map()函数原理图原理解释: 上图有一个列表,元素分别是从1-9。map()函数的作用就是,依次从这个列表中取出每一个元素,然后放到f(x)函数中,最终得到一个通过函数映射后的结果。 3)map()内置函数和Series的map()方法① map作为...原创 2020-02-07 22:51:09 · 25373 阅读 · 2 评论 -
DataFrame(10):DataFrame运算——累计统计函数
1、相关函数说明2、原始数据df = pd.DataFrame({"id":["00{}".format(i) for i in range(1,10)], "score":[2,3,4,4,5,6,7,7,8]})display(df)结果如下:3、cumsum()函数:求前n个元素的累积值(很重要的一个函数)df = pd.DataFra...原创 2020-02-07 22:36:01 · 12843 阅读 · 0 评论 -
DataFrame(13):DataFrame的排序与排名问题
1、说明 DataFrame中的排序分为两种,一种是对索引排序,一种是对值进行排序。 对于索引排序,涉及到对行索引、列索引的排序,并且还涉及到是升序还是降序。函数df.sort_index(axis= , ascending= , inplace=),需要特别注意这三个参数。axis表示对行操作,还是对列操作;ascending表示升序,还是降序操作。 对于值排序,同样也是涉及到行、列...原创 2020-02-04 12:14:17 · 45901 阅读 · 4 评论 -
阿里面试题:Pandas中合并数据的5个函数,各有千秋!
Pandas中合并数据的5个函数,各有千秋!原创 2021-09-13 10:03:40 · 1718 阅读 · 1 评论 -
Pandas与openpyxl库的超强结合,再见,Excel!
Pandas与openpyxl库的超强结合,再见,Excel!原创 2021-09-08 09:51:33 · 19227 阅读 · 9 评论 -
Pandas.set_option()函数的5种技巧,学完惊呆了!
Pandas.set_option()函数的5种技巧,学完惊呆了!原创 2021-07-31 10:29:03 · 14431 阅读 · 0 评论 -
Pandas系列教程:盛大开篇了!
Pandas系列教程:盛大开篇了!原创 2021-06-06 08:59:02 · 7672 阅读 · 11 评论 -
6000字 “保姆级” 教程 | 讲述Pandas库的数据读取、数据获取、数据拼接、数据写出!
讲述Pandas库的数据读取、数据获取、数据拼接、数据写出原创 2021-05-15 15:14:05 · 2519 阅读 · 18 评论 -
超赞!两张小抄,带你 “迅速” 掌握Pandas “数据清洗” 流程!
两张小抄,带你 “迅速” 掌握Pandas “数据清洗” 流程!原创 2021-04-14 17:27:26 · 3093 阅读 · 10 评论 -
用了的都说好 | 详解16个Pandas函数,让你的 “数据清洗” 能力提高100倍!
真的超级棒!原创 2021-04-13 12:55:33 · 1392 阅读 · 4 评论 -
总结了这67个pandas函数,完美解决数据处理,拿来即用!
总结了这67个pandas函数,完美解决数据处理,拿来即用!原创 2021-04-11 16:56:58 · 48339 阅读 · 58 评论 -
直接保存“DataFrame表格”到本地,这个“骚操作”90%以上的人不知道!
直接保存“DataFrame表格”到本地,这个“骚操作”90%以上的人不知道!原创 2020-10-27 21:32:34 · 4030 阅读 · 36 评论 -
pandas导出Excel表格,银行卡号、身份证号无法正常显示的问题,该怎么解决?
pandas导出Excel表格,银行卡号、身份证号无法正常显示的问题,该怎么解决?原创 2020-07-18 22:24:08 · 3022 阅读 · 0 评论 -
对比MySQL,学会在Pandas中实现SQL的常用操作
对比MySQL,学会在Pandas中实现SQL的常用操作原创 2020-07-16 10:48:11 · 981 阅读 · 0 评论 -
对比python字符串函数,学习pandas的str矢量化字符串函数
我们不仅要学会怎么处理单个字符串,这个就需要学习“python字符串函数”,我们还要学会怎么处理二维表格中每一列每一格的字符串,这个就需要学习“pandas的str矢量化字符串函数”原创 2020-06-29 22:48:20 · 1781 阅读 · 2 评论 -
一文带你搞懂pandas中的时间处理(详细)
目录 1、pandas中6个时间相关的类 2、Timestamp类 1)查看时间列,是str字符串列,还是时间格式列 2)使用pd.to_datetime()将字符串,转换为日期格式 3)Timestamp类只能表示1677年-2262年的时间 4)Timestamp类常用属性 3、DatetimeIndex与PeriodIndex函数:类似于to_da...原创 2020-03-13 13:24:10 · 39094 阅读 · 6 评论 -
pandas:数据离散化与离散化数据的后期处理(one-hot)
目录 1、什么是数据离散化? 2、为什么要进行数据离散化? 3、怎么进行数据离散化? 1)连续性数据变量的离散化:pd.cut()和pd.qcut() 2)pd.cut()和pd.qcut()的使用说明 3)pd.cut()配合value_counts()使用 4、离散化数据的后期处理(one-hot编码)? 1)pd.get_dummies(data,pr...原创 2020-03-11 13:40:05 · 3059 阅读 · 0 评论 -
对比excel,学习pandas数据透视表
1、excel中做数据透视表1)步骤如下① 选中整个数据源;② 依次点击“插入”—“数据透视表”③ 选择在Excel中的哪个位置,插入数据透视表④ 然后根据实际需求,从不同维度展示结果⑤ 结果如下2、pandas中使用pivot_table()做数据透视表1)语法格式pd.pivot_table(data,index=None,columns=None, ...原创 2020-02-18 11:10:03 · 1614 阅读 · 2 评论 -
python将中文日期转换为数字日期
1、说明 这篇文章是帮一个群友解答的问题。 他有一个需求,就是对于日期的录入都是中文形式的,需要转换为数字形式的。由于python库中没有函数直接进行转换,因此我写了本篇文章。 对于本篇文章中的代码,如果有不懂的地方,可以留言说明,我会解答。 2、测试源数据如下3、代码如下df = pd.read_excel(r"C:\Users\黄伟\Desktop\chinese_en...原创 2020-02-11 17:04:12 · 6847 阅读 · 1 评论 -
DataFrame(6):DataFrame的增、删、改、查
1、说明增:增加一行或一列;删:删出一行或一列;改:修改某行或某列;查:获取Datarame中的值;2、查:获取值 这里需求在之前的文章讲述过了,大家可以参考这个文章:http://note.youdao.com/noteshare?id=4c36823786ffae864979fa71dff6f3b1&sub=0B0848DE6BD740FFB5198B8B3DF63E...原创 2020-02-09 20:01:18 · 2571 阅读 · 0 评论 -
DataFrame(9):DataFrame运算——基本统计函数
1、常用函数说明在df中使用统计函数,其实很简单,我们主要关注以下3点,就没问题: ① 了解每个函数的具体含义是什么; ② 不管是Series还是DataFrame,默认都是自动忽略NaN值,进行运算的; ③ DataFrame有行、列区分,因此在使用统计函数的时候,一般是结合axis=0或者axis=1参数对df中的哪一行、哪一列进行操作;注意:axis的具体含义,在操作DataFr...原创 2020-02-07 22:24:50 · 10398 阅读 · 0 评论 -
DataFrame(8):DataFrame运算——逻辑运算(用于筛选数据)
1、DataFrame逻辑运算逻辑运算符号:> >= < <= == !=复合逻辑运算符:& | ~逻辑运算函数:query()、isin()、between()逻辑运算的作用:利用逻辑运算,用于筛选数据(很重要)2、原始数据文件链接如下http://note.youdao.com/noteshare?id=bc204b1f...原创 2020-02-07 22:05:01 · 14881 阅读 · 4 评论 -
DataFrame(7):DataFrame运算——算术运算
1、DataFrame算术运算加:add 或 +减:sub 或 -2、DataFrame与标量之间的运算(这个才是最重要的)1)原始数据x = [[np.nan,1,1,1,1],[2,2,np.nan,2,2],[3,3,3,3,3],[4,np.nan,4,4,4]]df = pd.DataFrame(x,columns=list("abcde"))display(df)...原创 2020-02-04 22:36:18 · 9447 阅读 · 0 评论 -
DataFrame(1):DataFrame结构的详细介绍
1、DataFrame数据结构的解释说明 index表示的是行索引,column表示的是列索引,values表示的是数值,其实不管是行索引,还是列索引都可以看作是索引Index。从每一行来看,DataFrame可以看作是一行行的Series序列上、下堆积起来的,每个Series的索引就是列索引[0,1,2,3];从每一列来看,DataFrame可以看作是一列列的Series序列左右堆积起来的...原创 2020-02-03 22:02:22 · 10144 阅读 · 0 评论 -
DataFrame(5):DataFrame元素的获取方式(很重要)
1、学习DataFrame元素获取,需要掌握以下几个需求访问一列 或 多列访问一行 或 多行访问某个值访问某几行中的某几列访问某几列中的某几行2、构造一个DataFramedf = pd.DataFrame(np.random.randint(70,100,(4,5)), index=["地区1", "地区2", "地区3","地区4"], ...原创 2020-02-03 16:32:53 · 14846 阅读 · 3 评论 -
DataFrame(3):DataFrame常用属性说明
1、常用属性如下ndim 返回DataFrame的维数;shape 返回DataFrame的形状;dtypes 返回DataFrame中每一列元素的数据类型;size 返回DataFrame中元素的个数;T 返回DataFrame的转置结果;index 返回DataFr...原创 2020-02-02 22:44:05 · 4961 阅读 · 0 评论 -
Series(五):Series的增、删、改、查
1、说明增:增 【增加索引的方式,增加值】;删:删 【删除索引的方式,删除值】;改:修改值 【获取到某个值后,采用赋值方式修改值】 ;查:获取值 【切片和索引方式】;2、查:获取值这里在之前的文章讲述过了,大家可以参考这个文章:http://note.youdao.com/noteshare?id=1d1cdc13237f290f8cef513f9e...原创 2020-02-02 20:38:58 · 10781 阅读 · 0 评论 -
DataFrame(4):DataFrame的创建方式
1、利用字典生成DataFrame① 第一种方式:列表组成的字典stu = {"name":["张三","李四","王燕"], "age":[18,20,22], "sex":["男","男","女"]}df = pd.DataFrame(stu)display(df)结果如下:② 第二种方式:上述方式的一般形式person = {"name":"To...原创 2020-02-02 10:25:10 · 4111 阅读 · 0 评论 -
Series(四):Series的底层就是ndarray数组,讲述一下它们在运算时的异同。
1、说明 由于pandas的底层是集成了numpy,因此Series的底层数据就是使用ndarray来构建的,因此我们得到了一个Series后,就可以使用numpy中的函数,对数据进行操作。但是Series与ndarry不同的地方在于,Series中多了一个索引。 这些问题都是细节问题,只有熟悉了这些细节知识,对于我们熟练使用numpy和pandas都是由很大帮助的。Series地底层数据...原创 2020-02-01 21:49:35 · 1628 阅读 · 0 评论 -
DataFrame中关于object数据类型的说明
1、构造一个DataFrame 从上图可以看出,我们构造了一个DataFrame,这个DataFrame有2列,第一列全部都是数值类型,第二列中既有数值类型又有布尔类型。对于col1列,由于都是同一种数据类型,系统能够辨认出来,这是一种int数值类型(int64是一种默认的数据类型);对于col2列,由于这一列既有数值类型又有布尔类型,系统无法辨认,即不能给出一个统一的数据类型,因此显示的是...原创 2020-02-01 16:05:25 · 10322 阅读 · 2 评论 -
足球运动员的数据分析实战(python)
1、案例背景 当前,足球运动是最受欢迎的运动之一。在此万受瞩目的运动下,打算针对足球运动员个人的信息,技能水平等各项指标进行相关的分析与统计。例如,我们可能会关注如下的内容:足球运动员是否受出生日期的影响?左撇子适合踢足球吗?足球运动员的号码是否与位置相关?足球运动员的年龄与能力具有怎样的关联?哪些技能会对足球运动员的综合能力造成较大的影响?2、任务说明 目前,我们收集到了...原创 2020-01-18 09:52:18 · 22690 阅读 · 25 评论 -
Series(一):Series的创建方式和常用属性说明
1、list、ndarray、Series的简单比较list列表,列表中的元素可以是不同的数据类型,使用从0开始的整数值作为默认索引;ndarray数组,数组中的元素必须是同种数据类型,也是使用从0开始的整数值作为默认索引;Series序列,是一种一维的结构,类似于一维列表和ndarray中的一维数组,但是功能比他们要更为强大,Series由两部分组成:索引index和数值values;...原创 2020-01-05 21:44:27 · 16631 阅读 · 2 评论