18招,小白必看的数据分析招式|上篇

Pandas数据分析精要
本文精选Pandas在数据分析中的核心技巧,包括数据处理、提取、清洗及排序,使用泰坦尼克数据集实操,助您快速掌握数据分析关键步骤。

阅读本文大概需要3分钟

菜鸟独白

Python语言之所以能在数据分析领域占有一席之地,能挑战MatLab和R的地位,除了它本身语言的简洁和优美之外!还有一个非常重要的原因就是它有Pandas这样的神兵利器来做作数据分析,今天我就把Pandas里面精华招式给大家分享一下!

我们用比较有名的泰坦尼克数据集来做示例,通过对这个数据集的处理,来讲一下数据分析的常见招式和基本手法,让小白也可以快速上手数据分析!

要点:

  • 数据的基本处理

  • 数据的提取

  • 数据的初步清洗

  • 数据的排序

1.拿到一个数据的基本处理

1).查看数据的维度

df.shape

>>

(891, 12) 

这是一个891*12的数据集

2).查看数据的基本信息

df.info() #查看数据集的整体的数据类型,比如有的int,有的是float,有的时候还有datetime64等等

>>

或是看一下查看整个数据的整体的分布

df.describe()

>>

3).查看数据集的空值,或者说是缺失值

df.isnull().sum() 

>> Age列有177个空值,Cabin有687,Embarked有2个

4).查看唯一值 

df['Pclass'].unique() #比如查看数据里面 船仓的类别

>>

array([3, 1, 2])

5).查看数据集的前3行,后3行

df.head(3) #前3行

df.tail(3)    #后3行

2.数据的提取

比如我们看一下下面的排序后的样本泰坦尼克数据集df3

6).按照索引的值进行提取:

df3.loc[630] #提取索引值为630的那一行

7).按照索引的位置进行提取

df3.loc[2]#取第三行的数据

8).取部分行和列

df3.iloc[2:5,:5]#取第二,三四行和前5列

9).按照条件提取

比如我们要提取仓位为小于2的,并且性别为女性的数据

df[(df['Pclass']<=2)&(df['Sex']=='female')]

3.数据的清洗

10).处理空值,用dropna删除空值

df.dropna(how='any') #发现Age中的空值会全部删掉

df.fillna(value=0)#用数据0来填充空值

df['Age'].fillna(df['Age'].mean())#用数据集里面的年龄均值来填充空值

11).对字符的处理,比如大小写的转换

df['Name'].map(str.upper).head(3) 

12).对字符串的快速映射转换

df['Pclass']=df['Pclass'].map({1:'一等舱',2:'二等舱',3:'三等舱'})

df.head(3)

用map对序列可以轻松的进行转换处理,非常酷!

13).对数据集中的数据格式的改变

用dtypes可以查看数据的格式,对于的转换可以用astype来转换

df.dtypes

>>

df['Fare'].astype('int') #把原来的float64->int

14).更改列的名字

df.rename(columns={'Survived':'是否获救'})

15).去掉重复值

通过drop_duplicates可以快速的去掉重复值

df['Embarked'].drop_duplicates()#比如我们想知道登船的类别,去掉所有重复的数据

>>

16).数据的代替,替换

比如把male代替为男

df['Sex']=df['Sex'].replace('male','男')

df.head(3)

4.数据的排序

17).按照年龄进行降序排列

df.sort_values(by=['Age'],ascending=False).head(10)

18).按照index来排序

pandas是数据分析里面的神兵利器,非常好用也非常灵活!上面只是精选了一部分的招数,我们的后面会对数据的处理更多复杂技巧进行总结,敬请期待!

近期热门:

你必须掌握的20个python代码,短小精悍,用处无穷

十行代码,用Python做一个迷你版的美图秀秀

实战:Flask + Vue 生成漂亮的词云

Python和Go都很火,我要怎么选?

基于51单片机,实现对直流电机的调速、测速以及正反转控制。项目包含完整的仿真文件、源程序、原理图和PCB设计文件,适合学习和实践51单片机在电机控制方面的应用。 功能特点 调速控制:通过按键调整PWM占空比,实现电机的速度调节。 测速功能:采用霍尔传感器非接触式测速,实时显示电机转速。 正反转控制:通过按键切换电机的正转和反转状态。 LCD显示:使用LCD1602液晶显示屏,显示当前的转速和PWM占空比。 硬件组成 主控制器:STC89C51/52单片机(与AT89S51/52、AT89C51/52通用)。 测速传感器:霍尔传感器,用于非接触式测速。 显示模块:LCD1602液晶显示屏,显示转速和占空比。 电机驱动:采用双H桥电路,控制电机的正反转和调速。 软件设计 编程语言:C语言。 开发环境:Keil uVision。 仿真工具:Proteus。 使用说明 液晶屏显示: 第一行显示电机转速(单位:转/分)。 第二行显示PWM占空比(0~100%)。 按键功能: 1键:加速键,短按占空比加1,长按连续加。 2键:减速键,短按占空比减1,长按连续减。 3键:反转切换键,按下后电机反转。 4键:正转切换键,按下后电机正转。 5键:开始暂停键,按一下开始,再按一下暂停。 注意事项 磁铁和霍尔元件的距离应保持在2mm左右,过近可能会在电机转动时碰到霍尔元件,过远则可能导致霍尔元件无法检测到磁铁。 资源文件 仿真文件:Proteus仿真文件,用于模拟电机控制系统的运行。 源程序:Keil uVision项目文件,包含完整的C语言源代码。 原理图:电路设计原理图,详细展示了各模块的连接方式。 PCB设计:PCB布局文件,可用于实际电路板的制作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值