安装更新pandas:pip install pandas --upgrade i https://mirrors.163.com/pypi/simple/
数据分析(四)学习笔记,Pandas进阶
一.Pandas中的数据类型
1.常用的7种
object :这种数据类型是常见的字符串类型
int64 : 64位整数 2**8,-127 127
float64 :浮点数,常用于表示带有小数的数字
bool :逻辑值,常用于True/False
datetime64 :时间和日期类型
timedelta:用于表示两个时间之间的差值
category:分类(Category) 数据:直白来说,就是取值为有限的,或者说是固定
数量的可能值。例如:性别、血型
2.数据类型转换模式
在Pandas中数据类型转换常用如下两种方式:
1 <column>.astype(<desired type>)这样的方式
2使用转换帮助函数,例如pd.to_numeric or pd.to_datetime
3.数据类型转换函数的最常见模式
1 pd.to_numeric() 等同于.astype(int)
2 pd.to_datetime() 重要度75%
3 pd.to_timedelta() 计算时间差 6/2--6/5
138>.
使用转换函数:最大的好处是如果转换过程出现值的错误,可以忽略转换错
误,例如errors='ignore' 开关

本文是数据分析第四部分的学习笔记,主要介绍Pandas中的数据类型,包括7种常用类型及转换方法。讲解了如何通过astype和pandas.to_numeric进行数据类型转换,并提供了实战例子。此外,还探讨了Pandas的dt、str和cat数据访问转换器,以及数据合并的垂直方法。
最低0.47元/天 解锁文章
707

被折叠的 条评论
为什么被折叠?



