(秦路)七周成为数据分析师(第七周)——Python

本文详细介绍了Pandas库在数据处理中的各种操作,包括Series和DataFrame的生成、索引读取、条件查找、数据类型转换、数据排序、统计分析、透视表创建以及与数据库交互等。此外,还涉及了文本处理、空值处理和数据可视化等内容,是Python数据科学领域的重要实践。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文章目录


anaconda:
esc + m 转换为markdown格式
tab:补全
shift+tab:查看函数

1.Python基础

简单函数
list=[i**2 for i in range(1,101) if i%2=0]

dict={"a":1,"b":2}
[v**2 for v in dict.values()]

def func(x):
	return x*x
[func(i) for i in range(1,11)]
list(map(func,[1,2,3,4,5]))

匿名函数:
lambda x:x*x

list(map(lambda x:x*x,[1,2,3,4,5]))

在这里插入图片描述
统计数字出现几次。另一种用第三方库的方式:
在这里插入图片描述

2.Pandas

series相当于数组,dataframe相当于excel表格

2.1 series

生成
s1=pd.Series([1,2,3,4])
s2=pd.Series([1,2,3,4],index=['a','b','c','d']) #可修改索引

在这里插入图片描述
在这里插入图片描述

用索引读取相应的行

在这里插入图片描述
在这里插入图片描述

2.2 DataFrame

生成

在这里插入图片描述

查看形状

df.shape
df.shape[0] or len(df)

查看属性和信息

在这里插入图片描述

查看数据类型
df.dtypes
查看某列有多少种元素
#方法一:
len(df['name'].unique())
查看某一列各元素出现的次数

df['name'].value_counts()

查看某列各元素的长度
# 方法一:
df['name'].str.len()
# 方法二:
df['name'].map(lambda x: len(x))
用索引读取相应的行和列

在这里插入图片描述

查看索引范围

在这里插入图片描述

按条件查找

在这里插入图片描述

用query按条件查找

在这里插入图片描述

用iloc和loc查找行

在这里插入图片描述

提取某列的特定行
# 方法一:
df.iloc[[1,10,15], 0]

# 方法二:
df['createTime'][[1,10,15]]

# 方法三:
df['createTime'].take([1,10,15])
将所有列倒序排列
#方法一:
df.iloc[:, ::-<
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值