python pandas部分应用记录

该博客介绍了如何使用pandas库读取CSV文件,创建DataFrame,并进行数据查询。具体包括按姓名查询学生年龄和分数,筛选age小于20岁的女性学生,按地区统计学生人数,以及根据分数添加mark列。最后,将处理后的数据保存为Excel文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

读取提供的文件students.csv中的数据,利用DataFrame进行如下操作:

  (1)读取数据,创建DataFrame,将sno作为索引;

import pandas as pd

import openpyxl

dfs=pd.read_csv(r'C:\Users\Administrator\Desktop\students.csv',encoding='gb18030',index_col='sno')

  (2)查询“刘欣”的age和score;

q1=dfs.loc[dfs.name=='刘欣'][['name','age','score']]

print(q1)

  1. 查询所有age小于20岁的女同学(sex=‘F’)的信息;

q2=dfs.loc[(dfs['age']<20) & (dfs['sex']=='F')]

q21=dfs.query("(sex=='F') and (age<20)")

print(q2)

print(q21)

  1. 按area统计各地区的学生人数,要求按人数的降序排;

q3=dfs.groupby("area").name.count().sort_values(ascending=False)

print(q3)

  (5)增加一列mark,如果score>=480,则标记为A,其他标记为B;

dfs['mark']='B'

dfs.loc[dfs['score']>=480,'mark']='A'

  1. 将修改后的数据保存为excel文件,文件名为stu.xlsx。

import pandas as pd

import openpyxl

dfs=pd.read_csv(r'C:\Users\Administrator\Desktop\students.csv',encoding='gb18030',index_col='sno')

print(dfs)

dfs.to_excel('C:\\Users\\Administrator\\Desktop\\tu.xlsx')

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

nycSerendipity

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值