pandas实例——读取文件并进行数据分析练习

本文通过三个案例展示了如何利用pandas进行数据读取、分析和可视化。在案例一中,涉及读取订单数据,根据商品价格排序并提取最高价格商品;在案例二中,分析了吸烟与不吸烟顾客的消费金额与小费的关系;案例三则探讨了电影时长与排名的散点图关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

案例一

文件描述: 每列数据分别代表如下: 订单编号, 订单数量, 商品名称, 商品详细选择项, 商品总价格

  • 需求1:
    1). 从文件中读取所有的数据;
    2). 获取数据中所有的商品名称;
    3). 跟据商品的价格进行排序, 降序,
    将价格最高的20件产品信息写入mosthighPrice.xlsx文件中;

需求1:
1). 从文件中读取所有的数据;

goodsInfo = pd.read_csv('doc/chipo.csv')
print(goodsInfo.info())

2). 获取数据中所有的商品名称;

print("商品名称显示: \n", goodsInfo['item_name'].head())
print("商品名称显示: \n", goodsInfo.item_name.head())

在这里插入图片描述
3). 跟据商品的价格进行排序, 降序,
按照价格属性进行排序:sort_values
降序:ascending=False
将价格最高的20件产品信息写入mosthighPrice.xlsx文件中;
重新赋值;

goodsInfo.item_price = goodsInfo.item_price.str.strip('$').astype(np.float)
highPriceData = goodsInfo.sort_values('item_price', ascending=False)
print(highPriceData.head(5))
filename = '/tmp/mostHighPrice.xlsx'
highPriceData.to_excel(filename)
print
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值