【Python数分实战】关于2025春节档电影票房数据的探索

背景描述

  • • 👓 可视化主要使用 Plotly

  • • 🔎 数据处理主要使用 pandas

  • • 👉 本文是我自己在和鲸社区的原创

今天这篇文章将给大家介绍【关于2025春节档电影票房数据的探索】 案例。

Step 1. 导入模块

import pandas as pd   
import plotly.express as px

Step 2. 数据概览

df = pd.read_excel('/home/mw/input/chun7681/影片票房_250211_1739256248.xlsx', sheet_name='Sheet1')         # 清理关键字段并转换数据类型   df['累计票房(万)'] = df['累计票房(万)'].astype(float)  
 df['当前票房(万)'] = df['当前票房(万)'].astype(float)   
 df['上映日期'] = pd.to_datetime(df['上映日期'])

Step 3. 数据分析及其可视化

# 计算累计票房占比   total_box_office = df['累计票房(万)'].sum()  
df['票房占比'] = (df['累计票房(万)'] / total_box_office) * 100      # 取票房占比前10的电影   
 top_10 = df.groupby('电影名称')['累计票房(万)'].max().nlargest(10).index   
 df_top10 = df[df['电影名称'].isin(top_10)]      # 计算每个电影的累计票房总和   
 top_10_box_office = df_top10.groupby('电影名称')['累计票房(万)'].sum().reset_index()      # 绘制票房占比饼图   
 fig = px.pie(       top_10_box_office,       names='电影名称',       values='累计票房(万)',       title='春节档累计票房占比(Top 10)',       labels={'累计票房(万)': '票房(万)'},       hole=0.3  # 如果想做环形饼图,可以加上 hole=0.3   )      
 # 显示图表   
 fig.show()

项目所用数据集&源码

关注【布鲁的Python之旅】公众号,回复关键词【20240211】即可免费获取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值