背景描述
-
• 👓 可视化主要使用 Plotly
-
• 🔎 数据处理主要使用 pandas
-
• 👉 本文是我自己在和鲸社区的原创
今天这篇文章将给大家介绍【关于2025春节档电影票房数据的探索】 案例。
Step 1. 导入模块
import pandas as pd
import plotly.express as px
Step 2. 数据概览
df = pd.read_excel('/home/mw/input/chun7681/影片票房_250211_1739256248.xlsx', sheet_name='Sheet1') # 清理关键字段并转换数据类型 df['累计票房(万)'] = df['累计票房(万)'].astype(float)
df['当前票房(万)'] = df['当前票房(万)'].astype(float)
df['上映日期'] = pd.to_datetime(df['上映日期'])
Step 3. 数据分析及其可视化
# 计算累计票房占比 total_box_office = df['累计票房(万)'].sum()
df['票房占比'] = (df['累计票房(万)'] / total_box_office) * 100 # 取票房占比前10的电影
top_10 = df.groupby('电影名称')['累计票房(万)'].max().nlargest(10).index
df_top10 = df[df['电影名称'].isin(top_10)] # 计算每个电影的累计票房总和
top_10_box_office = df_top10.groupby('电影名称')['累计票房(万)'].sum().reset_index() # 绘制票房占比饼图
fig = px.pie( top_10_box_office, names='电影名称', values='累计票房(万)', title='春节档累计票房占比(Top 10)', labels={'累计票房(万)': '票房(万)'}, hole=0.3 # 如果想做环形饼图,可以加上 hole=0.3 )
# 显示图表
fig.show()
项目所用数据集&源码
关注【布鲁的Python之旅】公众号,回复关键词【20240211】即可免费获取