📣 前言
- 👓 可视化主要使用 Plotly
- 🔎 数据处理主要使用 pandas
- 👉 本文是我自己在和鲸社区的原创
今天这篇文章将给大家介绍【【抖音】Python数据可视化关于奥运健儿抖音相关数据】 案例。
Step 1. 导入模块
import pandas as pd
import plotly.graph_objects as go
import plotly.express as px
Step 2. 数据概览
file_path = '/home/mw/input/douy1497/奥运健儿抖音相关数据_241012_1728716729.xlsx'
data = pd.read_excel(file_path)
data.head()
Step 3. 数据分析及其可视化
3.1 达人的粉丝数进行排序可视化分析
3.2 粉丝增长分析
研究近30天新增粉丝数与作品数、互动数之间的关系,以及不同账号类型的粉丝增长情况。
相关性分析
计算近30天新增粉丝数与近30天作品数、近30天评论数、近30天点赞数之间的皮尔逊相关系数,以了解它们之间的线性关系。
correlation_columns = ['近30天新增作品数', '近30天互动平均数', '近30天互动中位数', '近30天新增粉丝数']
correlation_matrix = data[correlation_columns].corr()
correlation_matrix
账号类型分析
根据账号类型分组,计算每组近30天新增粉丝数的平均值,以了解不同账号类型的粉丝增长情况。
average_growth_by_type = data.groupby('达人类型')['近30天新增粉丝数'].mean().sort_values(ascending=False)
average_growth_by_type
scatter_data = data[['近30天新增作品数', '近30天新增粉丝数']] regression_line_data = data[['近30天互动平均数', '近30天新增粉丝数']]
bar_data = average_growth_by_type.reset_index()
bar_data
可视化
使用散点图和回归线来可视化近30天新增粉丝数与作品数、互动数之间的关系。
使用条形图来可视化不同账号类型的近30天新增粉丝数平均值。
3.3 账号类型分析
分析不同类型的账号(如生活、体育、明星八卦等)在粉丝数、作品数、点赞数等方面的差异。
不同账号类型的粉丝数、作品数、总获赞数的分布情况

项目地址
https://www.heywhale.com/mw/project/6711df0d739a15610f8fb74b
项目所用数据集&源码
关注公众号,回复关键词【20241018】即可免费获取