【抖音】Python数据可视化关于奥运健儿抖音相关数据

📣 前言

  • 👓 可视化主要使用 Plotly
  • 🔎 数据处理主要使用 pandas
  • 👉 本文是我自己在和鲸社区的原创

今天这篇文章将给大家介绍【【抖音】Python数据可视化关于奥运健儿抖音相关数据】 案例。

Step 1. 导入模块

import pandas as pd   
import plotly.graph_objects as go  
 import plotly.express as px

Step 2. 数据概览

file_path = '/home/mw/input/douy1497/奥运健儿抖音相关数据_241012_1728716729.xlsx'   
data = pd.read_excel(file_path)      
data.head()

Step 3. 数据分析及其可视化

3.1 达人的粉丝数进行排序可视化分析

3.2 粉丝增长分析

研究近30天新增粉丝数与作品数、互动数之间的关系,以及不同账号类型的粉丝增长情况。

相关性分析

计算近30天新增粉丝数与近30天作品数、近30天评论数、近30天点赞数之间的皮尔逊相关系数,以了解它们之间的线性关系。

correlation_columns = ['近30天新增作品数', '近30天互动平均数', '近30天互动中位数', '近30天新增粉丝数']   
correlation_matrix = data[correlation_columns].corr()      
correlation_matrix

账号类型分析

根据账号类型分组,计算每组近30天新增粉丝数的平均值,以了解不同账号类型的粉丝增长情况。

average_growth_by_type = data.groupby('达人类型')['近30天新增粉丝数'].mean().sort_values(ascending=False)  
 average_growth_by_type

scatter_data = data[['近30天新增作品数', '近30天新增粉丝数']]   regression_line_data = data[['近30天互动平均数', '近30天新增粉丝数']]   
bar_data = average_growth_by_type.reset_index()  
 bar_data

可视化

使用散点图和回归线来可视化近30天新增粉丝数与作品数、互动数之间的关系。

使用条形图来可视化不同账号类型的近30天新增粉丝数平均值。

3.3 账号类型分析

分析不同类型的账号(如生活、体育、明星八卦等)在粉丝数、作品数、点赞数等方面的差异。

不同账号类型的粉丝数、作品数、总获赞数的分布情况


项目地址

https://www.heywhale.com/mw/project/6711df0d739a15610f8fb74b

项目所用数据集&源码

关注公众号,回复关键词【20241018】即可免费获取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值