Python数据可视化淘宝天猫玩具销售数据

本文主要介绍了对乐高在淘宝和天猫旗舰店的数据进行清洗、处理,包括去除重复值、数据类型转换、销售额计算等。内容涵盖了销量排名、价格分布分析、商品标题词云图的创建,以及天猫旗舰店的类似分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Step 1. 导入模块

In [1]:

import numpy as np
import pandas as pd
import plotly.graph_objects as go
import plotly.express as px
import jieba
from stylecloud import gen_stylecloud

from IPython.display import Image # 用于在jupyter lab中显示本地图片

Step 2. 乐高淘宝数据分析及其可视化

2.1 乐高淘宝数据概览

In [2]:

df_tb =pd.read_csv(r"/home/mw/input/legao3225/乐高淘宝数据.csv")
df_tb.head()

Out[2]:

goods_name shop_name price purchase_num location
0 乐高旗舰店官网悟空小侠系列80012孙悟 乐高官方旗舰店 1299.0 ['867人付款'] 浙江 嘉兴
1 LEGO乐高 71043收藏版哈利波特霍格沃兹城堡玩具礼物 天猫国际进口超市 3299.0 ['259人付款'] 浙江 杭州
2 LEGO乐高机械组布加迪42083粉丝收藏旗舰款玩具模型礼物 天猫国际进口超市 2799.0 ['441人付款'] 浙江 杭州
3 乐高旗舰店官网3月新品76895超级赛车系列法拉利赛车积木玩具男孩 乐高官方旗舰店 199.0 ['358人付款'] 浙江 嘉兴
4 乐高旗舰店官网3月新品得宝系列10921超级英雄实验室大颗粒益智 乐高官方旗舰店 299.0 ['126人付款'] 浙江 嘉兴

In [3]:

print("——" * 10)
print('数据集存在重复值个数:')
print(df_tb.duplicated().sum())
print("——" * 10)
print('数据集缺失值情况:')
print(df_tb.isna().sum())
print("——" * 10)
print('数据集各字段类型:')
print(df_tb.dtypes)
print("——" * 10)
print('数据总体概览:')
print(df_tb.info())
————————————————————
数据集存在重复值个数:
993
————————————————————
数据集缺失值情况:
goods_name      0
shop_name       0
price           0
purchase_num    0
location        0
dtype: int64
————————————————————
数据集各字段类型:
goods_name       object
shop_name        object
price           float64
purchase_num     object
location         object
dtype: object
————————————————————
数据总体概览:
<class 'pandas.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

暴躁的秋秋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值