Step 1. 导入模块
In [1]:
import numpy as np import pandas as pd import plotly.graph_objects as go import plotly.express as px import jieba from stylecloud import gen_stylecloud from IPython.display import Image # 用于在jupyter lab中显示本地图片Step 2. 乐高淘宝数据分析及其可视化
2.1 乐高淘宝数据概览
In [2]:
df_tb =pd.read_csv(r"/home/mw/input/legao3225/乐高淘宝数据.csv") df_tb.head()Out[2]:
goods_name shop_name price purchase_num location 0 乐高旗舰店官网悟空小侠系列80012孙悟 乐高官方旗舰店 1299.0 ['867人付款'] 浙江 嘉兴 1 LEGO乐高 71043收藏版哈利波特霍格沃兹城堡玩具礼物 天猫国际进口超市 3299.0 ['259人付款'] 浙江 杭州 2 LEGO乐高机械组布加迪42083粉丝收藏旗舰款玩具模型礼物 天猫国际进口超市 2799.0 ['441人付款'] 浙江 杭州 3 乐高旗舰店官网3月新品76895超级赛车系列法拉利赛车积木玩具男孩 乐高官方旗舰店 199.0 ['358人付款'] 浙江 嘉兴 4 乐高旗舰店官网3月新品得宝系列10921超级英雄实验室大颗粒益智 乐高官方旗舰店 299.0 ['126人付款'] 浙江 嘉兴 In [3]:
print("——" * 10) print('数据集存在重复值个数:') print(df_tb.duplicated().sum()) print("——" * 10) print('数据集缺失值情况:') print(df_tb.isna().sum()) print("——" * 10) print('数据集各字段类型:') print(df_tb.dtypes) print("——" * 10) print('数据总体概览:') print(df_tb.info())———————————————————— 数据集存在重复值个数: 993 ———————————————————— 数据集缺失值情况: goods_name 0 shop_name 0 price 0 purchase_num 0 location 0 dtype: int64 ———————————————————— 数据集各字段类型: goods_name object shop_name object price float64 purchase_num object location object dtype: object ———————————————————— 数据总体概览: <class 'pandas.
Python数据可视化淘宝天猫玩具销售数据
最新推荐文章于 2024-05-12 17:44:39 发布