互联网电商订单数据订单的一般思路V1
找出问题 | 通过数值计算,分布规律,可视化方法来了解数据的基本情况 |
---|---|
分析问题 | 通过线性回归,逻辑回归找到自变量,因变量 |
解决问题 | 撰写数据报告,决策性分析 |
1.Python对数据集进行预处理
读取excel
import pandas as pd
data = pd.read_excel("某某订单.xlsx")
data.head()
数据清洗
data_cleaned = {'price':[],'sku':[],'address':[]}
for i in range(20921):
if data.loc[i,'联系地址'] != '--': #将联系地址有问题的数据不要
data_cleaned['price'].append(data.loc[i,'商品价格'])
data_cleaned['address'].append(data.loc[i,'联系地址'])
data_cleaned['sku'].append(data.loc[i,'商品编号'])
df = pd.DataFrame(data_cleaned)
print(df)
保存数据
import pandas as pd
import os
excels = [pd.read_excel(fname) for fname in os.listdir('文件路径') if 'xls' in fname]
df = pd.concat(excels)
df.to_excel('汇总.xlsx',index = False)
其实处理数据的工具有很多,数据量不大的情况下用excel的筛选处理也是很方便的
2.订单数据的分析思路


不同订单数据类型 | 不同订单分析目的 |
---|---|
按季度、年进行订单统计 | 行业/市场需求波动分析 |
按月进行订单统计 | 公司/部分业绩波动分析 |
按小时进行订单统计 | 消费者/用户消费习惯分析 |
按分钟/秒进行订单统计 | 促销/活动即时效果分析 |
3.常用的可视化图表
3.1构成类
- 饼图/环形图
- 玫瑰图
- 旭日图
- 仪表盘
- 矩阵树图
- 瀑布图
3.2对比类
- 柱状图/堆积柱状图
- 条形图/堆积条形图
- 折线图
- 帕累托图
- 双轴图
- 漏斗图
3.3分布类
- 气泡图/散点图
- 地图
- 热力图
3.4关系类
- 桑基图
- 关系树/关系图
当我们做数据可视化时,可以先对现有的数据进行分析,得出自己的初步结论,明确要表达的信息和主题(即你通过图表要说明什么问题)。然后根据这个目的在现有的或你知道的图表信息库中选择能够满足你目标的图表类型。最后开始动手制作图表,并对图表进行美化、检查,直至最后图表完成。