Python数据分析-在线销售数据集(热门市场数据各种产品类别的全球交易)

一、研究背景

全球电子商务的蓬勃发展使得在线销售成为了零售业的重要组成部分。随着互联网的普及和技术的进步,越来越多的消费者选择在网上购买各种商品,从电子产品到家庭用品,再到服装和书籍。尤其是在全球疫情的背景下,在线销售进一步加速了其增长步伐。通过对在线销售数据的分析,我们可以了解消费者的购买行为、热门产品类别、区域销售趋势以及支付方式的偏好等重要信息。

在这个研究中,我们通过分析全球范围内不同产品类别的在线销售数据,试图揭示在线销售市场的关键趋势和特点。数据集中包括了详细的交易记录,每一笔记录都包含了订单编号、日期、产品类别、产品名称、销售数量、单价、总收入、地区和付款方式等信息。通过对这些数据的详细分析,可以帮助企业的市场营销策略提供有价值的洞见。

二、研究意义

  • 了解消费者行为:通过分析在线销售数据,可以了解不同地区和不同产品类别的消费者行为和偏好,帮助企业制定更有针对性的市场营销策略。

  • 优化产品供应链:识别出哪些产品在特定区域更受欢迎,可以帮助企业优化供应链管理,提高库存周转率,降低运营成本。

  • 市场拓展策略:通过分析不同市场的销售数据,可以帮助企业在这些市场中开展有针对性的市场拓展活动,提升市场占有率。

  • 支付方式分析:分析不同地区消费者的支付方式偏好,可以帮助企业优化支付系统,提高交易成功率和客户满意度。

三、实证分析


该数据集提供了不同产品类别的在线销售交易的全面概述。每行代表一个交易记录,其中包含详细信息,例如订单 ID、日期、类别、产品名称、
销售数量、单价、总价、区域和付款方式。

列:
订单编号:每个销售订单的唯一标识符。
日期:销售交易记录的日期。
类别:所售产品的广泛类别(例如,电子产品、家用电器、服装、书籍、美容产品、运动用品)。
中文名称:所售产品的具体名称或型号。
数量:交易中销售的产品单位数。
单价:一个单位产品的价格。
总价:销售交易产生的总收入(数量 * 单价)。
地区:发生交易的地理区域(例如,北美、欧洲、亚洲)。
付款方式:用于付款的方式(例如,信用卡、PayPal、借记卡)。

数据和代码

首先读取数据集

import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px
import seaborn as sns
import numpy as np
import warnings
warnings.filterwarnings('ignore')

df = pd.read_csv('Online Sales Data.csv')

df.head()

 描述性统计分析

查看缺失值

df.isnull().sum()

 

没有缺失值

产品类别 "列中唯一值的计数

un_cat_count = df2['Product Category'].nunique()
print(f"Count of unique Categories: {un_cat_count}")

# 显示唯一类别名称
un_cat_names = df2['Product Category'].unique().tolist()
print(f"Names of unique Categories: {un_cat_names}")

 每个类别(产品类别)中有多少产品(产品名称)

cat_prod_count = cat_prod_count.reset_index()
cat_prod_count.columns = ['Product Category', 'Product Count']
cat_prod_count = cat_prod_count.sort_values(by='Product Count', ascending=False)

print(cat_prod_count)

# 显示水平条形图,并显示每个类别中的产品数量
plt.figure(figsize=(10, 6))
sns.barplot(x='Product Count', y='Product Category', data=cat_prod_count)
plt.title('Number of Products in each Category')
plt.xlabel('Number of Products')
plt.ylabel('Product Category')
plt.show()

按月份分析一段时间内的销售趋势 

df2["month_name"] = pd.DatetimeIndex(df2["Date"]).month_name()
df2["month_num"] = pd.DatetimeIndex(df2["Date"]).month

# 按日分析一段时间内的销售趋势
df2["day_name"] = pd.DatetimeIndex(df2["Date"]).day_name()
df2["day_num"] = pd.DatetimeIndex(df2["Date"]).dayofweek + 1

# 按月分组,并求和销售单位和总收入(所有地区)
sales_by_month = (df2.groupby(["month_num", "month_name"]).agg({"Units Sold": "sum", "Total Revenue": "sum"}).sort_values("month_num").reset_index())

# 按月份和地区分组,并求和已售出的单位数和总收入(按地区)
region_sales_by_month = (df2.groupby(["month_num", "month_name", "Region"]).agg({"Units Sold": "sum", "Total Revenue": "sum"}).sort_values("month_num").reset_index())

按月绘制单位销售量趋势图(所有地区)、绘制各月总收入趋势图(所有地区)、绘制按日计算的销售单位趋势图(按地区)、#绘制按日计算的总收入趋势图(按地区)

 

 按月计算 "销售单位 "和 "总收入 "的百分比变化(所有地区)

sales_by_month['Units Sold % Change'] = sales_by_month['Units Sold'].pct_change() * 100
sales_by_month['Total Revenue % Change'] = sales_by_month['Total Revenue'].pct_change() * 100

plt.figure(figsize=(13, 3))
plt.plot(sales_by_month['month_name'], sales_by_month['Units Sold % Change'], marker='o', label='Units Sold % Change')
plt.plot(sales_by_month['month_name'], sales_by_month['Total Revenue % Change'], marker='o', label='Total Revenue % Change')

plt.title('Percentage Change in Units Sold and Total Revenue by Month (All Regions)')
plt.xlabel('Month')
plt.ylabel('Percentage Change')
plt.legend()
plt.grid(True)
plt.show()

 按日计算 "单位销售量 "和 "总收入 "的百分比变化(所有地区)

plt.figure(figsize=(13, 3))
plt.plot(sales_by_days['day_name'], sales_by_days['Units Sold % Change'], marker='o', label='Units Sold % Change')
plt.plot(sales_by_days['day_name'], sales_by_days['Total Revenue % Change'], marker='o', label='Total Revenue % Change')

plt.title('Percentage Change in Units Sold and Total Revenue by Day (All Regions)')
plt.xlabel('Day')
plt.ylabel('Percentage Change')
plt.legend()
plt.grid(True)
plt.show()

 接下来探索不同产品类别在不同地区的受欢迎程度:

# 按产品类别和地区绘制销售单位图
plot_by_region(popularity_by_region, 'Units Sold', 'Product Category')

# 按产品类别和地区绘制总收入图
plot_by_region(popularity_by_region, 'Total Revenue', 'Product Category')

 

 绘制销售单位地图

# 根据地区添加国家列
popularity_by_region['Country'] = popularity_by_region['Region'].map(region_to_country)

# 按国家汇总数据
country_data = popularity_by_region.groupby('Country').sum(numeric_only=True).reset_index()

# 销售单位地图
fig_units = px.choropleth(country_data,
                          locations='Country',
                          locationmode='country names',
                          color='Units Sold',
                          hover_name='Country',
                          title='Units Sold by Country',
                          color_continuous_scale=px.colors.sequential.Plasma,
                          width=800,
                          height=500)

 接下来调查付款方式对销售量或收入的影响。
按付款方式分组,并求和销售单位和总收入

# 按付款方式绘制单位销售量图
plot_bar_chart(
    data=impact_of_payment_methods,
    x_column='Payment Method',
    y_column='Units Sold',
    xlabel='Payment Method',
    ylabel='Units Sold',
    title='Units Sold by Payment Method',
    colors=['orange', 'blue', 'green']
)

# 按付款方式绘制总收入图
plot_bar_chart(
    data=impact_of_payment_methods,
    x_column='Payment Method',
    y_column='Total Revenue',
    xlabel='Payment Method',
    ylabel='Total Revenue',
    title='Total Revenue by Payment Method',
    colors=['orange', 'blue', 'green']
)

按地区调查付款方式对销售量或收入的影响。 

按付款方式和地区绘制销售单位图

按支付方式和地区绘制总收入图 

 接下来确定每个类别中最畅销的产品,以优化库存和营销策略。

top_selling_products = df2.groupby(['Product Category', 'Product Name']).agg({'Units Sold': 'sum', 'Total Revenue': 'sum'}).reset_index()

# 按类别绘制销量最高产品的函数
def plot_something_by_category(df, x, max_count, title):
    fig, ax = plt.subplots(figsize=(14, 8))
    for category in df['Product Category'].unique():
        category_data = df[df['Product Category'] == category]
        category_data = category_data.nlargest(max_count, x)
        ax.barh(category_data['Product Name'], category_data[x], label=category)

    ax.set_xlabel(x)
    ax.set_ylabel('Product Name')
    ax.set_title(f"Top {max_count} {title}")
    ax.legend(title='Product Category')
    plt.xticks(rotation=45)
    plt.show()

按 "销售单位 "绘制销量最高的产品 

 按 "总收入 "绘制销量最高的产品

四、结论

根据在线销售数据集的分析,得出了一些关键结论:

  1. 消费者行为特征:不同地区的消费者在产品类别和支付方式上表现出显著的差异。例如,北美地区消费者更偏好购买电子产品,且多使用信用卡支付;而欧洲地区的消费者则更偏好购买家用电器和美容产品,并多使用PayPal支付。

  2. 销售趋势分析:分析显示,在不同时间段,特别是节假日和促销期间,在线销售显著增加。这表明企业可以利用这些高峰期进行营销活动以提升销售额。

  3. 产品类别偏好:不同地区和市场对产品类别的偏好存在明显差异,企业可以根据这些偏好调整其产品组合和市场策略,以满足不同市场的需求。

  4. 付款方式偏好:分析不同地区的付款方式,可以帮助企业在这些市场中提供更适合的支付选项,提高客户满意度和交易成功率。

总体而言,本研究揭示了全球在线销售市场的关键趋势和特点,为企业的市场营销和战略规划提供了重要的理论和实证依据。未来的研究可以在此基础上,结合更多的动态数据和更复杂的模型,进一步探索在线销售市场的发展趋势和内在机制。

 创作不易,希望大家多点赞关注评论!!!(类似代码或报告定制可以私信)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值