深度之眼比赛实战（未来销售预测）项目记录——1——赛题分析

最新推荐文章于 2022-06-17 15:15:04 发布

原创最新推荐文章于 2022-06-17 15:15:04 发布 · 725 阅读

1 ·

CC 4.0 BY-SA版权

网课学习专栏收录该内容

19 篇文章

订阅专栏

本次分享聚焦于竞赛题目解读，涵盖数据下载、导入及初步分析。通过EDA和数据可视化，深入理解数据特征，为构建有效模型奠定基础。作业要求撰写背景资料报告，探索数据集组合方式。

任务

学习时长：1/13——1/14
任务名称：赛题解读以及数据下载导入、赛题的理解分析
任务简介：赛题的初步理解分析
详细说明：
本节将会赛题的背景资料的了解以及数据文件的分布以及数据的下载以及本地导入，赛题的理解分析通过对构建自己对构建特征来说有一个比较大的作用，针对于数据的解读来说比较重要的一环。
数据的解读包括数据的EDA、数据的可视化，数据的类型、数据的文件分布、数据的特征组合的一些猜测都在这里面会涉及到。
代码数据下载：
链接：https://pan.baidu.com/s/1PS_iY_vyTWFM5L04UTL2fA
提取码：lryb
作业名称（详解）：针对于这个数据集的一些想法，如何把这么多个数据及放到一起，组合成新的数据集，网上搜集这个比赛的背景资料，写成一个报告（报告的截图也行）。
作业提交形式：
打卡内容：PPT截图或手写拍照,打卡提交.（可以只是文字提交，或图片提交，或组合都行）
打卡截止时间：1/14

打卡

1. 赛题

1.1 背景介绍

在这里插入图片描述

1.2 目标描述

在这里插入图片描述

1.3 文件说明

在这里插入图片描述

2. 数据初步探索

import numpy as np
import pandas as pd

数据导入

data = pd.read_csv('sales_train.csv')
# data = pd.read_csv('test.csv')
# data = pd.read_csv('items.csv')
# data = pd.read_csv('item_categories.csv')
# data = pd.read_csv('shops.csv')

逐个查看