
DataWhale组队学习
秃头小菜鸟
这个作者很懒,什么都没留下…
展开
-
组队学习之Task5 第三章模型建立和评估
第三章 模型搭建和评估经过前面的探索性数据分析我们可以很清楚的了解到数据集的情况,以及得出了一些结论。下面我们将搭建一个预测模型,运用机器学习的方式来为泰坦尼克船只做一个预测,我们在测试集的数据中来预测哪些乘客将会存活,哪些乘客将遭遇不幸。然后我们会对我们的模型做一个评价。先一股脑导入常见的库import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltfrom IPytho原创 2020-08-27 15:51:02 · 494 阅读 · 0 评论 -
组队学习之Task 4 数据可视化
第二章:数据可视化这一part绘图,很多参数不知道开始之前,导入numpy、pandas以及matplotlib包和数据import numpy as npimport pandas as pdimport matplotlib.pyplot as plt %matplotlib inlineimport warningswarnings.filterwarnings("ignore")#加载result.csv这个数据text=pd.read_csv('result.csv')2.原创 2020-08-25 14:06:21 · 278 阅读 · 0 评论 -
组队学习之Task3 数据重构
第二章:数据重构2.4 数据的合并2.4.1 将data文件夹里面的所有数据都载入,观察数据的之间的关系text_left_up=pd.read_csv('data/train-left-up.csv')text_left_down=pd.read_csv('data/train-left-down.csv')text_right_up =pd.read_csv('data/train-right-up.csv') text_right_down=pd.read_csv('data/train-原创 2020-08-22 14:51:17 · 235 阅读 · 0 评论 -
Task 2 组队学习之数据清洗及特征处理
第二章:数据清洗及特征处理我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据清洗成可以分析或建模的亚子2.1 缺失值观察与处理我们拿到的数据经常会有很多缺失值,比如我们可以看到Cabin列存在NaN,那其他列还有没有缺失值,这些缺失值要怎么处理呢2.1.1 任务一:缺失值观察请查看每个特征缺失值个数方法一: Train_d原创 2020-08-20 22:28:10 · 367 阅读 · 0 评论 -
组队学习之Task1:数据加载及探索性数据分析
第一章:数据载入及初步观察1.1 载入数据数据集下载https://www.kaggle.com/c/titanic/overview1.1.1 导入numpy和pandasimport numpy as npimport pandas as pd1.1.2 载入数据(1) 使用相对路径载入数据Train_data=pd.read_csv('train.csv')Train_data.head(5) # 显然读入数据的前5行(2使用绝对路径载入数据Train_data=pd原创 2020-08-18 14:12:18 · 1027 阅读 · 0 评论