- 博客(3)
- 收藏
- 关注
原创 数据分析学习笔记(二)——数据可视化进阶
这次我们来看一下使用Python进行更深入的数据可视化分析,使用的包为seaborn。seaborn包中有一些内置数据集,类似于Titanic和iris,使用load_dataset可以读取使用。我们选择鸢尾花数据集进行示例import seaborn as sns#查看内置数据集列表sns.get_dataset_names()...
2021-01-19 14:21:27
452
原创 数据分析学习笔记(一)——描述性统计
在我们进行数据分析时,需要在刚刚拿到数据的项目初期进行数据探索性分析,方便你对数据有一定的了解。我们要运用描述性统计的方法,通过观察数据集各个指标状况梳理自己的思维,也可以帮助我们更好的向他人展示数据分析结果。描述性统计主要包括数值指标的分析和数据可视化分析 统计数值分析我们使用Python进行数值分析时,一般会用到Numpy和Scipy两个包。import numpy as npimport scipy as spnp.mean(data) #均值np.median(data
2021-01-17 10:20:02
1472
原创 Kaggle竞赛——Titanic
找回了自己的优快云账号,想从头记录一下自己做kaggle竞赛的经历,第一篇当然要从人人都爱的Titanic写起。 Titanic项目大概是Kaggle上最受欢迎的项目了,截止到我提交结果的时候已经有18000多人提交了预测结果。参与人数众多,也诞生了很多优秀的kernel,使这个项目成为了萌新熟悉kaggle竞赛的唯一指定项目。大佬们分享的经验就像出新手村的首冲礼包,能让你在数据分析的路上快速成长。项目简介 首先我们看一下这个项目的介绍(因为懒这里就放了官方的介绍):The sinki
2021-01-11 16:23:06
690
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人