自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 数据分析入门task5

本记录为本人参加datawhale数据分析(泰坦尼克号任务项目)学习笔记,不足之处多多指教。经过前面的两章的知识点的学习,我可以对数数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作。那么下面我们就要开始使用我们前面处理好的数据了。这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。那么分析的第一步就是建模,搭建一个预测模型或者其他模型;我们从这个模型的到结果之后,我们要分析我的模型是不是足够的可靠,那我就需要评估这个模型。

2021-12-23 16:46:59 1637

原创 数据分析入门task4

本记录为本人参加datawhale数据分析(泰坦尼克号任务项目)学习笔记,不足之处多多指教。数据可视化主要给大家介绍一下Python数据可视化库Matplotlib、seaborn,在本章学习中,你也许会觉得数据很有趣。在打比赛的过程中,数据可视化可以让我们更好的看到每一个关键步骤的结果如何,可以用来优化方案,是一个很有用的技巧。导入所需要的相关库import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport

2021-12-20 19:40:10 213

原创 数据分析入门task3

本记录为本人参加datawhale数据分析(泰坦尼克号任务项目)学习笔记,不足之处多多指教。数据重构一、数据拼接合并pandas中的merge,concat,join,aptend1 、merge函数类似数据库中的(1)内连接,pd.merge(a1, a2, on=‘key’)(2)左连接,pd.merge(a1, a2, on=‘key’, how=‘left’)(3)右连接,pd.merge(a1, a2, on=‘key’, how=‘right’)(4)外连接, pd.merge(

2021-12-18 20:10:44 741

原创 数据分析入门task2

本记录为本人参加datawhale数据分析(泰坦尼克号任务项目)学习笔记,不足之处多多指教。数据清洗简述通常我们拿到的数据是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等等,需要经过一定的处理才能继续做后面的分析或建模。所以拿到数据的第一步是进行数据清洗,本章我们将学习缺失值、重复值、字符串和数据转换等操作,将数据清洗成可以分析或建模的样子。缺失值观察(1) 请查看每个特征缺失值个数# 方法1 统计基本信息df.info()# 方法2 isnull函数df.isnull().su

2021-12-16 15:56:12 336

原创 数据分析入门task1

本记录为本人参加datawhale数据分析(泰坦尼克号任务项目)学习笔记,不足之处多多指教。一、数据如何加载读取和数据观察1、numpy 和 pandas 标准库导入系统安装的python版本没有安装这个numpy、pandas库先行安装这个两个库pip install numpypip install pandas因为我使用anaconda作为python运行解释器自动已经安装numpy\pandas库可以直接导入库import numpy as npimport pandas as p

2021-12-14 16:14:19 2336

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除