自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 动手学数据分析Task 05

最后一次任务了,是完整的建模 第一步是处理数据 第二步是模型的构建,用了逻辑回归模型和一个随机森林分类模型,最后还进行了分类验证,平均分即等于.score 第三部是用混淆矩阵和评分来判定模型优劣,混淆矩阵我做成图的形式,更有利于观察 第四步是画出ROC曲线 ...

2020-08-28 19:26:16 136

原创 动手学数据分析 Task 04

数据可视化的几种表现方法,使用了python中matplotlib和seaborn两个包 数据载入 1. 2. 3. 4. 5. 6.

2020-08-25 22:43:17 149

原创 动手学数据分析 Task 3

数据合并 pandas的concat函数最好用,可以左右或上下拼接,调整axis即可,1位左右,0为上下。 stack函数可将表格类数据转换成series groupby 的用法如图有两种表达方法,第一种前后都要写“text”,第二种只用在前边写“text”。 groupby两个参数的结果如第三个代码块所示 统计最大存活年龄以及此年龄存活人数占总人数的比例如图所示 ...

2020-08-22 22:30:17 177 2

原创 动手学数据分析 Task 2

去除重复值并将缺失值补为0 对数字进行分箱处理,以年龄为例; 对文本进行变量转换,值较少时可用map,值多时用[49]的方法(LabelEncode转换而成的数字较大,故没有使用) 将变量转化为one-hot编码及提取Title特征 ...

2020-08-21 21:23:10 114

原创 动手学数据分析 Task 1

c此次任务比较简单,仅仅粘出代码 Markdown编辑器 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。 新的改变 我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客: 全新的界面设计 ,将会带来全新的写作体验; 在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片...

2020-08-19 21:51:06 101

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除