- 博客(5)
- 收藏
- 关注
原创 动手学数据分析Task 05
最后一次任务了,是完整的建模 第一步是处理数据 第二步是模型的构建,用了逻辑回归模型和一个随机森林分类模型,最后还进行了分类验证,平均分即等于.score 第三部是用混淆矩阵和评分来判定模型优劣,混淆矩阵我做成图的形式,更有利于观察 第四步是画出ROC曲线 ...
2020-08-28 19:26:16
136
原创 动手学数据分析 Task 04
数据可视化的几种表现方法,使用了python中matplotlib和seaborn两个包 数据载入 1. 2. 3. 4. 5. 6.
2020-08-25 22:43:17
149
原创 动手学数据分析 Task 3
数据合并 pandas的concat函数最好用,可以左右或上下拼接,调整axis即可,1位左右,0为上下。 stack函数可将表格类数据转换成series groupby 的用法如图有两种表达方法,第一种前后都要写“text”,第二种只用在前边写“text”。 groupby两个参数的结果如第三个代码块所示 统计最大存活年龄以及此年龄存活人数占总人数的比例如图所示 ...
2020-08-22 22:30:17
177
2
原创 动手学数据分析 Task 2
去除重复值并将缺失值补为0 对数字进行分箱处理,以年龄为例; 对文本进行变量转换,值较少时可用map,值多时用[49]的方法(LabelEncode转换而成的数字较大,故没有使用) 将变量转化为one-hot编码及提取Title特征 ...
2020-08-21 21:23:10
114
原创 动手学数据分析 Task 1
c此次任务比较简单,仅仅粘出代码 Markdown编辑器 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。 新的改变 我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客: 全新的界面设计 ,将会带来全新的写作体验; 在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片...
2020-08-19 21:51:06
101
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅