- 博客(3)
- 收藏
- 关注
原创 数据预处理
数据预处理 数据集描述 本次所使用的数据是从网上获取的金融数据(已处理,并非原始数据),根据用户的历史行为数据预测贷款用户是否会逾期,预测结果有两类:逾期和非逾期。用户的历史行为数据则主要包括以下部分: 每个用户在银行的所有交易行为(存款、汇款、转账、购物、贷款等)发生的次数、时间、金额总量等以及这些数据所具有的特征如:最大值、累计值、间隔值等。部分示例如下所示: number_of_trans_...
2019-03-31 15:15:02
185
原创 Numpy & Pandas 学习
Numpy & Pandas 学习 阅读目录 numpy的学习 pandas的学习 1 Numpy的学习 NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。 1)数据类型 numpy 支持的数据类型有很多,常用的基本数据类型主要有:布尔值(bool);整数值(int);浮点数(f...
2019-03-11 21:40:50
204
原创 随机森林算法知识点梳理
随机森林算法知识点梳理 阅读目录 1 随机森林的相关基础知识 2 随机森林的生成 3 随机森林的特点 1 随机森林相关基础知识 随机森林是机器学习中十分重要的算法之一,它简单、容易实现、计算开销小,在很多现实任务中展现去强大的性能。为了更好的理解其工作原理等,需要了解一些机器学习方面的基础知识,主要涉及以下几个部分: 1)自助法 自助法(bootstrapping)是通过对一个包含m个样例的数据集...
2019-03-07 15:35:26
707
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅