
机器学习
文章平均质量分 87
算法原理以及应用总结,包括 scikit-learn 等算法应用、参数调优等
DataScience
每天一点点,在AI领域不断深入
展开
-
机器学习 Python基础2 Pandas DataFrame 常用方法实践
Pandas DataFrame 常用方法实践常见的对象类型【pandas.core.series.Series】【pandas.core.frame.DataFrame】【pandas.core.indexes.datetimes.DatetimeIndex】日期对象常用方法实践1) reindex() 重新索引2) drop() 丢弃数据3) 索引、选取和过滤4) 算术运算和数据对齐5) 函数...原创 2018-11-29 23:11:06 · 478 阅读 · 0 评论 -
机器学习 Python基础1 Pandas DataFrame 常用方法速查手册中文版
本文转载自文章:https://zhuanlan.zhihu.com/p/25630700英文版 Pandas Cheat Sheet - Python for Data Science,同时添加了部分注解。Pandas速查手册中文版导入数据导出数据创建测试对象查看、检查数据数据选取数据清理数据处理:Filter、Sort和GroupBy数据合并数据统计对于数据科学家,无论是数据分析还是数据...转载 2018-11-29 21:37:43 · 1188 阅读 · 1 评论 -
机器学习 scikit-learn9 - 预测贷款用户是否会逾期 - 特征筛选 IV 和 随机森林
特征挑选1 说明2 代码使用方法3 核心代码说明3.1 IV值挑选特征3.2 随机森林挑选特征3.3 训练模型得到结果3.4 训练模型输出结果4 结果对比5 问题1 说明主要是根据 IV值 和 随机森林 这两种方法来挑选特征代码链接: https://github.com/spareribs/kaggleSpareribs/blob/master/Overdue/ml/features/fe...原创 2018-11-29 01:08:41 · 916 阅读 · 0 评论 -
机器学习 scikit-learn7 - 预测贷款用户是否会逾期 - 网络搜索 交叉验证
bak原创 2018-11-24 13:18:31 · 401 阅读 · 0 评论 -
机器学习 scikit-learn6 - 预测贷款用户是否会逾期 - 特征工程
bak原创 2018-11-24 13:08:08 · 864 阅读 · 0 评论 -
机器学习 scikit-learn5 - 预测贷款用户是否会逾期 - 模型性能评估
bak原创 2018-11-24 13:07:48 · 1277 阅读 · 1 评论 -
机器学习 scikit-learn4 预测贷款用户是否会逾期 - xgboost 和 lightgbm
bak原创 2018-11-24 13:07:23 · 668 阅读 · 0 评论 -
机器学习 scikit-learn2 预测贷款用户是否会逾期 - 逻辑回归
逻辑回归预测贷款用户是否会逾期我们提升算法实践能力的【整个思路】是这样的:构建模型——>模型融合——>模型评估——&amp原创 2018-11-17 10:46:57 · 1450 阅读 · 0 评论 -
机器学习 scikit-learn3 预测贷款用户是否会逾期 - 支持向量机和决策树
文章目录参考文档参考文档[1] Feature Engineering for Machine Learning - 书本翻译[2] 特征处理 - 七月在线[3] 特征选择[4] 缺失值处理原创 2018-11-20 22:45:20 · 692 阅读 · 2 评论 -
机器学习 scikit-learn1 预测贷款用户是否会逾期
逻辑回归预测 贷款用户是否会逾期文章目录逻辑回归预测 贷款用户是否会逾期1 环境准备1.1 导入所需的数据包2 特征工程 - 简单数据预处理2.1 确认目前数据量和预测数据占比2.2 简单分析数据表数据2.3 明确需要进行处理的数据3 构建模型3.1 划分测试集和训练集3.2 标准化 归一化处理3.3 构建模型 并训练3.5 模型评估我们提升算法实践能力的【整个思路】是这样的:构建模型——&g...原创 2018-11-16 09:23:43 · 2164 阅读 · 0 评论 -
机器学习算法3_支持向量机(SVM)
支持向量机通俗导论(理解SVM的三层境界)前言第一层:了解SVM1.1 分类标准的起源:Logistic回归1.2 线性分类的一个例子第二层:深入SVM第三层:证明SVM前言 动笔写这个支持向量机(support vector machine)是费了不少劲和困难的,原因很简单,一者这个东西本身就并不好懂,要深入学习和研究下去需花费不少时间和精力,二者这个东西也不好讲清楚,尽管网上已经有朋友写...转载 2018-10-16 22:38:55 · 319 阅读 · 0 评论 -
机器学习算法2_逻辑回归
文章目录1 逻辑回归1.1 概念1.2 推导方法1.2.1 模型 - Sigmoid 分布函数1.2.2 目标函数 - 对数损失函数1.2.3 求解方法1.2.3.1 梯度下降法1.2.4 性能度量2 Softmax2.1 概念2.2 推导方法2.2.1 模型2.2.2 目标函数2.2.3 求解方法2.2.4 性能度量3 sklearn3.1 例子3.2 参数说明4 优缺点5 与线性回归对比6 疑...原创 2018-10-11 13:41:50 · 295 阅读 · 0 评论 -
机器学习算法1_线性回归
文章目录1 线性回归1.1 概念1.2 推导方法1.2.1 模型 - 线性回归方程1.2.2 目标函数 - 平方损失函数1.2.3 求解方法1.2.3.1 最小二乘法 - 代数求解(一元)1.2.3.2 最小二乘法 - 矩阵求解(多元)1.2.4 性能度量1.3 sklearn 实现1 线性回归1.1 概念利用称为线性回归方程的最小二乘函数对 一个或者多个自变量 和 因变量 之间关系进行建...原创 2018-10-06 10:22:48 · 668 阅读 · 0 评论 -
机器学习 scikit-learn8 - 预测贷款用户是否会逾期 - Stacking模型融合【调包】
网络搜索 - 目录1 说明2 代码使用方法3 核心代码说明4 问题参考文章1 说明在做逻辑回归的最初就有尝试做网络搜索,找到最佳的特征组合代码链接: https://github.com/spareribs/kaggleSpareribs/blob/master/Overdue/ml/for beginner/stacking.py2 代码使用方法【必须】先执行 features 中的...原创 2018-11-25 17:58:07 · 2967 阅读 · 3 评论