
python
文章平均质量分 72
吃撑的鲸
这个作者很懒,什么都没留下…
展开
-
python数据挖掘与实战 第四章 数据预处理 数据离散化 代码纠错
在python数据挖掘与实战的第四章代码4-3的数据离散化中发现问题,纠正后代码如下:标注了改动1.2.3.4.5# -*- coding: utf-8 -*-# 数据规范化import pandas as pddatafile = r'D:\mechine learning\Data Analysis and Mining\chapter4\demo\data\discretization_data.xls' # 参数初始化data = pd.read_excel(datafile)原创 2021-06-03 17:40:00 · 432 阅读 · 1 评论 -
金融风控训练营赛题理解(task 6 贷款违约预测)学习笔记
本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl一、学习知识概要决策树详解逻辑回归详解运用前段时间的学习知识进行比赛二、学习内容2.1 决策树详解主要学习ID3、C4.5、cart算法依据什么选取最优特征(构建结点):ID3看信息增益C4.5看信息增益率cart算法看gini原创 2021-05-05 23:19:14 · 279 阅读 · 0 评论 -
金融风控训练营赛题理解(task 5 模型融合)学习笔记
模型融合是一种有效提升机器学习效果的方法,通过构建并融合多个模型来完成学习任务。引用来源:https://www.jianshu.com/p/820f3ce58a60一、学习知识概要平均:简单平均法加权平均法投票:简单投票法加权投票法综合:排序融合log融合stacking:构建多层模型,并利用预测结果再拟合预测。blending:选取部分数据预测训练得到预测结果作为新特征,带入剩下的数据中预测。二、学习内容本篇文章大部分参考:htt.原创 2021-05-04 14:06:38 · 528 阅读 · 1 评论 -
金融风控训练营赛题理解(task 4 建模与调参)学习笔记
本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl学习目标学习在金融分控领域常用的机器学习模型学习机器学习模型的建模过程与调参流程一、学习知识概要逻辑回归模型:理解逻辑回归模型;逻辑回归模型的应用;逻辑回归的优缺点;树模型:理解树模型;树模型的应用;树模型的优原创 2021-04-30 22:09:20 · 1536 阅读 · 1 评论 -
金融风控训练营赛题理解(task 3 特征工程)学习笔记
本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:https://github.com/datawhalechina/team-learning-data-mining/tree/master/FinancialRiskControl原创 2021-04-28 22:53:17 · 1585 阅读 · 0 评论 -
金融风控训练营赛题理解(task 2)学习笔记
金融风控训练营赛题理解(task 2)学习笔记本学习笔记为阿里云天池龙珠计划Docker训练营的学习内容,学习链接为:linkTask2目的:1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模.2.了解变量间的相互关系、变量与预测值之间的存在关系。3.为特征工程做准备1、学习知识概要学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值,异常值)学习如何对数据进行统计规整,按条件进行筛选学习原创 2021-04-25 14:17:53 · 577 阅读 · 0 评论