
实操笔记
文章平均质量分 62
袁钰琦
这个作者很懒,什么都没留下…
展开
-
使用决策树进行个人信用风险评估代码
使用决策树进行个人信用风险评估 第一步,导入csv文件的数据集 使用UCI上的德国信用数据集。该数据集包含了1000个贷款信息,每一个贷款有20个自变量和一个类变量记录该笔贷款是否违约。 我们将使用该数据集构建模型来预测贷款是否违约。 import pandas as pd import numpy as np import matplotlib.pyplot as plt credit = pd.read_csv("data/german_credit.csv") 第二步,观察数据集 可根据一些函数来原创 2021-09-19 13:17:15 · 2658 阅读 · 1 评论 -
使用sklearn建立决策树模型代码
使用sklearn训练模型并预测结果 定义数据 def loaddata(): dataSet = [[0, 0,0,0, 'no'], [0, 0,0,1,'no'], [0, 1,0,1, 'yes'], [0, 1,1,0, 'yes'], [0, 0,0,0, 'no'], [1, 0,0,0, 'no'], [1原创 2021-09-19 10:57:23 · 1339 阅读 · 1 评论 -
动手实现ID3决策树代码
ID3决策树 本文从计算数据集的信息熵、划分数据集、选择最优特征、递归训练一棵树、预测五个方面介绍怎样构建ID3决策树。 先要介绍信息熵和信息增益的这两个公式: Ent(D)=−∑k=1∣Y∣pklog2pk\operatorname{Ent}(D)=-\sum_{k=1}^{|\mathcal{Y}|} p_{k} \log _{2} p_{k} Ent(D)=−k=1∑∣Y∣pklog2pkGain(D,a)=Ent(D)−∑v=1V∣Dv∣∣D∣Ent(Dv)\operatornam原创 2021-09-17 22:36:18 · 672 阅读 · 0 评论