
机器学习
个人机器学习笔记及调包代码
kt4ngw
Keep Moving
展开
-
【机器学习】决策树特征选择准则 信息增益、信息增益率、基尼系数的计算及其python实现
索引1.问题引入2.信息增益1.问题引入首先,我们引入需进行学习的数据集,如下,接着摆在我们面前的是首先选择哪个特征,其次选择哪个特征,…,最后选择哪个特征。(就是先选择好的特征,再选择坏的特征)问题引入: 怎么知道特征的好坏呢?我们猜想,如果一个特征A 能使得数据分出来的类别最好,那么他就是最好的特征。(就是提供的信息最为准确),因此我们引入信息增益来衡量提供的信息准确度。2.信息增益...原创 2020-12-16 09:59:40 · 6062 阅读 · 2 评论 -
【机器学习】python调包实现 随机森林回归算法
1.随机森林回归1.1数据集此处采用波士顿房价数据集(可直接调用),训练特征为13个,输出标签为MEDV。数据截图如下,1.2 代码实现from sklearn.ensemble import RandomForestRegressorimport numpy as npimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签plt.rcParams['axes.unicode_mi原创 2020-11-19 12:58:54 · 6770 阅读 · 0 评论 -
【机器学习】python实现线性回归 sklearn库
1.代码import pandas as pdfrom io import StringIOfrom sklearn import linear_modelimport matplotlib.pyplot as plt# 房屋面积与价格历史数据(csv文件)csv_data = 'square_feet,price\n150,6450\n200,7450\n250,8450\n300,9450\n350,11450\n400,15450\n600,18450\n'# 读入dataframe原创 2020-11-13 09:12:48 · 11069 阅读 · 2 评论