
机器学习
记录机器学习笔记
tensorhyt
这个作者很懒,什么都没留下…
展开
-
sklearn-随机森林
1.决策树分类过程理解决策树在进行分类是根据特征数据进行建立树结构模型,也许特征并未使用完全。2.sklearn中随机森林分类器的参数使用注释,from sklearn.tree import DecisionTreeClassifierfrom sklearn.datasets import load_winefrom sklearn.ensemble import RandomFor...原创 2020-03-19 18:00:17 · 363 阅读 · 0 评论 -
sklearn-决策树
1.用于分类2.参数一:criterion,不纯度gini:基尼系数,信息敏感度低,默认使用entropy:信息熵,信息敏感度高,容易出现过拟合当数据欠拟合时使用信息熵,数据维度大,噪音大时使用基尼系数3....原创 2020-03-02 17:22:47 · 153 阅读 · 0 评论 -
模型评估方法
进行样本分组时,要考虑到数据分层1.留出法将样本中分出一部分作为训练集,另一部分作为测试集,比例在3/7-2/8左右2.交叉验证法将样本分为K份,依次选择m1-mk作为测试集,剩余k-1份作为训练集,计算k个训练结果的平均值样本太多时, 对算力要求较大3.自助法随机从k个样本中有放回的抽取k个样本作为m测试集,在m中不包含的样本作为测试集,进行k次抽取得到mk个测试集,计算k个训练结...原创 2020-02-19 10:26:30 · 300 阅读 · 0 评论