- 博客(4)
- 收藏
- 关注
原创 集成学习之随机森林
集成学习之随机森林随机森林简介随机森林特点随机森林简介随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一大分支–集成学习(Ensemble Learning)。随机森林用处比较广泛,从市场营销到医疗保健保险,既可以用来做市场营销模拟的建模,统计客户来源,保留和流失,也可用来预测疾病的风险和病患者的易感性。随机森林特点具有极好的准确率能...
2019-03-28 09:37:12
1108
原创 贝叶斯法则概要
贝叶斯法则贝叶斯分类算法是一大类分类算法的总称贝叶斯分类算法以样本可能属于某类的概率来最为分类的依据朴素贝叶斯朴素贝叶斯是基于贝叶斯定理与特征条件独立假设的分类方法。其中“朴素”的意思就是条件概率独立性。朴素贝叶斯的思想:如果一个事物在一些属性条件发生的情况下,事物属于A的概率大于属于B的概率,则判定该事物属于A。数学原理:P(类别 | 特征) = P(特征 | 类别) * P(类别...
2019-03-28 09:36:59
449
原创 回归和分类的评估指标
回归评估指标均方误差(Mean Squared Error,MSE):均方误差是指参数估计值与参数真实值之差平方的期望值,MSE可以评价数据的变化程度,MSE越小,说明预测模型描述试验数据具有更好的精确度。公式:R平方值(R² score):又称决定系数,它是表征回归方程在多大程度上解释了因变量的变化,或者说方程对观测值(观测值是指通过通过测量或测定所得到的样本值)的拟合程度,R²的...
2019-03-28 09:35:24
1587
原创 K近邻(KNN)算法总结
1.KNN算法原理KNN算法是选择与输入样本在特征空间内最近邻的k个训练样本并根据一定的决策规则给出输出结果。决策规则:分类任务:输出结果为k个训练样本中占大多数的类回归任务:输出结果为k个训练样本值的平均值如下图的分类任务,输出结果为w1类。2.KNN算法三要素K值的选择、距离度量和分类决策规则是K近邻算法的三个基本要素。分类决策规则:KNN算法一般是用多数表决方法,即由输入...
2019-03-28 09:34:02
2327
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人