
跟着Leo机器学习实战
热衷开源的宝藏Boy
努力践行将学习的本质与机器学习完美结合!
展开
-
Random Forest的随机性表现在哪里
随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。随机森林的随机性体现在每颗树的训练样本是随机的,树中每个节点的分裂属性集合也是随机选择确定的。 ...原创 2020-12-11 10:10:10 · 579 阅读 · 0 评论 -
跟着Leo机器学习实战:Kmeans聚类
跟着Leo机器学习实战:Kmeans聚类 Kmeans聚类 优点:容易实现 缺点:容易陷入局部最小值,在大规模数据收敛很慢。 适用数据类型:数值型数据 伪代码 加载数据 from numpy import * def loadDataSet(fileName): #加载数据 dataMat = [] #assume last column is ...原创 2020-02-20 16:28:14 · 170 阅读 · 0 评论 -
跟着Leo机器学习实战:回归
跟着Leo机器学习实战:回归 目标模型 f(X)=XW 加载数据 from numpy import * def loadDataSet(fileName): #general function to parse tab -delimited floats numFeat = len(open(fileName).readline().split('\t')) - 1 #ge...原创 2020-02-20 14:22:55 · 195 阅读 · 0 评论 -
跟着Leo机器学习实战:Logistic回归
跟着Leo机器学习实战:Logistic回归 github https://github.com/LeoLeos/MachineLearningLeo/tree/master/logRegres Logistic回归 优点:计算代价不高,易于理解和实现 缺点:容易缺拟合,分类精度不高 适合数据类型:数值型和标称型数据 sigmoid函数以及目标 Logistic回归梯度上升优化算法训练参数 ...原创 2020-02-19 11:57:59 · 173 阅读 · 0 评论 -
跟着Leo机器学习实战--基于概率论的分类方法:朴素贝叶斯
跟着Leo机器学习实战–基于概率论的分类方法:朴素贝叶斯 核心思想 如果我们用p1(x,y)表示数据(x,y)属于类别1的概率,用p2(x,y)表示数据(x,y)属于类别2的概率,那么判别规则如下: 若p1(x,y)>p2(x,y),则判给类别1 若p1(x,y)<p2(x,y),则判给类别2 条件概率 条件概率是指事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为:P(A...原创 2020-02-18 14:33:43 · 221 阅读 · 1 评论 -
跟着Leo机器学习实战——K-近邻算法
跟着Leo机器学习实战——K-近邻算法 github代码获取 https://github.com/LeoLeos/MachineLearningLeo 概述(核心思想) 选出以待分类的一个样本与他最近的K个已知标签的样本中,这K个样本中的属于相同label的个数最多,则将这个待分类样本分给这一类. 举例 如果K=3,绿色圆点的最近的3个邻居是2个红色小三角形和1个蓝色小正方形,少数从属...原创 2020-02-16 16:56:19 · 209 阅读 · 0 评论