
机器学习
文章平均质量分 81
yeverwen
研究方向:数据挖掘、推荐系统、风控算法
展开
-
【机器学习】分类算法–决策树(ID3/C4.5/CART)
前言决策树,是工业界常用的数据挖掘模型。其原理是根据一个或多个特征的划分来确定分类,易于理解。和K邻近算法一样,决策树是属于分类、有监督的算法决策树常用的有ID3算法、C4.5算法和CART算法。ID3算法和C4.5算法都是分类算法,CART算法是回归算法。我们今天通过一个天气-活动预测的数据来了解这三个算法上述数据集有4个属性,属性集合A={ 天气,温度,湿度,风速}, 类别标签有2个,类别集合L={进行,取消}正文本文要介绍的三种算法在特征选择的方法上存在差异:ID3用信息增益,原创 2020-06-29 09:59:48 · 1647 阅读 · 0 评论 -
【机器学习】分类算法--K近邻算法
K近邻算法通常写作Knn算法,它是一种十分有效的分类算法,是有监督的。Knn算法与K-means算法不同,K-means算法是用作聚类的,且是无监督的。Knn算法的优缺点优点:精度高、对异常值不敏感、无数据输入假定缺点:时间复杂度高、空间复杂度高适用数据范围:数值型和标称型Knn算法的工作原理存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分...原创 2020-06-18 17:24:32 · 1874 阅读 · 0 评论