
机器学习
九妹123
这个作者很懒,什么都没留下…
展开
-
CORE CONCEPT ----Overfitting and Underfitting
Overfitting and Underfitting Overview 使用机器学习时,有很多方法可以解决。 机器学习中一些最常见的问题是过度拟合和不合适。 为了理解这些概念,让我们设想一个机器学习模型,它试图学习数字分类,并且可以访问训练数据集和测试数据集。 Overfitting 当模型从训练数据中学到太多时,模型会受到过度拟合的影响,并且因此在实践中表现不佳。 这通常是由于模型过...原创 2019-05-21 13:32:19 · 280 阅读 · 0 评论 -
CORE CONCEPT------Cross-Validation
Motivation 根据特定数据集训练模型很容易,但是在引入新数据时该模型如何执行? 你怎么知道使用哪种机器学习模型? 交叉验证通过确保模型产生准确结果并将这些结果与其他模型进行比较来回答这些问题。交叉验证超越了常规验证,即通过评估模型对新数据的处理方式,分析模型如何对其自己的训练数据进行的过程。 以下各节将讨论几种不同的交叉验证方法: Holdout Method 保持交叉验证方法涉及移...原创 2019-05-16 20:35:45 · 303 阅读 · 0 评论 -
CORE CONCEPT -----Regularization
Regularization Motivation 请考虑以下情形。 你正在做一个花生酱三明治,并试图调整成分,使其具有最好的味道。 您可以在决策过程中考虑面包类型,花生酱类型或花生酱与面包比例。 但是你会考虑其他因素,比如房间里的温暖程度,早餐吃的东西,或者穿着什么颜色的袜子? 你可能不会因为这些东西对三明治的味道没有那么大的影响。 对于最终使用的任何配方,您将更多地关注前几个功能,并避免过...原创 2019-05-22 13:03:05 · 222 阅读 · 0 评论 -
Supervised Learning-------Decision Trees
Decision Trees Introduction 决策树是机器学习中的分类器,允许我们根据以前的数据进行预测。 它们就像是一系列连续的“if ... then”语句,您可以将新数据输入到结果中。 为了演示决策树,让我们看一个例子。 想象一下,我们想要预测迈克是否会在任何一天去购物。 我们可以看一下导致迈克前往商店的先前因素: 在这里,我们可以看到迈克的杂货供应量,天气以及迈克是否...原创 2019-06-19 21:08:17 · 407 阅读 · 0 评论 -
Supervised Learning------k-Nearest Neighbors
k-Nearest Neighbors Introduction K-Nearest Neighbors(KNN)是机器学习的基本分类器。 分类器采用已标记的数据集,然后尝试将新数据点标记为其中一个类别。 因此,我们试图确定对象所在的类。为此,我们查看对象的最近点(邻居),并且具有大多数邻居的类将是我们识别要进入的对象的类。 k是对象的最近邻居的数量。 因此,如果k = 1,则对象所在的类是最...原创 2019-06-20 11:43:38 · 253 阅读 · 0 评论 -
Supervised Learning-----Logistic Regression
Logistic Regression Introduction Logistic回归是一种二元分类方法。 它可以将数据集中的点划分为两个不同的类或类别。 为简单起见,我们称它们为A类和B类。模型将给出给定点属于B类的概率。如果它低(低于50%),那么我们将它归类为A类。否则,它 属于B类。同样重要的是要注意逻辑回归比具有阈值的线性回归更好用于此目的,因为阈值必须手动设置,这是不可行的。 逻辑...原创 2019-06-17 21:39:55 · 384 阅读 · 0 评论 -
Supervised Learning-----Naive Bayes Classification
Naive Bayes Classification Motivation 机器学习中反复出现的问题是需要将输入分类为一些预先存在的类。 请考虑以下示例。 假设我们想要对我们发现的随机水果进行分类。 在这个例子中,我们有三个现有的水果类别:苹果,蓝莓和椰子。 这些水果中的每一种都有三个我们关心的特征:大小,重量和颜色。 该信息如图1所示。 我们观察到我们发现的那块水果,并确定它的大小适...原创 2019-06-17 22:26:05 · 328 阅读 · 0 评论 -
Supervised Learning------Linear Support Vector Machines
Linear Support Vector Machines Introduction 支持向量机(简称SVM)是另一种用于对数据进行分类的机器学习算法。 SVM的目的是尝试找到一条线或超平面来划分最佳分类数据点的维空间。 如果我们试图划分两个类A和B,我们会尝试用线来最好地分隔两个类。 线/超平面的一侧是来自A类的数据,另一侧是来自B类。这种算法在分类时非常有用,因为我们必须计算一次最佳线或...原创 2019-06-22 19:07:28 · 252 阅读 · 0 评论