
《人工智能》机器学习
文章平均质量分 94
Bruceoxl
BruceOu,于2017年10月13日开始在优快云上写博客,博客专注于嵌入式开发、人工智能等。欢迎各位朋友来访!
邮箱: ouxiaolong@bruceou.cn
展开
-
《人工智能》机器学习 - 第7章 支持向量机(一 理论讲解-线性可分支持向量机)
7.1引言支持向量机(SupportVector Machines)是最早是由 Vladimir N. Vapnik 和 Alexey Ya. Chervonenkis 在1963年提出,目前的版本(soft margin)是由Corinna Cortes 和 Vapnik在1993年提出,并在1995年发表。深度学习(2012)出现之前,SVM被认为机器学习中近十几年来最成功,表现最好的算法。...原创 2018-11-20 09:30:59 · 1379 阅读 · 0 评论 -
《人工智能》机器学习 - 第6章感知机模型(二 感知机算法实现)
6.5感知机学习算法实现6.5.1原始形式实现我们先来实现6.4.1的实例1。Python代码如下。# -*- coding: utf-8 -*-import numpy as npfrom matplotlib import pyplot as pltfrom matplotlib.lines import Line2Dimport matplotlibmatplotlib.r...原创 2018-11-09 16:06:42 · 735 阅读 · 0 评论 -
《人工智能》机器学习 - 第6章感知机模型(一 理论讲解)
6.1引言PLA全称是Perceptron Linear Algorithm,即线性感知机算法,属于一种最简单的感知机(Perceptron)模型。感知机(perceptron)是二分类的线性分类模型,它的基本结构如图1所示,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型,解决的问题是分类问题。感知机学...原创 2018-11-09 11:31:32 · 8936 阅读 · 1 评论 -
《人工智能》机器学习 - 第5章 逻辑回归(五 逻辑回归sklearn总结)
5.5逻辑回归sklearn总结在scikit-learn中,与逻辑回归有关的主要是这3个类。LogisticRegression, LogisticRegressionCV 和logistic_regression_path。其中LogisticRegression和LogisticRegressionCV的主要区别是LogisticRegressionCV使用了交叉验证来选择正则化系数C。而...原创 2018-10-12 09:06:23 · 1740 阅读 · 0 评论 -
《人工智能》机器学习 - 第5章 逻辑回归(四 多元逻辑回归实战)
5.4多元逻辑回归实战5.4.1多元逻辑回归实战之预测病马的死亡率本次实战内容,将使用Logistic回归来预测患疝气病的马的存活问题。原始数据集下载地址:http://archive.ics.uci.edu/ml/datasets/Horse+Colic这里的数据包含368个样本和28个特征。我并非育马专家,从一些文献中了解到,疝病是描述马胃肠痛的术语。然而,这种病不一定源自马的胃肠问题...原创 2018-10-12 08:49:11 · 2645 阅读 · 1 评论 -
《人工智能》机器学习 - 第5章 逻辑回归(三 非线性逻辑回归实战)
5.3非线性逻辑回归实战前文讲解了线性的逻辑回归,那么对于非线性的是否使用呢?答案是肯定的。只是在开始训练之前稍微处理一下数据。代码如下。# 生成阶数为6的多项式poly = PolynomialFeatures(6)XX = poly.fit_transform(X[:,1:3])另外在画边界图和线性的还有些不一样,具体请看代码。# -*- coding:utf-8 -*-imp...原创 2018-10-11 10:50:08 · 514 阅读 · 0 评论 -
《人工智能》机器学习 - 第5章 逻辑回归(二 二元逻辑回归实战)
5.2二元逻辑回归实战5.2.1二元逻辑回归简单实例首先看看数据吧。随机的一些数据,这是一个二分问题的数据。先导入数据。Python代码如下。"""函数说明:读取数据Parameters: filename - 文件名Returns: xArr - x数据集 yArr - y数据集""&quot原创 2018-10-11 10:43:43 · 972 阅读 · 2 评论 -
《人工智能》机器学习 - 第5章 逻辑回归(一 理论讲解)
5.1逻辑回归理论5.1.1逻辑回归引言逻辑回归是一个分类算法,它可以处理二元分类以及多元分类。虽然它名字里面有“回归”两个字,却不是一个回归算法。那为什么有“回归”这个误导性的词呢?个人认为,虽然逻辑回归是分类模型,但是它的原理里面却残留着回归模型的影子,笔者在前面对线性回归已经阐述清楚了,接下来笔者就要对逻辑回归进行讲解了。我们知道,线性回归的模型是求出输出特征向量YYY和输入样本矩阵X...原创 2018-10-04 16:57:47 · 828 阅读 · 0 评论 -
《人工智能》机器学习 - 第5章 线性回归(三 多元线性回归实践)
5.4多元线性回归实践5.4.1多元线性回归之房屋价格预测在本文开始前,笔者给出的一个房价预测是一元线性的房价预测,接下来笔者要讲的也是房价预测,不在只是和面积有关,还和房间数有关,就变成了一个多元的问题。关于这部分的理论在5.2节笔者已经讲过了,这里就不在讲了。直接来代码吧。# -*- coding: utf-8 -*-import numpy as npimport matplotl...原创 2018-09-27 17:17:17 · 1120 阅读 · 3 评论 -
《人工智能》机器学习 - 第5章 线性回归(二 一元线性回归实践)
5.3一元线性回归实践5.3.1一元线性回归简单实例在前文我们引入了预测房价的例子,最后的模型是形如 ,那么笔者就先实现这个最简单的算法,使用的是最小二乘法进行求解计算,前文已经推导了。为了便于编码,使用上述式子。代码如下。# -*- coding: utf-8 -*-import numpy as npimport matplotlib.pyplot as pltimport m...原创 2018-09-27 11:37:17 · 980 阅读 · 0 评论 -
《人工智能》机器学习 - 第5章 线性回归(一 理论讲解)
开发IDE:Anaconda 3(python3.6.5)回归是由达尔文(Charles Darwin)的表兄弟Francis Galton发明的。Galton于1877年完成了第一次回归预测,目的是根据上一代豌豆种子(双亲)的尺寸来预测下一代豌豆种子(孩子)的尺寸。 Galton在大量对象上应用了回归分析,甚至包括人的身高。他注意到,如果双亲的高度比平均高度高,他们的子女也倾向于比平均高度高,...原创 2018-09-27 11:00:26 · 1431 阅读 · 0 评论 -
《人工智能》机器学习 - 第4章 决策树算法【分类】(五 决策树sklearn总结和可视化总结)
4.7 决策树sklearn总结参考文档:中文链接英文链接API:中文链接英文链接scikit-learn决策树算法类库内部实现是使用了调优过的CART树算法,既可以做分类,又可以做回归。分类决策树的类对应的是DecisionTreeClassifier。sklearn.tree模块提供了决策树模型,用于解决分类问题和回归问题。方法如下所示:我们先看下DecisionTreeC...原创 2018-09-23 20:56:40 · 1643 阅读 · 0 评论 -
《人工智能》机器学习 - 第4章 决策树算法【分类】(四 CART算法实现)
4.6 CART算法CART(Classification and Regression Trees )是L. Breiman, J. Friedman, R. Olshen, C. Stone在1984年提出的。前文介绍了ID3、C4.5生成决策树的算法。由于上文使用的测试数据以及建立的模型都比较简单,所以其泛化能力很好。但是,当训练数据量很大的时候,建立的决策树模型往往非常复杂,树的深度很...原创 2018-09-23 15:04:14 · 1346 阅读 · 0 评论 -
《人工智能》机器学习 - 第4章 决策树算法【分类】(三 C4.5算法实现)
4.5 C4.5算法4.5.1 C4.5算法的实现前面讲解了决策树最基本的算法ID3,接下来将要讲解的是ID3的改进版本,C4.5是Quinlan在1993年提出的。C45算法和ID3类似,只是不再以以信息增益作为划分训练数据集的特征,而是以信息增益比作为划前文也讲过了,笔者还是把不同的部分贴出来吧。其余的都一样。信息增益比(information gain ratio)特征AAA对训练...原创 2018-09-22 09:11:37 · 1647 阅读 · 0 评论 -
《人工智能》机器学习 - 第4章 决策树算法【分类】(二 ID3算法实现)
4.2决策树ID3实践决策树算法最原始的版本是ID3算法,ID3算法由Ross Quinlan发明,建立在“奥卡姆剃刀”的基础上:越是小型的决策树越优于大的决策树(be simple简单理论)。ID3算法中根据信息增益评估和选择特征,每次选择信息增益最大的特征作为判断模块建立子结点。ID3算法可用于划分标称型数据集,没有剪枝的过程,为了去除过度数据匹配的问题,可通过裁剪合并相邻的无法产生大量信息...原创 2018-09-21 17:18:24 · 3483 阅读 · 0 评论 -
《人工智能》机器学习 - 第4章 决策树算法(一 理论讲解)
决策树(Decision Tree)是一种基本的分类与回归方法,本文主要讨论分类决策树。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。相比朴素贝叶斯分类,决策树的优势在于构造过程不需要任何领域知识或参数设置,因此在实际应用中,对于探测式的知识发现,决策树更加适用。4.1决策树理论*...原创 2018-09-20 21:34:04 · 957 阅读 · 0 评论 -
《人工智能》机器学习 - 第3章 朴素贝叶斯算法【分类】 (二 算法实战)
3.6朴素贝叶斯实践3.6.1朴素贝叶斯之微博评论筛选以微博评论为例。为了不影响微博的发展,我们要屏蔽低俗的言论,所以要构建一个快速过滤器,如果某条评论使用了负面或者侮辱性等低俗的语言,那么就将该留言标志为内容不当。过滤这类内容是一个很常见的需求。对此问题建立两个类型:低俗类和非低俗类,使用1和0分别表示。3.6.1.1朴素贝叶斯之微博评论筛选实现我们把文本看成单词向量或者词条向量,也就是...原创 2018-09-19 12:18:39 · 1383 阅读 · 0 评论 -
《人工智能》机器学习 - 第3章 朴素贝叶斯算法 (一 理论讲解)
3.1朴素贝叶斯的基本概念3.1.1什么是贝叶斯我相信当读者朋友看到我这篇文章,你一定是了解或者学过贝叶斯,贝叶斯定理(Bayes’ theorem)的应用。英国数学家**托马斯·贝叶斯(Thomas Bayes)***在1763年发表的一篇论文中,首先提出了这个定理。朴树贝叶斯就是在这个定理上的一个应用。朴素贝叶斯与其他统计学推断方法截然不同。它建立在主观判断的基础上,也就是说,你可以不需...原创 2018-09-18 22:15:12 · 1665 阅读 · 0 评论 -
《人工智能》机器学习 - 第2章 KNN算法【分类】(二 算法实战)
2.2 KNN算法实践2.2.1 KNN算法简单实现-电影分类2.2.1.1准备数据集我们可以使用numpy直接创建,代码如下:import numpy as np""&a原创 2018-09-12 21:25:42 · 2457 阅读 · 0 评论 -
《人工智能》机器学习 - 第2章 KNN算法 (一 理论讲解)
2.1 KNN算法理论2.1.1 KNN算法简介KKK最近邻(k-Nearest Neighbor,KNN)分类算法是1967年由Cover T和Hart P提出的一种基本分类与回归方法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。 该方法的思路是:如果一个样本在特征空间中的kkk个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 KN...原创 2018-09-11 17:12:06 · 1277 阅读 · 0 评论 -
《人工智能》机器学习 - 第1章 机器学习简介
1.1机器学习(Machine Learning, ML) 图1机器学习时间轴 自从科学、技术与人工智能拥有了最初的观点,科学家们跟随着Blaise Pascal和Von Leibniz的脚步,思考是否有一种机器,拥有与人类相同的智能。著名作者如Jules Verne,Frank Baum(绿野仙踪),Marry Shelly(弗兰肯斯坦),George Lucas(星球大战)幻想着人造人...原创 2018-09-10 16:32:49 · 4392 阅读 · 0 评论 -
机器学习工程师需要知道的10个算法
By James Le, New Story Charity. It is no doubt that the sub-field of machine learning / artificial intelligence has increasingly gained more popularity in the past couple of years. As Big Data is the翻译 2017-12-04 09:56:09 · 1808 阅读 · 0 评论