
python机器学习
文章平均质量分 74
JaysenLeo
挖粪涂墙,星辰大海
展开
-
(三)Decision Tree(决策树)
机器学习中分类和预测算法的评估分类达到的准确率是多少算法复杂度高低影响其速度数据中有噪音,关键值有缺失时,算法表现是否依旧稳定与准确,体现其健壮性数据规模非常大时,同样的算法,是否会产生问题,其可规模性当算算法做出特征值的选择和归类的时候,这种归类能否解释直觉和观察实相符的,能否非常容易的解释学习出来的模型,即可解释性 什么是决策树/判定树(decision tre...原创 2018-06-03 14:22:22 · 631 阅读 · 0 评论 -
(一) 机器学习和机器学习介绍
机器学习 (Machine Learning, ML)概念:多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。学科定位:人工智能(Artificial Intelligence, AI)的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的...原创 2018-06-03 18:58:29 · 628 阅读 · 0 评论 -
(二) 机器学习基本概念
基本概念:训练集,测试集,特征值,监督学习,非监督学习,半监督学习,分类,回归 概念学习:人类学习概念:鸟,飞机,狗,猫,计算机,盒子,车,房子,不断的区分实体特征从而学会了概念 定义:概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数例子:学习 “享受运动” 这一概念: 小明进行水上运动,是否享受运动取决于很多因素天气:...原创 2018-06-03 19:35:06 · 325 阅读 · 0 评论 -
(四) Decision Tree(决策树实例)
工程目录结构如下MachineLearningLibrary - DecisionTree — allElectronicInformationGainOri.dot — allElectronicInformationGainOri.pdf — AllElectronics.csv — AllElectronics.xlsx — main.py 安装包 sckit...原创 2018-06-03 19:56:30 · 910 阅读 · 0 评论 -
(五) K-Nearest Neighbor (临近取样,KNN算法)
综述 1.1 Cover和Hart在1968年提出了最初的邻近算法1.2 分类(classification)算法1.3 归属于输入基于实例的学习(instance-based learning), 懒惰学习(lazy learning)。在处理训练集的时候,我们并没有建任何的模型,而是对于一个未知的实例,我们开始归类的时候,我们才来看,根据它和我们已知类型的比较,来给...原创 2018-06-03 23:03:25 · 481 阅读 · 0 评论 -
(七)线性回归
假定一个银行贷款系统 根据 工资 和年龄 这两个特征,预测核定应给客户多少额度的贷款(label为具体的值),银行所要预测的是个具体值,这就是所谓的回归问题。之前所说的决策树就是分类问题 样本 工资 x1x1x_1 年龄 x2x2x_2 可贷款额度 hθ(x)hθ(x)h_\theta(x) 1 3000 22 19000 2 80...原创 2018-06-09 02:50:32 · 462 阅读 · 0 评论 -
(十一)Support Vector Machine 理论 (支持向量机SVM 上)
背景:最早期是由 Vladimir N. Vapnik 和 Alexey Ya. Chervonenkis 在1963年提出目前的版本(soft margin)是由Corinna Cortes 和 Vapnik在1993年提出,并在1995年发表深度学习(2012)出现之前,SVM被认为机器学习中近十几年来最成功,表现最好的算法 机器学习的一般框架:获取一个数据...原创 2018-06-10 19:48:30 · 402 阅读 · 0 评论 -
感知器
感知器,也可翻译为感知机,是Frank Rosenblatt在1957年就职于Cornell航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络。它可以被视为一种最简单形式的前馈式人工神经网络,是一种二元线性分类器。作为神经网络(深度学习)的起源 的 算法。 因此,学习感知机的构造也就是学习通向神经网络和深度学习的一种重要思想。在数学上描述...原创 2019-02-14 00:46:03 · 1068 阅读 · 1 评论 -
感知器(二) 权重更新算法
神经网络的“ 学习” 是指从训练数据中自动获取最优权重参数的过程。神经网络的特征就是可以 从数据中学习。 所谓“ 从 数据中学习”, 是指可以由数据自动决定权重参数的值。此时如何学习到权重参数,这就涉及到权重更新算法。这里给出一般性权重更新算法最新权重 W(j)′W' _{(j)}W(j)′ = W(j)W_{(j)}W(j) + ∇W(j)\nabla W_{(j...原创 2019-02-19 16:46:27 · 7918 阅读 · 2 评论