学习笔记【机器学习重点与实战】
参考《机器学习实战》《机器学习-周志华》《统计学习方法》及视频课程,总结各机器学习算法重点,并进行实战演练。包括线性回归,Logistic回归,决策树,集成学习-Bagging、Boosting,SVM,聚类,EM算法,主题模型,HMM……
dkjkls
简书主页:https://www.jianshu.com/u/1c23f6c45d0e
展开
-
读书笔记 摘自:《人工智能:国家人工智能战略行动抓手》的笔记(作者: 腾讯研究院 中国信息通信研究院互联网法律研究中心 腾讯AI Lab 腾讯开放平台)
序言一第三次人工智能浪潮已经到来,这是更强大的计算能力、更先进的算法、大数据、物联网等诸多因素共同作用的结果。决策让渡将越来越普遍。正是由于人工智能在决策和行动的自主性上面正在脱离被动工具的范畴,其判断和行为一定要符合人类的真实意图和价值观、道德观,符合法律规范及伦理规范等。家庭机器人可能为了做饭而宰杀宠物狗,以清除病人痛苦为目的的看护机器人可能结束病人生命,诸如此类。序言二实体经济数...原创 2019-03-31 09:53:28 · 9696 阅读 · 1 评论 -
计算广告 - 品牌合约广告
由于公司项目需要启动类似品牌合约广告的商业化项目,对合约广告进行了前期的调研。以下是调研结果的思维导图。参考资料:《计算广告》Ad Serving Using a Compact Allocation Plan, Yahoo!Labs, 2012小米品牌广告引擎与算法实践小米广告大数据与算法实践微信广告引擎与播放节奏算法实践QCon上海2016-小米广告交易平...原创 2019-02-24 22:49:07 · 1019 阅读 · 0 评论 -
多目标优化算法——多目标粒子群算法实战分享
版权声明:本文为博主原创文章,未经博主允许不得转载。运筹学优化领域,多目标优化算法,多目标自适应粒子群优化算法;并简要介绍了开源多目标优化算法框架jMetal。基本的粒子群优化算法可参照博主的一篇文章粒子群算法实战分享-附原版动画PPT(技术分享也可以文艺范?)PPT下载地址:《多目标粒子群算法分享 - 优快云博主dkjkls》。...原创 2019-03-09 12:34:24 · 41738 阅读 · 21 评论 -
GBDT和随机森林-附原版动画PPT(技术分享也可以文艺范?)
版权声明:本文为博主原创文章,未经博主允许不得转载。本周在公司给校招生做了次 GBDT和随机森林 分享,把PPT分享出来。原版动画PPT下载链接:《GBDT和随机森林- 优快云博主dkjkls》参考资料:学习笔记【机器学习重点与实战】——4 集成学习-Bagging学习笔记【机器学习重点与实战】——5 集成学习-Boosting《机器学习 - 周志华》第8章 集成学习 《机器...原创 2018-12-01 17:30:58 · 3218 阅读 · 3 评论 -
学习笔记【机器学习重点与实战】——12 EM算法
1 EM算法之前章节的实例中都假设训练样本所有属性变量的值都已被观测到,即变量都是观测变量(observable variable),训练样本是”完整”的。但在现实应用中往往会遇到”不完整”的训练样本,即存在未观测变量(”隐变量” - hidden variable 或 latent variable)。 而EM算法就可以处理这类含有隐变量样本的问题。EM算法是一种迭代算法,1977年由...原创 2018-05-13 19:00:34 · 886 阅读 · 0 评论 -
学习笔记【机器学习重点与实战】——11 频繁项集与关联关系挖掘算法
1 频繁项集与关联关系挖掘算法从大规模数据集中寻找物品间的隐含关系被称作关联分析(association analysis ) 或者关联规则学习(association rule learning)。关联分析是用于发现大数据集中元素间有趣关系的一个工具集,可以采用两种方式来量化这些有趣的关系。第一种方式是使用频繁项集,它会给出经常在一起出现的元素项。第二种方式是关联规则,每条关联规则意味着元素...原创 2018-05-05 14:41:58 · 1779 阅读 · 0 评论 -
学习笔记【机器学习重点与实战】——10 聚类算法实现与实战
1 K-Means算法实现K-Means算法过程伪代码表示如下:创建k个点作为起始质心(经常是随机选择)当任意一个点的簇分配结果发生改变时 对数据集中的每个数据点 对每个质心 计算质心与数据点之间的距离 将数据点分配到距其最近的簇 对每一个簇,计算簇中所有点的均值并将均值作为质心实现代码如下:def ...原创 2018-05-04 21:50:41 · 888 阅读 · 0 评论 -
学习笔记【机器学习重点与实战】——9 聚类算法原理
1 K-MeansK-Means算法,也被称为K-均值算法或K-平均,是一种广泛使用的聚类算法,或者为其它聚类算法的基础。K-Means是发现给定数据集的 k 个簇的算法。簇个数 k 是用户给定的,每一个簇通过其质心(centroid), 即簇中所有点的中心来描述。 K-Means算法过程伪代码表示如下:创建k个点作为起始质心(经常是随机选择)当任意一个点的簇分配结果发生改变...原创 2018-05-04 15:26:02 · 942 阅读 · 0 评论 -
学习笔记【机器学习重点与实战】——8 聚类基础(评价指标/距离/相似度)
1 基本概念在”无监督学习” (unsupervised learning) 中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。聚类(clustering)就是一种研究最多、应用最广的无监督学习。对于大量未知标注的数据集,按照数据的内在相似性将数据集划分为多个类别,将相似的对象归到同一个簇中,使得簇内的数据相似度较大,而...原创 2018-05-04 01:47:32 · 3246 阅读 · 0 评论 -
学习笔记【机器学习重点与实战】——7 支持向量机实战
1 sklearn支持向量机分类通过scipy中的multivariate_normal创建四分类随机多元正态分布样本集,使用sklearn中的svm.SVC对样本分类,实现代码如下:import numpy as npfrom sklearn import svmfrom scipy import statsfrom sklearn.metrics import accurac...原创 2018-04-29 17:52:46 · 585 阅读 · 0 评论 -
学习笔记【机器学习重点与实战】——6 支持向量机原理
1 支持向量机支持向量机(support vector machines,SVM)是一种二类分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机;支持向量机还包括核技巧,这使它成为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划(convex quadratic programming)的问题,也等价于正则化的合页损失函...原创 2018-04-27 02:02:58 · 1052 阅读 · 0 评论 -
学习笔记【机器学习重点与实战】——5 集成学习-Boosting
1.BoostingBoosting 是一族可将弱学习器提升为强学习器的算法。这族算法的工作机制类似:先从初始训练集训练出一个基学习器,再根据基学习器的表现对训练样本分布进行调整,使得先前基学习器做错的训练样本在后续受到更多关注,然后基于调整后的样本分布来训练下一个基学习器;如此重复进行,直至基学习器数目达到事先指定的值 T , 最终将这 T 个基学习器进行加权结合。Boosting 算法工作...原创 2018-04-21 09:20:37 · 659 阅读 · 0 评论 -
学习笔记【机器学习重点与实战】——4 集成学习-Bagging
1.集成学习集成学习 (ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统 (multi-classifier system) 、基于委员会的学习 (committee-based learning) 等。图 1 为集成学习的一般结构:先产生一组”个体学习器” (individual learner) ,再用某种策略将它们结合起来。个体学习...原创 2018-04-16 00:39:30 · 3420 阅读 · 3 评论 -
学习笔记【机器学习重点与实战】——3 决策树
学习笔记【机器学习重点与实战】——3 决策树1.决策树决策树(decision tree)是一种常见的机器学习方法,是一种基本的分类和回归方法。决策树模型呈树形结构,如下图所示,对鸢尾花数据采用决策树学习得到的3层决策树。 定义5.1(决策树) 分类决策树模型是一种描述对实例进行分类的树形结构,决策树由节点(node)和有向边(directededge)组成。结点有两种类型...原创 2018-03-31 23:51:58 · 892 阅读 · 0 评论 -
学习笔记【机器学习重点与实战】——2 Logistic回归
1.Logistic回归Logistic回归是实践中解决分类问题的最重要方法,方法简单、容易实现、效果良好、易于解释,应用范围不只是分类,亦可用于推荐系统。 优点:计算代价不高,易于理解和实现。 缺点:容易欠拟合,分类精度可能不高。 适用数据类型:数值型和标称型数据。 ——《机器学习实战》P74P74P_{74} Logistic回归的一...原创 2018-03-23 01:43:32 · 787 阅读 · 0 评论 -
学习笔记【机器学习重点与实战】——1 线性回归
1.线性回归概述 线性模型形式简单、易于建模,但却蕴涵着机器学习中一些重要的基本思想。许多功能更为强大的非线性模型 (nonlinear model)可在线性模型的基础上通过引入层级结构或高维映射而得。此外,由于 ω 直观表达了各属性在预测中的重要性,因此线性模型有很好的可解释性 (comprehensibility)。 ——《机器学习-周志华》P53P53P_{53} 优...原创 2018-03-21 00:01:49 · 1319 阅读 · 0 评论 -
读书笔记:《人工智能》
读书笔记 摘自:《人工智能》(作者:李开复 王咏刚)第一章 人工智能来了人工智能已经来了,而且它就在我们身边,几乎无处不在。人类,你好!“不管我们是碳基人类还是硅基机器人,都没有本质的区别。我们中的每一员都应获得应有的尊重。” 每当前沿科技取得重大突破,为我们预示出人工智能的瑰丽未来时,许多人就又不约而同地患上人工智能恐惧症,生怕自己的工作乃至人类的前途被潜在的机器对手掌控。 普通公众对人工智能原创 2017-10-31 00:17:52 · 48685 阅读 · 1 评论 -
AI转型学习计划
第四次工业革命国家战略目标:“到2030年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心,智能经济、智能社会取得明显成效,为跻身创新型国家前列和经济强国奠定重要基础。”继互联网、移动互联网后又一大风口国内人工智能人才缺口500万AI热已经无需多提,关于AI的资讯满天飞。上面这些关键词无时无刻不在触动着博主再次转换方向做人工智能的心。经过深思熟虑,根据自身...原创 2017-11-19 01:16:28 · 920 阅读 · 1 评论 -
粒子群优化算法解决场地资源布局问题-算法原型探讨
版权声明:本文为博主原创文章,未经博主允许不得转载。 本篇文章的命题来源于博主参加工作后的第一项任务,用智能优化算法解决工程实际中关于某施工场地相关资源布局的问题。由于博主的硕士毕业论文(详见第3章 基于PSO的已知静态路径规划方法)涉及到了粒子群优化算法,有一定经验,固对于本命题欲采用粒子群优化算法进行求解。 对于本命题而言,与博主的硕士毕业论文中解决的问题有很大差别,可以说...原创 2017-05-31 23:21:48 · 12728 阅读 · 6 评论 -
粒子群算法实战分享-附原版动画PPT(技术分享也可以文艺范?)
本文是针对博主使用粒子群优化算法解决水面无人艇静态、动态障碍物规避,及场地布局三类问题,做了更深入的总结分析。 本文的形式是按照《粒子群算法实战分享PPT》结构,对每页PPT内容进行阐述。博主分享的PPT是原版包含动画的PPT,自我感觉PPT做的很正、很文艺范,是博主7年来打杂做各种PPT经验的大成之作(说白了也就这水平),相信看完原版PPT你就会觉得原来“技术分享也可以这么文艺范”!原创 2017-08-07 21:45:16 · 20549 阅读 · 14 评论