
MachineLearning
文章平均质量分 80
refresh&grow
这个作者很懒,什么都没留下…
展开
-
机器学习笔记1 -- 线性回归
机器学习三要素:算法 数据 模型三者关系--利用算法通过在数据上训练得到模型,模型可以用来在新的数据上预测结果。数据-分为有标注/无标注数据,需要转化为向量空间模型VSM,供计算机使用模型-预测值y'和实际值y误差越小模型越好。描述y'和y之间差别的函数叫损失函数(Loss Function);描述整体上差别的函数叫代价函数(Cost Function)。 - 对分类而言,模型验证指标有精准率(P...原创 2018-07-12 23:44:16 · 268 阅读 · 0 评论 -
一句话描述常用机器学习算法
摘要: 浓缩就是精华。想要把书写厚很容易,想要写薄却非常难。现在已经有这么多经典的机器学习算法,如果能抓住它们的核心本质,无论是对于理解还是对于记忆都有很大的帮助,还能让你更可能通过面试。在本文中,SIGAI将用一句话来总结每种典型的机器学习算法,帮你抓住问题的本质,强化理解和记忆。下面我们就开始了。导言浓缩就是精华。想要把书写厚很容易,想要写薄却非常难。现在已经有这么多经典的机器学习算法...转载 2018-09-22 23:27:34 · 716 阅读 · 0 评论 -
机器学习笔记7 -- KNN & K-Means
Table of Contents三种监督学习算法有监督学习算法无监督半监督KNN(K-Nearest Neighbor/K-近邻算法)基本思想:问题及优化方法K-Means基本思想K-Means算法的局限三种监督学习算法有监督学习算法训练数据中同时拥有输入变量和输出变量,用一个算法把从输入到输出的映射关系学习出来,当我们拿到新的数据后,就可以通...原创 2018-08-20 21:42:32 · 448 阅读 · 0 评论 -
机器学习笔记6 -- 隐马尔科夫模型 Hidden Markov Model
Table of Contents问题域为什么HMM可以解决NLP问题HMM基于两个假设模型训练三组参数三个基本问题问题域概率模型将学习任务归结于计算变量的概率分布,其核心是如何基于可观测变量推测出未知变量的条件分布。概率图模型就是一类用图来表达变量相关关系的概率模型,根据性质不同可以分为两类:第一类是使用有向无环图表示变量之间的依赖关系,称为有向图模型或者贝叶...原创 2018-08-11 21:53:18 · 878 阅读 · 0 评论 -
强化学习概览
什么是强化学习强化学习是机器学习中的一个分支, 机器通过不断地尝试, 从错误中学习, 最后找到规律, 学会了达到目的的方法. Alpha go就是强化学习的应用实例。强化学习的设置由两部分组成,一个是智能体(agent),即强化学习算法;另一个是环境,指的是agent执行动作时所处的场景(如游戏本身)。环境首先向智能体发送一个状态,然后智能体基于其知识采取动作来响应该状态。之后,环境发送下...原创 2018-07-22 20:27:22 · 702 阅读 · 0 评论 -
入行 AI,如何选个脚踏实地的岗位
0. 引子AI原本是一个专业领域,没什么特别的。作为码农一枚,笔者的工作内容正好在这个领域。近来这一年左右时间里,连续发生了多件事情,使得笔者不得不抬起原本一直低着敲代码的头,看看这个为AI狂欢的世界。【Case 1】 居然在一个月里碰到两位在相对传统行业创业的亲友,来打听将AI技术应用到他们所在行业上的问题,例如:是聊天机器人是否可以代替人工客服。两位亲友居然都动了雇佣一位算法...转载 2018-07-19 00:21:40 · 684 阅读 · 0 评论 -
机器学习笔记5 -- 支持向量机 SVM
SVM是最好的现成的分类器,不加修改即可直接使用。但调用 SVM 算法的测试准确度并不一定都很高。影响因素有数据预处理的效果、训练集的大小、特征值的选择、参数设置以及核函数的选择等因素。 知识点:软间隔最大化--点到超平面的距离并引入松弛变量(for outliers)其中w,b分别为超平面的法向量和截距;ε为松弛变量,C 为惩罚参数,它的目的是使得目标变量最小即几何间...原创 2018-07-14 23:36:35 · 371 阅读 · 0 评论 -
机器学习笔记4 -- 决策树
Table of Contents问题域模型函数目标函数训练算法ID3(Iterative Dichotomiser 3)C4.5-ID3的改进算法CART (Classification and Regression Tree )优点缺点及优化方案问题域分类问题,适合离散型、连续型数据模型函数是一个树结构(可以是二叉树或非二叉树),每个非叶节点...原创 2018-07-13 00:27:58 · 311 阅读 · 0 评论 -
机器学习笔记3 -- 逻辑回归 Logistic Regression
问题域分类回归的预测结果时连续结果,如何实现分类的?逻辑函数在二维坐标中的表现形式为S型曲线,所以逻辑函数又称Sigmod函数。由图可以看出预测值的范围是[0,1]区间内的实数。当y>0.5时,x归类为真;当y<=0.5时,x归类为假。从而实现类别划分。LR还可以解决多分类问题:n个类别需要构造n个分类模型,第n个模型区分是不是属于第n类。每个输入都被n个模型同时预测,如果只有一个模型...原创 2018-07-13 00:22:49 · 361 阅读 · 0 评论 -
机器学习笔记2 -- 贝叶斯分类
问题域分类VS回归前者是预测一个标签(类型、类别);后者则是预测一个量。分类模型输出的预测值是离散值;而回归模型输出的预测值则是连续值。模型函数贝叶斯准则:“后验概率和先验概率的关系条件独立性假设实际情况下影响B的因素有n个,假设为b1~bn。则有根据链式法则有假设b1到bn这些特征之间在概率分布上是条件独立的,即每个特征和其它特征均不相关。则有b1~bn为Feature,A为Class,上式可以...原创 2018-07-13 00:08:25 · 238 阅读 · 0 评论 -
问题生成(QG)与答案生成(QA)
继续 QG,梳理一下 MSRA 其他 3 篇关于 QG 的 paper:Two-Stage Synthesis Networks for Transfer Learning in Machine Comprehension Question Answering and Question Generation as Dual Tasks A Joint Model for Question ...转载 2018-09-23 00:00:33 · 7439 阅读 · 0 评论