
机器学习-无监督学习
村头陶员外
B站,小红书,抖音等平台搜索 “Forrest的数据科学站”
展开
-
机器学习-->无监督学习-->聚类
本篇博文将详细总结机器学习里面的一个很重要的内容-聚类。聚类定义定义聚类就是对大量未知标注 的数据集,按数据 的内在相似性将数据集划分为多个类别,使 类别内的数据相似度较大而类别间的数据相 似度较小。是无监督的分类方式。聚类思想给定一个有N个对象的数据集,构造数据的k 个簇,k≤n。满足下列条件: 每一个簇至少包含一个对象 每一个对象属于且仅属于一个簇 将满足上述条件的k个簇称作一个合理划分原创 2017-08-05 16:49:30 · 11994 阅读 · 0 评论 -
机器学习-- >无监督学习-- >EM算法
本篇博文将详细总结机器学习里面一个非常重要的算法-EM算法。复习Jensen不等式若f是凸函数 凸函数即割线在函数线的上方。基本Jensen不等式:若,则有上面是针对离散情况,若对于连续情况可以推得:若有 on ,,则可得: 即有 其中E f(x) 表示f(x)在p(x)这样一个分布下的期望。EM算法前面的博文中讲到了K-means聚类算法,能够非常方便的 将未标记的样本分成若干簇,但无法原创 2017-08-10 23:19:24 · 6288 阅读 · 0 评论 -
机器学习-- > 隐马尔科夫模型(HMM)
本篇博文将详细总结隐马模型相关知识,理解该模型有一定的难度,在此浅薄的谈下自己的理解。HMM定义HMMHMMHMM 是关于时序的概率模型,描述由一个隐藏的马尔科夫链生成不可观测的状态随机序列,再由各个状态生成观测随机序列的过程。隐马尔科夫模型随机生成的状态随机序列,称为状态序列;每个状态生成一个观测,由此产生的观测随机序列,称为观测序列。序列的每个位置可看做是一个时刻。上图中的...原创 2020-10-10 10:36:14 · 1843 阅读 · 1 评论