
机器学习
文章平均质量分 89
啥都不懂的小程序猿
这个作者很懒,什么都没留下…
展开
-
入门机器学习(西瓜书+南瓜书)聚类总结(python代码实现)
入门机器学习(西瓜书+南瓜书)聚类总结(python代码实现)一、聚类1.1 通俗理解聚类,顾名思义就是把数据特征相似的数据聚为一类。属于无监督学习的范畴。没有标签值的监督,因此不同的聚类算法,聚类的结果也不同。俗话说物以类聚。聚类就是按照某一个特定的标准(比如距离),把一个数据集分割成不同的类或簇(cluster),使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇内的数据对象的差异性也尽可能的大。聚类可以作为一个单独过程,用于寻找数据内在分布结构,也可以作为其他学习任务前驱过程。聚类和分原创 2022-05-25 17:59:35 · 1647 阅读 · 0 评论 -
入门机器学习(西瓜书+南瓜书)贝叶斯分类器总结(python代码实现)
入门机器学习(西瓜书+南瓜书)贝叶斯分类器总结(python代码实现)一、贝叶斯分类器1.1 通俗理解先来看两个公式P(AB)=P(A)P(B)(1)P(AB)=P(A)P(B) (1)P(AB)=P(A)P(B)(1)P(AB)=P(B∣A)P(A)=P(A∣B)P(B)(2)P(AB)=P(B|A)P(A)=P(A|B)P(B) (2)P(AB)=P(B∣A)P(A)=P(A∣B)P(B)(2)我先说第一个公式,首先这里的A,B分别代表两个不同的事件。如果事件A和事件B的独立,也就是说事件A原创 2022-05-25 16:49:26 · 2517 阅读 · 0 评论 -
入门机器学习(西瓜书+南瓜书)支持向量机总结(python代码实现)
入门机器学习(西瓜书+南瓜书)支持向量机总结(python代码实现)一、支持向量机1.1 通俗理解通俗来说,支持向量机这玩意就是用一条直线把不同的样本的分开,具体可以看下图。可以看到就目前的数据分布,我们可以找到非常多的直线都可以很容易把样本分开。那么这么多的直线那一条最好呢?更直白点,那一条我预测数据出错率最低呢?答案就是下图中间的那一条(正是说法这条直线也叫超平面),可以看到这条直线距离两侧的“边界”样本的距离都是最大且相等的(正式说法把两侧的距离之和叫做间隔,也就是图片上的2∣∣w∣∣\frac原创 2022-03-29 17:09:46 · 2884 阅读 · 3 评论 -
入门机器学习(西瓜书+南瓜书)神经网络总结(python代码实现)
入门机器学习(西瓜书+南瓜书)神经网络总结(python代码实现)一、神经网络1.1 通俗理解这次的内容较难理解,因此,笔者尽量通过通俗的话来说说清楚什么是神经网络?他是怎么来的?为什么近几年会如此之热?在此基础之上的深度学习,有是怎么回事?下面让我们一步步来揭开神经网络的神秘面纱。神经网络模型其实最早起源于我们熟知的线性模型,对,你没有听错。就是简单的y=kx+by=kx+by=kx+b,那时,他还叫做感知机。就是从神经元的构造中获得启发,直白说就是比较简单的线性连接与输出。如下图为神经元示意图,原创 2022-03-26 16:48:25 · 8417 阅读 · 5 评论 -
入门机器学习(西瓜书+南瓜书)决策树总结(python代码实现)
入门机器学习(西瓜书+南瓜书)决策树总结(python代码实现)一、决策树理论分析1.1 通俗理解决策树是一种非常经典的机器学习算法,通俗理解的话我们可以举一个例子,比如现在别人要找你借钱,那么按照首先是不是要判断你和他的关系如何?如果关系不好,我就直接拒绝他。如果关系很好,我就直接借给他了,那么如果关系一般,我要判断一下他是男是女?如果是男生,那么就不借,如果是女生,我要继续考虑她的人品好不好?如果人品不好,就不借,如果人品不错,就借。这也就是所谓的决策树。用python画出决策树的图,可以看到相当原创 2022-03-24 10:51:15 · 5356 阅读 · 0 评论 -
入门机器学习(西瓜书+南瓜书)线性回归和逻辑回归总结(python代码实现)
入门机器学习(西瓜书+南瓜书)第三章总结(python代码实现)一、理论总结原创 2022-03-19 00:51:39 · 3484 阅读 · 2 评论 -
入门机器学习(西瓜书+南瓜书)模型选择与评估总结(python代码实现)
机器学习(西瓜书+南瓜书)第一、二章总结(python代码实现)原创 2022-03-15 21:32:17 · 5955 阅读 · 0 评论 -
自然语言处理实验—分词算法(含python代码及详细例子讲解)
自然语言处理基础算法—分词算法最近在学自然语言处理,这是第一个上机实验自然语言处理的分词算法,也是自然语言处理比较入门的算法。和大家分享一下。首先,自然语言处理,英文是(Nature Language Process),简称“NLP"。是人工智能发展的的热门方向,也是和人交互最为相关的人工智能的应用方向。因为是和人打交道,那么需要以人的交流方式–语言来进行交互。下面给大家介绍NLP里面最基础的算法–分词算法。1.词典一个好的NLP系统一定要有完备的词典,用于判断算法分出的词是否是具有实际意义的词。原创 2021-10-14 22:09:55 · 12091 阅读 · 0 评论 -
BPR贝叶斯个性化推荐算法—推荐系统基础算法(含python代码实现以及详细例子讲解)
贝叶斯个性化排序(BPR)一、问题导入在很多推荐场景中,我们都是基于现有的用户和商品之间的一些数据,得到用户对所有商品的评分,选择高分的商品推荐给用户,这是矩阵分解之类算法的做法,使用起来也很有效。但是在有些推荐场景中,我们是为了在千万级别的商品中推荐个位数的商品给用户,此时,我们更关心的是用户来说,哪些极少数商品在用户心中有更高的优先级,也就是排序更靠前。也就是说,我们需要一个排序算法,这个算法可以把每个用户对应的所有商品按喜好排序。BPR就是这样的一个我们需要的排序算法。一个更朴素的思想就是用户交互原创 2021-10-11 14:59:08 · 11630 阅读 · 30 评论 -
自然语言处理实验—用K-means的方法对样本特征分类(含python代码和详细例子解释)
自然语言处理实验—用K-means的方法对样本特征分类一、算法简述本次博客我们介绍一下机器学习里经典的聚类算法K-means,它属于典型的无监督学习算法。其核心思想也非常的简单,大致思路如下:要选取K(K=1,2,..)K(K=1,2,..)K(K=1,2,..)个簇的质心,这决定了我们最终聚类的簇(每一类被分为一个簇)。对每一个待分类的样本,我们都计算该样本到每个簇质心的距离,然后将该样本归类到最小距离的簇。更新每个簇的质心,每个簇的新的质心等于所有位于该簇的样本的均值。以此类推,重新归类样原创 2021-11-15 21:58:16 · 2030 阅读 · 0 评论 -
自然语言处理实验—用隐马尔可夫模型对句子分词(含python代码和详细例子解释)
自然语言处理实验—用隐马尔可夫模型对句子分词一、问题导入上一次实验我们介绍了隐马尔可夫模型的基本原理,以及根据具体案例来分析其应用,详细介绍了隐马尔科夫模型所包含的三个重要概率分布矩阵,初始化概率矩阵,状态转移概率矩阵,发射概率矩阵。以及其如何计算的方法。我们在上次实验的代码里,将训练好的三个矩阵用python的pumkle的模块进行了存储,这次实验我们着重介绍,隐马尔可夫模型在分词中的应用。二、用隐马尔可夫模型解决问题import numpy as npimport pickledef sol原创 2021-11-15 21:37:16 · 3192 阅读 · 2 评论 -
自然语言处理实验—用隐马尔可夫模型在分词中的应用计算概率矩阵(含python代码和详细例子解释)
自然语言处理基础算法—隐马尔可夫模型在分词中的应用一、问题导入最近,从头到尾学习了隐马尔可夫模型,这个模型十分神奇,核心思想就是过去发生的,现在发生的,和将要发生的,都只和这个时间的前一个事件相关。简单来说,你考试过不过我只看成绩,和你上课表现状况无关。而这些事件相连组成的链条就叫做马尔可夫链。那么问题又来了,为什么叫做隐马尔可夫模型呢?其实就是这里面包含一个隐状态。我们不妨举个例子,比如我和小梦天天聊天,她每天都会给我讲都干了啥?而不给我说她那边的天气。但是其实我是可以根据经验推测出来她那边的天气的原创 2021-10-24 14:11:38 · 5276 阅读 · 3 评论 -
矩阵分解与梯度下降算法—推荐系统基础算法(含python代码实现以及详细例子讲解)
一、问题导入1.1 理论概述矩阵分解通俗来说就是矩阵相乘的逆运算。即通过一个数据并不完全的矩阵,分解为两个数据完全的子矩阵,其中第一个子矩阵的列等于第二个子矩阵的行。再由两个数据完全的子矩阵相乘得到包含预测值数据完全的原矩阵,在推荐系统中对于用户-物品这个评分矩阵R,我们可以将其分解为用户-特性矩阵P,以及特性-物品矩阵Q。1.2 具体实例举个例子,比如音乐推荐。我们比如有3个用户(u表示),4首音乐(m表示)。 用户对歌曲的评分矩阵R可以想到,在真实的场景中,这个矩阵是极其稀疏的,对于庞大原创 2021-09-25 03:01:11 · 2520 阅读 · 0 评论 -
协同过滤算法—推荐系统基础算法(含python代码实现以及详细例子讲解)
推荐系统基础算法之协同过滤算法一、 算法简介1.1 算法概述1.2 算法核心和步骤二、基于用户的协同过滤算法(User-Based)2.1 相似度及预测值的计算2.1.1 相似度计算2.1.2 预测值的计算2.2 通过例子理解2.3 演算手稿2.4 python代码实现三、基于物品的协同过滤算法(Item-Based)3.1 算法流程:3.2 实例3.2.1 构建用户—>物品的倒排3.2.2 构建物品与物品的共现矩阵3.2.3 计算物品之间的相似度,即计算相似矩阵3.2.4 根据用户的历史记录,给用户原创 2021-06-13 17:53:40 · 39387 阅读 · 12 评论