
机器学习
文章平均质量分 89
LoveMIss-Y
爱生活,爱学习,爱这个世界上一切让自己觉得快乐的东西,爱MIss-Y
展开
-
机器学习的5种距离度量方法
在机器学习领域中有非常多的问题需要求距离,常见的是向量距离的计算。比如判断A、B、C三种商品之间的相似性,可以先按照商品特征构建A、B、C的各自的向量,然后求向量间的距离,距离近就表示彼此相似度高。今天讲下常见的几种距离计算方法。一、 欧式距离EuclideanDistance欧式距离:两点之间的直线距离。(1)二维平面上两点a(x1,y1),b(x2,y2)之间的欧式距离公式:(2) n维...原创 2018-05-11 16:59:34 · 1863 阅读 · 0 评论 -
三个层面、三个不同角度理解正则化
全文摘要“正则化”这是机器学习和深度学习都在不断用到的一个技术手段,也是解决模型模型过拟合最常用的手段,但是很少有文章真正讲的深入彻底,本文是在之前自己的一篇博文的基础之上进行补充的,将再次从“三个不同层面”解释正则化,本文只针对L1、L2正则化。三个不同层面理解“正则化”我们经常说,对于L1正则化,在极小值处,会产生“稀疏解”,而对于L2正则化,在极小值处,会产生“平顺解”,...原创 2018-11-16 09:27:32 · 1262 阅读 · 0 评论 -
一文详解“单例模式”及其python语言的实现
一、什么是“单例模式”——一个实例单例模式(Singleton Pattern)是一种常用的软件设计模式,该模式的主要目的是确保某一个类只有一个实例存在。当你希望在整个系统中,某个类只能出现一个实例时,单例对象就能派上用场。单例模式涉及到一个单一的类,该类负责创建自己的对象,同时确保只有单个对象被创建。这个类提供了一种访问其唯一的对象的方式,可以直接访问,不需要实例化该类的对象。...原创 2018-11-16 14:10:12 · 1702 阅读 · 0 评论 -
史上最详细、最完全的ipython使用教程,Python使用者必备!——ipython系列之一
一、ipython简介关于什么是ipython,本文就不加以介绍了,他是一个非常流行的python解释器,相比于原生的python解释器,有太多优点和长处,因此几乎是python开发人员的必知必会。1、ipython相比于原生的python有什么优势(1) python shell不能在退出保存历史;ipython历史记录自动保存:保存在history.sqlite文件下:可用...原创 2018-11-21 15:44:55 · 95551 阅读 · 4 评论 -
史上最详细、最完全的ipython使用教程,Python使用者必备!——ipython系列之二
声明:本文承接前面一篇文章,ipython系列之一;另外,本文所指的ipython不是ipython notebook,ipython notebook已经被jupyter notebook所取代,不再叫ipython notebook了。前面讲解了ipython里面的一些核心知识点,包括它的优势所在、快捷键操作、内省、什么是魔术命令等等,本文将在前文的基础之上,进一步拓展,讲解ipy...原创 2018-11-22 15:14:58 · 51001 阅读 · 0 评论 -
一文带你看懂卷积神经网络(CNN)让你意想不到的10创新idea
全文摘要卷积神经网络(CNN)可以说是深度学习发展的一个缩影,特别是现在在计算机视觉方面已经得到了非常成熟的应用,在目标检测、目标追踪等方面也是独领风骚,本文将讲述卷积神经网络近些年来的发展历程,以及它到底创新在什么地方。本文略长,看完大约30min。卷积神经网络的十大概念与创新 1、Group convolution 卷积只能在同一组进行吗?答案当然是能!...原创 2018-11-20 11:26:43 · 6352 阅读 · 0 评论 -
史上最详细、最完全的jupyter notebook使用教程,Python使用者必备!——ipython系列之三
一、什么是jupyter1、简介:jupyter notebook是一种 Web 应用,能让用户将说明文本、数学方程、代码和可视化内容全部组合到一个易于共享的文档中。它可以直接在代码旁写出叙述性文档,而不是另外编写单独的文档。也就是它可以能将代码、文档等这一切集中到一处,让用户一目了然。Jupyter这个名字是它要服务的三种语言的缩写:Julia,PYThon和R,这个名字与“...原创 2018-11-24 18:01:04 · 286008 阅读 · 34 评论 -
深度神经网络重要原理及理论思想篇——自编码器(AutoEncoder)
一、从生成模型开始谈起1、什么是生成模型?概率统计层面:能够在给丁某一些隐含参数的条件下,随机生成观测数据的这样一种模型,称之为“生成模型”。它给观测值和比周数据系列制定一个连和概率分布机器学习层面:直接对数据进行建模,比如根据某个变量的概率密度函数进行数据采样。在贝叶斯算法中,直接对连和概率分布P(x,y)进行建模,然后利用贝叶斯公式进行求解P(y|x)。2、生成模型的两大类型...原创 2018-12-12 14:15:37 · 37560 阅读 · 2 评论 -
jupyter notebook高级教程系列——slide幻灯片制作
声明:前面已经详细讲解了ipython、jupyter notebook的使用、配置等内容,本文作为补充篇继续讲解jupyternotebook。本文主要由两个部分组成,jupyter notebook的常用菜单介绍、使用jupyter notebook制作幻灯片。所以一些关于如何启动,如何安装的基础教程这里就不再重复说明了。有需要的可以参考我前面的文章,链接如下:史上最详细、最完全的...原创 2018-12-18 13:25:53 · 16444 阅读 · 4 评论 -
深度学习参数初始化(weights initializer)策略大全
前言:深度学习的初始化参数指的是在网络训练之前,对各个节点的权重和偏置进行初始化的过程,很多时候我们以为这个初始化是无关紧要的,不需要什么讲究,但是实际上,一个参数的初始化关系到网络能否训练出好的结果或者是以多快的速度收敛,这都是至关重要的,有时候因为参数初始化的缘故,甚至得不到好的训练结果。本文就来讨论一下参数初始化到底有什么讲究以及常见的参数初始化的一些策略方法。阅读本文需要神经网络...原创 2019-03-21 11:20:37 · 30157 阅读 · 1 评论 -
基于sklearn的聚类算法的聚类效果指标
前言:度量聚类算法的性能不是简单的统计错误的数量或计算监督分类算法中的 precision (准确率)和 recall (召回率)。聚类算法的评价指标有很多,本文主要是基于sklearn机器学习库,里面提供了一系列的度量函数,在这些度量函数里面,有的需要知道真实的样本类别,然后有的聚类本来就没有真实的样本类别,甚至像DBSCAN这样的聚类方法,连到底有几个类别都不确定,那怎么去评价聚类的好...原创 2019-07-02 16:12:32 · 49963 阅读 · 8 评论 -
马尔科夫模型系列文章(一)——马尔科夫模型
前言:我发现网上很多博客在讲马尔科夫相关的知识点的时候, 总是讲的不是很清楚,有的纯粹只关注理论,看不太懂,有的一上来就搞几个算例,更是一片懵逼,有的又将一些概念一会儿换一个说法,一会儿是马尔科夫过程,一会儿是马尔科夫模型,一会儿是马尔科夫链,傻傻分不清楚,也不好理解,决定自己抽点时间,好好写一下,会详细介绍马尔科夫模型、马尔科夫链、隐马尔可夫模型、条件随机场等相关的概念和案例,本文为第一篇。...原创 2019-08-28 15:03:09 · 66150 阅读 · 16 评论 -
生成对抗网络GAN资料打包分享
全文摘要生成式对抗网络,即所谓的GAN是近些年来最火的无监督学习方法之一,模型由Goodfellow等人在2014年首次提出,将博弈论中非零和博弈思想与生成模型结合在一起,巧妙避开了传统生成模型中概率密度估计困难等问题,是生成模型达到良好的效果。本文总结收集了一些关于生成对抗网络的学习资源,有兴趣者可以好好学一学。生成对抗网络资料打包1基础知识 台大李弘毅老师gan...原创 2018-11-16 09:21:02 · 773 阅读 · 0 评论 -
常见机器学习算法优缺点总结
一、朴素贝叶斯1.1主要优点:1)朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率。2)对小规模的数据表现很好,能个处理多分类任务,适合增量式训练,尤其是数据量超出内存时,我们可以一批批的去增量训练。3)对缺失数据不太敏感,算法也比较简单,常用于文本分类。1.2主要缺点:1) 理论上,朴素贝叶斯模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因...原创 2018-11-16 09:08:14 · 5728 阅读 · 0 评论 -
数据挖掘过关40题
转自:机器学习算法与Python学习 1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题? A.关联规则发现B.聚类C.分类D.自然语言处理 2.以下两种描述分别对应哪两种对分类算法的评价标准?(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。(b)描述有多少比例的小偷给警察抓了的标准。 A...转载 2018-08-21 10:11:16 · 3693 阅读 · 0 评论 -
机器学习笔试精选 100 题
欢迎关注“勇敢AI”公众号,更多python学习、数据分析、机器学习、深度学习原创文章与大家分享,还有更多电子资源、教程、数据集下载。勇敢AI,一个专注于人工智能AI的公众号。==================================================================================转自:AI有道机器学习是一门理论性和实战...转载 2018-08-25 09:53:51 · 53203 阅读 · 2 评论 -
一文详解matplotlib的配置文件以及配置方式
欢迎关注“勇敢AI”公众号,更多python学习、数据分析、机器学习、深度学习原创文章与大家分享,还有更多电子资源、教程、数据集下载。勇敢AI,一个专注于人工智能AI的公众号。==================================================================================一、matplotlib配置 我...原创 2018-09-17 15:29:12 · 16025 阅读 · 6 评论 -
python、机器学习、深度学习资源推荐
一、公众号资源推荐——公众号“勇敢AI”“勇敢AI”——一个专注于人工智能的微信公众平台。本人新开创了一个公众号,经过长时间的积累,也积累了大量的资源,有众多的福利与大家分享,希望有兴趣的关注一下福利如下:1、海量电子书资源 后面还会持续收录相关的电子书,希望大家持续关注。2、 海量课程、教程资源下载你只要关注本公众号,就可以免费获得了。3、每个...原创 2018-09-13 10:48:15 · 1288 阅读 · 0 评论 -
numpy高级函数操作之——select、choose
一、什么是np.select()顾名思义,这个函数用用来“ 根据某一些条件 ” 来筛选出 “某一些元素 ”的函数,比如我有一个数组,我如果用if-else语句去做,当然也可以,比如我们让小于6的元素各自加上10,大于等于6的元素统统变为100,我们可以这么做,代码如下:a=np.array([1,2,3,4,5,6,7,8,9,10])aaa=[] #存储筛选结果的列表fo...原创 2018-09-14 16:40:16 · 23261 阅读 · 2 评论 -
numpy高级教程之np.where和np.piecewise
欢迎关注“勇敢AI”公众号,更多python学习、数据分析、机器学习、深度学习原创文章与大家分享,还有更多电子资源、教程、数据集下载。勇敢AI,一个专注于人工智能AI的公众号。================================================================================== 关于numpy的教程,前面已经...原创 2018-09-25 16:07:35 · 19475 阅读 · 0 评论 -
pandas绘图详细教程
欢迎关注“勇敢AI”公众号,更多python学习、数据分析、机器学习、深度学习原创文章与大家分享,还有更多电子资源、教程、数据集下载。勇敢AI,一个专注于人工智能AI的公众号。==================================================================================一、pandas绘图前面讲过matpl...原创 2018-10-15 15:10:27 · 35295 阅读 · 0 评论 -
matplotlib高级教程之形状与路径——patches和path
欢迎关注“勇敢AI”公众号,更多python学习、数据分析、机器学习、深度学习原创文章与大家分享,还有更多电子资源、教程、数据集下载。勇敢AI,一个专注于人工智能AI的公众号。==================================================================================一、什么是形状和路径在一般的使用mat...原创 2018-10-10 09:55:47 · 54554 阅读 · 5 评论 -
TensorFlow之tfrecords文件详细教程
欢迎关注“勇敢AI”公众号,更多python学习、数据分析、机器学习、深度学习原创文章与大家分享,还有更多电子资源、教程、数据集下载。勇敢AI,一个专注于人工智能AI的公众号。==================================================================================全文摘要当前是数据爆炸的时代,深度...原创 2018-10-23 09:08:02 · 18400 阅读 · 6 评论 -
一文彻底搞懂卷积神经网络的“感受野”,看不懂你来找我!
一、什么是“感受野”1.1 感受野的概念“感受野”的概念来源于生物神经科学,比如当我们的“感受器”,比如我们的手受到刺激之后,会将刺激传输至中枢神经,但是并不是一个神经元就能够接受整个皮肤的刺激,因为皮肤面积大,一个神经元可想而知肯定接受不完,而且我们同时可以感受到身上皮肤在不同的地方,如手、脚,的不同的刺激,如痛、痒等。这说明皮肤感受器是由很多不同的神经元控制的,那么每一个...原创 2018-10-23 10:04:40 · 5738 阅读 · 8 评论 -
史上最简单易懂、全面详细的“正则化”教程
进入正文全文摘要在机器学习和深度学习中,最艰难的问题就是如何面对模型的过拟合问题,处理过拟合的方式手段多样,我们常常听见的方法是“正则化”,但是,很多的资料对于正则化的介绍要么是单调片面、要么是晦涩难懂,本文汲取众家之长,由浅入深,彻底搞明白正则化的原理和应用。本文偏长,阅读全文约20分钟。一、模型过拟合1.1 什么是模型的过拟合1. 1训练的模型过拟合...原创 2018-11-06 09:48:01 · 9029 阅读 · 6 评论 -
sklearn数据预处理(preprocessing)系列——类别以及特征的编码(Encoder)
一、特征编码1 类别的独热编码(One-Hot Encoder)关于什么是独热编码以及为什么要进行独热编码,这里就不详细介绍了,本文只介绍“具体实践方式”,原理一笔带过。第一步:先对离散的数字、离散的文本、离散的类别进行编号,使用 LabelEncoder,LabelEncoder会根据取值的种类进行标注。import sklearn.preprocessing as ...原创 2018-11-07 15:51:17 · 11878 阅读 · 0 评论 -
马尔科夫模型系列文章(二)——隐马尔科夫模型
前言:前面的一片文章介绍了马尔科夫模型,以及里面的一些核心概念,如转移概率、状态、转移概率矩阵等,本次文章更进一步,介绍隐马尔可夫模型。它是在马尔科夫模型的基础之上进一步得来的。隐马尔可夫模型最重要的其实就是两个假设、三个要素、三种基本问题。一、什么是隐马尔可夫模型HMM(Hidden Markov Model, HMM)1.1 从一个简单的例子说起既然说它是在马尔科夫模型的基础之...原创 2019-08-29 14:17:25 · 4425 阅读 · 2 评论