- 博客(91)
- 资源 (2)
- 收藏
- 关注
原创 推荐系统:协同滤波算法
一、什么是协同过滤:人以类聚,物以群分类似于图像处理中使用超像素信息,协同过滤是利用集体智慧的一个典型方法。推荐系统的首要问题是了解你的用户,然后才能给出更好的推荐。概念:协同过滤一般是在海量的用户中发掘出一小部分和你品位(偏好)比较类似的,在协同过滤中,...
2019-06-18 09:50:12
2616
原创 模拟退火算法
爬山算法一种搜索算法,思想类似走山路,从某点开始不断往四周相邻更高的点走去,当走到某点已经是山峰顶,四周没有比当前点更高的点就停下,...
2019-06-15 10:26:50
340
原创 Pareto相关理论
由于最近看到了一篇社交网络中的论文提高了Pareto相关知识,所以整理了下网上关于Pareto相关理论的讲解,供大家参考: 维弗雷多·帕雷托 (Villefredo Pareto) 在1987年提出:社会财富的80%是掌握在20%的人手中,而余下的80%的人只占有20%的财富。渐渐地,这种“关键的少数(vital few)和次要的多数(tr...
2019-06-12 08:57:40
3893
原创 矩母函数 moment
矩生成函数维基百科,自由的百科全书跳到导航跳到搜索动差又被称为矩。随机变数X的动差生成函数或矩母函数(moment-generating function)定义为:前提是这个期望值存在。计算如果X具有连续概率密度函数f(x),则它的动差生成函数由下式给出:其中是第i个矩。是f(x)的双边拉普拉斯变换。不管概率分布是不是连续,动差生成函数都可以用黎曼...
2019-04-27 10:43:54
3884
原创 python学习之数据类型与字符串 元组 列表
1.python中的数据: 整数 浮点数 复数数据之间可以强制转换,整数是浮点数的特殊情况,浮点数是复数的特殊情况不支持将复数转化为浮点数和整数type(x)判断函数类型2.数据类型的计算3.字符串利用\和“来输出含有转义字符的字符串字符串的索引:可以从左 也可以从右(最右侧的字符为-1)多个位置的索引:string[start:end] 但是...
2019-04-25 19:16:47
198
原创 解析解与数值解
在解组件特性相关的方程式时,大多数的时候都要去解偏微分或积分式,才能求得其正确的解。依照求解方法的不同,可以分成以下两类:解析解和数值解。解析解(analytical solution)就是一些严格的公式,给出任意的自变量就可以求出其因变量,也就是问题的解, 他人可以利用这些公式计算各自的问题.所谓的解析解是一种包含分式、三角函数、指数、对数甚至无限级数等基本函数的解的形式。用来求得解...
2019-04-23 11:36:54
3550
原创 node2vec: Scalable Feature Learning for Networks
https://blog.youkuaiyun.com/nemoyy/article/details/81842536
2019-04-21 16:39:33
239
原创 DeepWalk及node2vec
DeepWalkDeepWalk基本思想DeepWalk是最早提出的基于 Word2vec 的节点向量化模型。其主要思路,就是利用构造节点在网络上的随机游走路径,来模仿文本生成的过程,提供一个节点序列,然后用Skip-gram和Hierarchical Softmax模型对随机游走序列中每个局部窗口内的节点对进行概率建模,最大化随机游走序列的似然概率,并使用最终随机梯度下降学习参数。其目...
2019-04-21 16:38:24
2512
原创 拉格朗日函数、对偶上升法、对偶分解法
https://blog.youkuaiyun.com/deepinc/article/details/79341632
2019-04-17 18:51:27
1306
原创 机器学习-凸优化理论-课堂笔记
转载地址: http://blog.youkuaiyun.com/JoyceWYJ/article/details/51580139前言 这节课主要介绍凸优化的入门知识,程博士推荐阅读Boy...
2019-04-12 20:55:42
401
原创 经验风险 期望风险 最优分类器 贝叶斯分类器 经验风险学习的性能 VC维 支持向量机
http://www.tensorinfinity.com/paper_141.html
2019-04-11 16:49:26
309
原创 李宏毅深度强化学习笔记(一)Outline
李宏毅深度强化学习- Outline李宏毅深度强化学习课程评价:强化学习:举例深度学习的特点:强化学习方法Policy-based approach -- learn an actorValue-based approach -- learn a criticActor-Critic李宏...
2019-04-02 16:36:00
591
原创 自组织神经网络 第二部分
版权声明:本文为博主原创文章,欢迎转载分享,请注明本文出自Bin的专栏:http://blog.youkuaiyun.com/xbinworld https://blog.youkuaiyun.com/xbinworld/article/details/50826892 </div> <div id="content_vie...
2019-03-30 10:31:36
322
转载 自组织神经网络 第一部分
版权声明:本文为博主原创文章,欢迎转载分享,请注明本文出自Bin的专栏:http://blog.youkuaiyun.com/xbinworld https://blog.youkuaiyun.com/xbinworld/article/details/50818803 </div> <div id="content_vie...
2019-03-30 10:30:54
475
原创 深度学习之 注意力机制 Attention Model
1、Attention Model 概述 深度学习里的Attention model其实模拟的是人脑的注意力模型,举个例子来说,当我们观赏一幅画时,虽然我们可以看到整幅画的全貌,但是在我们深入仔细地观察时,其实眼睛聚焦的就只有很小的一块,这个时候人的大脑主要关注在这一小块图案上,也就是说这个时候人脑对整幅图的关注并不是均衡的,是有一定的权重区分的。这就是深度学习里的Attention Mod...
2019-03-30 09:01:31
854
原创 置信度传播算法(Belief Propagation)
基础知识 条件概率(Conditional Probability) 相互独立时,p(A | B) = p(A) 贝叶斯规则贝叶斯网络(Bayesian Network)定了一个独立的结构:一个节点的概率仅依赖于它的父节点。贝叶斯网络适用于稀疏模型,即大部分节点之间不存在任何直接的依赖关系。 联合...
2019-03-28 13:15:26
906
原创 网络模型特征
通常我们把互联网看成是一个随机网络(指数网络),尽管网络的连接是随机安置的,但由此形成的网络却是高度民主和指数分布的,即绝大部分节点的连结数目会大致相同或相差不远,很少会出现连接数目比平均数高许多或低许多的节点。网络的无尺度(scale-free)无尺度分布又称幂律分布,是描述结点度规律的分布,即度很大的结点的数量只占一个网络中结点总数一小部分,而度较小的结点的数量却占大多数。这个分布的形...
2019-03-28 12:53:45
692
原创 三元闭包与强弱联系
美国斯坦福大学教授Granovetter的The strength of weak ties论文提出了弱联结理论, 该理论认为:弱联结比强连接更能穿越不同的社会群体,因此能触及更多的人,穿过更大的社会距离。 Granovetter发现多数人是通过私人关系介绍找到现在工作的,值得注意的是,这里的私人关系往往只是熟人(acquaintances),而非亲密朋友(close ...
2019-03-28 12:52:26
2284
原创 北美+德国18名校的数据挖掘、数据分析、人工智能及机器学习课程资源汇总
[+]QuoraWhat is Data Science?How do I become a Data Scientist?How does Data Science differ from traditional statistical analysis?Related CoursesConcepts in Computing ...
2019-03-25 11:34:07
478
原创 数据挖掘英文视频教程集锦
Please Note: UC Berkeley course videos to be taken offline on 15th March 2017. As per website, Beginning March 15, 2017, iTunesU Course Capture content will be removed. You may continue to use/downloa...
2019-03-25 11:31:21
1063
转载 Coursera吴恩达《神经网络与深度学习》1.深度学习概述
What is a neural network?简单来说,深度学习(Deep Learning)就是更复杂的神经网络(Neural Network)。那么,什么是神经网络呢?下面我们将通过一个简单的例子来引入神经网络模型的概念。假如我们要建立房价的预测模型,一共有六个房子。我们已知输入x即每个房子的面积(多少尺或者多少平方米),还知道其对应的输出y即每个房子的价格。根据这些输入输出,我们要建...
2019-03-24 09:46:32
238
原创 深入理解机器学习---从原理到算法 PAC学习模型
1.数学描述2.不可知PAC学习改进X*Y,概率分布空间贝叶斯最优预测器:3.广义损失函数下的不可知PAC学习
2019-03-20 19:32:47
2092
原创 深入理解机器学习---从原理到算法 引言及简易入门
1.为什么需要机器学习?机器学习的分类过于复杂的任务 适应性监督学习和无监督学习 主动学习被动学习 老师的帮助2.一般模型①学习器的输入:领域 标签 训练数据②输出:训练集中的数据如何产生:首先依据概率分布D产生数据,然后利用正确的指示函数给出其标签()假设正确的指示函数存在。衡量成功:3.训练误差4.如何解决ERM下的过拟合情况(在受限的搜索空...
2019-03-20 18:29:54
1121
原创 回溯法和八皇后问题
在国际象棋中,皇后是最强大的一枚棋子,可以吃掉与其在同一行、列和斜线的敌方棋子。比中国象棋里的车强几百倍,比她那没用的老公更是强的飞起(国王只能前后左右斜线走一格)。上图右边高大的棋子即为皇后。 八皇后问题是这样一个问题:将八个皇后摆在一张8*8的国际象棋棋盘上,使每个皇后都无法吃掉别的皇后,一共有多少种摆法?此问题在1848年由棋手马克斯·贝瑟尔提出,岂止是有年头,简直就是有年头,82年...
2019-03-14 15:47:36
530
原创 你真的了解EM算法吗?
众所周知,极大似然估计是一种应用很广泛的参数估计方法。例如我手头有一些东北人的身高的数据,又知道身高的概率模型是高斯分布,那么利用极大化似然函数的方法可以估计出高斯分布的两个参数,均值和方差。这个方法基本上所有概率课本上都会讲,我这就不多说了,不清楚的请百度。 然而现在我面临的是这种情况,我手上的数据是四川人和东北人的身高合集,然而对于其中具体的每一个数据,并没有标定出它来自“东北人”还是“...
2019-03-14 15:32:06
857
原创 泊松分布最强科普
https://en.wikipedia.org/wiki/Poisson_distribution#Probability_of_events_for_a_Poisson_distribution
2019-03-12 20:13:48
625
原创 pyhton学习之面向对象
Python使用类(class)和对象(object),进行面向对象(object-oriented programming,简称OOP)的编程。面向对象的最主要目的是提高程序的重复使用性。我们这么早切入面向对象编程的原因是,Python的整个概念是基于对象的。了解OOP是进一步学习Python的关键。下面是对面向对象的一种理解,基于分类。先定义鸟类class Bird(obje...
2019-03-09 11:13:22
151
原创 pyhton学习之函数
1.函数的定义:抽象的概念2.函数的调用abs cmp(x>y):比较两个数的大小等 int:其他类型的数据转化为整数型等 str():强制转为类字符串等3.函数的编写:参数的输入,return语句例如:4.函数的递归问题递归函数的优点是定义简单,逻辑清晰。理论上,所有的递归函数都可以写成循环的方式,但循环的逻辑不如递归清晰。使用递归函...
2019-03-07 16:43:27
231
原创 python学习之set
dict的作用是建立一组 key 和一组 value 的映射关系,dict的key是不能重复的。有的时候,我们只想要 dict 的 key,不关心 key 对应的 value,目的就是保证这个集合的元素不会重复,这时,set就派上用场了。set 持有一系列元素,这一点和 list 很像,但是set的元素没有重复,而且是无序的,这点和 dict 的 key很像。...
2019-03-07 14:20:59
138
原创 python学习之list和tuple
1.List构造list非常简单,按照上面的代码,直接用[ ]把list的所有元素都括起来,就是一个list对象。通常,我们会把list赋值给一个变量,这样,就可以通过变量来引用list:打印list中的元素:我们可以用 -1 这个索引来表示最后一个元素:类似的,倒数第二用 -2 表示,倒数第三用 -3 表示,倒数第四用 -4 表示。第一个办法是用 list 的...
2019-03-06 20:51:17
153
原创 堆排序与优先队列
1. 预备知识 (1) 基本概念 如图,(二叉)堆是一个数组,它可以被看成一个近似的完全二叉树。树中的每一个结点对应数组中的一个元素。除了最底层外,该树是完全充满的,而且从左向右填充。堆的数组A包括两个属性:A.length给出了数组的长度;A.heap-size表示有多少个堆元素保存在该数组中(因为A中可能只有部分位置存放的是堆的有效元素)。 由于堆的...
2019-01-30 16:41:58
253
原创 从零开始造一个“智障”聊天机器人
要造一个聊天机器人,首先你需要了解一些相关概念——自然语言处理(NLP),它是一门融语言学、计算机科学、数学于一体的科学,研究让电脑“懂”人类语言的方法。当然,它也包含很多分支:文本朗读、语音识别、句法分析、自然语言生成、人机对话、信息检索、信息抽取、文字校对、文本分类、自动文摘、机器翻译、文字蕴含等等等。 看到这里的朋友,千万别被这些吓跑。既然本文叫《从零开始造一个“智障”聊天机器人》那么各...
2019-01-30 15:38:04
1278
8
原创 支持向量机基本原理介绍
上;https://blog.youkuaiyun.com/m0_37622530/article/details/80820908下:https://blog.youkuaiyun.com/m0_37622530/article/details/80933282
2019-01-30 15:18:34
1618
原创 支持向量机SVM
考虑我们最初在“线性回归”中提出的问题,特征是房子的面积x,这里的x是实数,结果y是房子的价格。假设我们从样本点的分布中看到x和y符合3次曲线,那么我们希望使用x的三次多项式来逼近这些样本点。那么首先需要将特征x扩展到三维,然后寻找特征和结果之间的模型。我们将这种特征变换称作特征映射(feature mapping)。映射函数称作,在这个例子中我们希望将得到的特征映射后的特征应用于SVM分...
2019-01-30 14:43:35
157
原创 统计学习方法 李航版本 读书笔记
知识点进程和线程:进程和线程都是一个时间段的描述,是CPU工作时间段的描述,不过是颗粒大小不同.进程就是包换上下文切换的程序执行时间总和 = CPU加载上下文+CPU执行+CPU保存上下文.线程是共享了进程的上下文环境的更为细小的CPU时间段。 判别式模型和生成式模型:判别式模型直接学习决策函数f(X)或条件概率分布P(Y|X)作为预测的模型.往往准确率更高,并且可以简化学习问题.如k近邻...
2019-01-26 18:19:30
674
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人