- 博客(33)
- 资源 (1)
- 收藏
- 关注
原创 【理解】递归图
联系作者:humminwang@163.com递归图不是一种经典算法,也不是一种数据结构,但是我们仍然要把他单独拿出来,因为如果掌握这种简单的递归图的画法,我们便很容易分析一下大型的递归问题,不会被其中各种复杂的调用关系,不知所措,所以还是有必要学习一下。递归问题把一个大型复杂的问题层层转化为一个与原问题相似的规模较小的问题来求解。递归要有边界条件递归前进段递归返回段。当边界条件...
2019-12-01 08:46:39
5657
原创 【经典算法】快速排序
联系作者:humminwang@163.com快速排序算法是一种基于交换的高效的排序算法,它采用了分治法的思想:从数列中取出一个数作为基准数(枢轴,pivot)。将数组进行划分(partition),将比基准数大的元素都移至枢轴右边,将小于等于基准数的元素都移至枢轴左边。再对左右的子区间重复第二步的划分操作,直至每个子区间只有一个元素。快速排序的时间复杂度在最坏情况下是O(N2)...
2019-11-29 09:03:24
221
原创 【数据结构】·堆
联系作者:humminwang@163.com堆(heap)堆通常是一个可以被看做一棵树的数组对象。将根节点最大的堆叫做最大堆或大根堆,根节点最小的堆叫做最小堆或小根堆。堆总是满足下列性质:堆中某个节点的值总是不大于或不小于其父节点的值;堆总是一棵完全二叉树。应用:堆排序构建优先队列C++ STL代码:定义方法一://需要调动到#include<queue&...
2019-11-28 09:31:11
189
原创 【数据结构】·优先队列
联系作者:humminwang@163.com优先队列优先队列(priority queue)(priority \ queue)(priority queue)定义:普通的队列是一种先进先出的数据结构,元素在队列尾追加,而从队列头删除。在优先队列中,元素被赋予优先级。当访问元素时,具有最高优先级的元素最先删除。优先队列具有最高级先出(first in,la...
2019-11-26 23:43:50
260
原创 【经典算法】·二分法
二分法对于区间[a,b][a,b][a,b]上连续不断且f(a)⋅f(b)<0f(a)·f(b)<0f(a)⋅f(b)<0的函数y=f(x)y=f(x)y=f(x),通过不断地把函数f(x)f(x)f(x)的零点所在的区间一分为二,使区间的两个端点逐步逼近零点,进而得到零点近似值的方法叫二分法。通俗语言就是将搜索空间不断的减半,从而逼近解的过程。从二分查找来看二分法:...
2019-11-25 23:25:29
17292
原创 如何做数据竞赛·优秀案例学习(DC03)
2019年腾讯广告算法大赛冠军思路、代码(PART 3)方案地址:https://zhuanlan.zhihu.com/p/73062485代码地址:https://github.com/guoday/Tencent2019_Preliminary_Rank1st数据地址:https://algo.qq.com/application/home/home/review.html上一篇文章...
2019-08-31 19:47:12
369
原创 如何做数据竞赛·优秀案例学习(DC02)
2019年腾讯广告算法大赛冠军思路、代码方案地址:https://zhuanlan.zhihu.com/p/73062485代码地址:https://github.com/guoday/Tencent2019_Preliminary_Rank1st数据地址:https://algo.qq.com/application/home/home/review.html上一篇文章我们分析了这个项...
2019-08-28 17:28:59
518
原创 如何做数据竞赛·优秀案例学习(DC01)
2019年腾讯广告算法大赛冠军思路、代码方案地址:https://zhuanlan.zhihu.com/p/73062485代码地址:https://github.com/guoday/Tencent2019_Preliminary_Rank1st数据地址:https://algo.qq.com/application/home/home/review.html官方题目描述:通俗题目...
2019-08-21 09:49:17
866
原创 入门人工智能·机器学习篇·神经网络(AIML08)
文章内容参考《PATTERN RECOGNITION & MACHINE LEARNING》作者:CHRISTOPHER M.BISHOP 文章作者联系邮箱:humminwang@163.comPreview (Chapter 5):前馈神经网络网络训练误差反向传播Hessian矩阵神经网络正则化混合密度神经网络贝叶斯神经网络神经网络为了减少基函数数量问题,从而...
2019-05-31 12:10:34
584
原创 入门人工智能·机器学习篇·概率分布(AIML04)
文章内容参考《PATTERN RECOGNITION & MACHINE LEARNING》作者:CHRISTOPHER M.BISHOP 文章作者联系邮箱:humminwang@163.comPreview (Chapter 2):
2019-03-27 23:39:58
281
原创 统计学习·概率分布汇总
1.1 伯努利分布举例:一次抛硬币结果heads=1,tails=0heads=1,tails=0heads=1,tails=0:p(x=1∣μ)=μp(x=1|\mu)=\mup(x=1∣μ)=μ由此可知抛硬币结果正反面存在一种分布,这种非0即1的单次实验被称为伯努利分布。也称为零一分布、两点分布。伯努利分布:Bern(x∣μ)=μx(1−μ)1−xBern(x|\mu)=\mu...
2019-03-27 23:38:50
819
原创 入门人工智能·机器学习篇·信息论(AIML03)
文章内容参考《PATTERN RECOGNITION &amp;amp; MACHINE LEARNING》作者:CHRISTOPHER M.BISHOP 文章作者联系邮箱:humminwang@163.comPreview (Chapter 1):作者叨叨一下人工智能以例子入门了解机器学习:多项式曲线拟合概率论模型选择高维诅咒←\quad \leftarrow←决策论←\quad \...
2019-03-18 13:44:25
537
原创 入门人工智能·机器学习篇·概率论(AIML02)
文章内容参考《PATTERN RECOGNITION &amp; MACHINE LEARNING》作者:CHRISTOPHER M.BISHOP 文章作者联系邮箱:humminwang@163.comPreview (Chapter 1):作者叨叨一下人工智能以例子入门了解机器学习:多项式曲线拟合概率论←\quad \leftarrow←模型选择←\quad \leftarrow...
2019-03-17 11:57:21
485
原创 入门人工智能·机器学习篇·以例子入门了解机器学习(AIML01)
本文是对《PATTERN RECOGNITION &amp;amp;amp; MACHINE LEARNING》作者:CHRISTOPHER M.BISHOP 大作的简单中文摘录笔记,会从第一章开始简单介绍,将每章做一个简单的知识点总结。联系邮箱:humminwang@163.com...
2019-03-14 22:40:32
321
原创 数据学习(8)·假设检验
作者课堂笔记 humminwang@163.com假设检验(Hypothesis Testing)Y={0,1}Y=\{0,1\}Y={0,1},数据XXX是独立同分布从P(X∣Y=0)P(X|Y=0)P(X∣Y=0)或P(X∣Y=1)P(X|Y=1)P(X∣Y=1)产生。X=(x1,x2,....,xn)∈Xn X=(x_1,x_2,....,x_n)\in X^n X=(x1,...
2019-03-05 10:11:08
293
原创 数据学习(10)·最大期望算法·因子分析模型(下)
作者课堂笔记摘录,有问题请联系 humminwang@163.com1 因子分析(Factor Analysis)内容参考 http://blog.youkuaiyun.com/stdcoutzyx/article/details/37559995高斯混合模型,当训练数据样本数目小于样本维度的时候,因为协方差矩阵的非奇异性,导致不能得到概率密度函数问题,对于其他模型来说,样本数小于样本维度,也容易引...
2019-01-14 13:08:02
674
原创 数据学习(9)·最大期望算法·混合高斯模型(上)
作者课堂笔记摘录,有问题请联系 humminwang@163.comPreview高斯混合模型(Mixture of Gaussians)最大期望算法(EM)因子分析(Factor Analysis)习题训练1 高斯混合(Mixture of Gaussians)什么是高斯混合模型,我们可以简单理解为数据的生成来自不同的高斯分布,如上的鸢尾花...
2019-01-14 13:05:50
624
原创 数据学习(6)·Alternating Conditional Expectations(ACE)算法
作者课堂笔记,联系方式humminwang@163.com
2018-12-16 21:41:53
3249
3
原创 数据学习(5)·K-means 聚类和PCA算法
作者的课堂笔记humminwang@163.comPreviewK-means 聚类主成分分析(Principal Component Analysis)无监督学习和有监督学习类似,但是数据没有标签。给定输入数据,发现简化的特征,同时和输入的特征拥有同样的信息量。一般来说,好的表示一般是低维度的,或者是稀疏表示的,也就是说大部分是0,又或者是独立的表示。...
2018-11-24 10:05:44
3718
2
原创 数据学习(4)·神经网络(上)
作者课堂笔记,需要请联系humminwang@163.comPreview:常见的激活函数万能准则反向传播(BackPropagation)M-P神经元模型:(名字来源是一个叫McCulloch和Pitts大佬提出的)1 常见的激活函数Sigmoid(阐述)Tanh(阐述)ReLu(阐述)Leaky ReLu(阐述)函数绘图代码(python)...
2018-11-17 20:45:32
996
原创 数据学习(3)·生成学习算法
作者课堂笔记整理,humminwang@163.comPreview判别和生成模型高斯判别分析朴素贝叶斯两种学习方法分类输入的数据x,成两个类别y∈{0,1}y\in\{0,1\}y∈{0,1}判别学习算法该算法学习条件概率p(y∣x)p(y|x)p(y∣x)或者直接学习函数映射。举例:线性回归,Logistic回归,K近邻…生成学习算法该学习算法学习联合概率p(x...
2018-11-10 22:55:14
920
原创 数据学习(1)·线性回归和Logistic回归
本系列是作者上课时记录的笔记整理,同时有对应的作业习题,自学的同学参考博客同步即可。邮箱联系humminwang@163.comPreview:监督学习(第一部分)线性回归Logistic回归Softmax回归编程作业Review:监督学习:输入χ\chiχ,目标ψ\psiψ,通过给出训练样本,我们希望学习到一个假设函数h:χ→ψh:\chi\rightarrow\ps...
2018-11-08 13:09:16
378
原创 线性模型(贰)
正则化(Regulization)当出现θ^=(XTX)−1XTY\hat\theta=(X^TX)^{-1}X^TYθ^=(XTX)−1XTY,其中(XTX)(X^TX)(XTX)是奇异矩阵的时候,怎么处理?所以引出了正则化的概念。X=[1x1(1)...xn(1)1x1(2)...xn(2)............1x1(N)...xn(N)]=[x(1)Tx(2)T...x(N)T]X...
2018-10-29 17:08:08
197
原创 支持向量机学习(一)·统计学习方法
支持向量机1 线性可分支持向量机线性可分支持向量机和线性支持向量机假设输入空间与特征空间为一一对应关系,并将输入空间中的输入映射为特征空间中的特征向量。非线性支持向量机利用一个从输入空间到特征空间的非线性映射将输入映射为特征向量,所以输入都是由输入空间到特征空间,支持向量机的学习是在特征空间进行的。假设数据集T={(x1,y1),.....,(xN,yN)},xi∈χ=Rn,yi∈ψ={+1...
2018-10-24 23:05:01
347
原创 经典的机器学习模型(叁)
1 CART(Classification and Regression Tree)决策树的本质就是将空间分为若干个区域,对空间向量的垂直分割。给定训练数据D={(x(1),y(1)),(x(2),y(2))...(x(n),y(n))}D=\{ (x^{(1)},y^{(1)}),(x^{(2)},y^{(2)})...(x^{(n)},y^{(n)})\}D={(x(1),y(1)),(x...
2018-10-04 15:52:29
304
原创 经典的机器学习模型(贰)
决策树ID3 算法的核心问题是选取在树的每个结点要测试的属性。我们希望选择的是最有 助于分类实例的属性。那么衡量属性价值的一个好的定量标准是什么呢?这里将定义一 个统计属性,称为“信息增益(information gain)”,用来衡量给定的属性区分训练样例 的能力。ID3 算法在增长树的每一步使用这个信息增益标准从候选属性中选择属性。熵(Entropy)所有可能结果的信息量的总和组成熵。信...
2018-09-26 10:13:59
1391
原创 经典的机器学习模型(壹)
1 K近邻算法K-Nearest Neighbor (k-NN)KNN是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别,其中K通常是不大于20的整数。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。...
2018-09-22 23:33:37
1123
原创 机器学习的数学基础(叁)
1 最小二乘法(Least Square Fitting)最小二乘法则是一种统计学习优化技术,它的目标是最小化误差平方之和来作为目标,从而找到最优模型,这个模型可以拟合(fit)观察数据。回归学习最常用的损失函数是平方损失函数,在此情况下,回归问题可以用著名的最小二乘法来解决。最小二乘法就是曲线拟合的一种解决方法。来自https://blog.youkuaiyun.com/iterate7/artic...
2018-09-21 18:28:07
211
原创 知识随手记(壹)
1 随机图(Random Graph)随机图实际上是将给定的顶点之间随机地连上边,边的产生可以依赖于不同的随机方式,这样就产生了不同的随机图模型。随着边概率的不同,随机图可能会呈现不同的属性。from random import randrangen = 100G = [[randrange(2) for _ in range(n)] for _ in range(n)] ...
2018-09-19 15:06:36
217
原创 机器学习的数学基础(贰)
概率与统计(Probability and Statistics)1 概率1.1 条件概率(Conditional Probability)P(A∣B)=P(A∩B)P(B)P(A|B)= \frac {P(A\cap B )}{P(B)}P(A∣B)=P(B)P(A∩B)A在另外一个事件B已经发生条件下的发生概率。例题:老王有两个孩子,亲生的!A:他告诉有一个是男孩子,求另一...
2018-09-19 11:13:24
1197
原创 机器学习的数学基础(壹)
1 范数(norm)它常常被用来度量某个向量空间(或矩阵)中的每个向量的长度或大小。1.1常见的范数0-范数 有多少个非零的数1-范数(曼哈顿距离) ║x║1 =│x1│+│x2│+…+│xn│2-范数 (欧几里得距离) $x^2+2$∞-范数...
2018-09-17 21:53:27
358
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人