
算法
文章平均质量分 80
taxueguilai1992
这个作者很懒,什么都没留下…
展开
-
BloomFilter原理
一.介绍BloomFilter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法,通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合。二.解释说明我们举个例子,假设我们需要写一个(web crawler),由于网络链接错综复杂,在爬行很可能形成”环”,为了避免这种情况的出现,我们需要知道蜘蛛已经访问过的那些URL,给一个URL,怎样知道是否已经访问过呢,原创 2015-11-11 13:47:03 · 721 阅读 · 0 评论 -
RF随机森林
一.算法介绍随机森林是一种比较新的机器学习模型。他实际上是将决策树组合成随机森林,即在特征(列)和数据(行)的使用上进行随机化,生成很多决策树,再汇总成分类树的结果。 它具有很多优点: 1.由于随机性的引入,使得随机森林具有很好的抗噪声能力 2.能够处理高维度数据,不用做特征选择 3.训练速度快,比较容易实现并行计算 4.训练结束后,能够度量那些特征比较重要二.算法实现具体实现过程如下:原创 2015-08-05 19:50:59 · 1115 阅读 · 0 评论 -
机器学习几种常见模型的介绍
这里我主要介绍以下几种模型:k近邻法朴素贝叶斯法决策树逻辑斯蒂回归支持向量机adaBoost方法K近邻法原理输入:实例的特征向量 输出:实例的类别 算法描述: (1)在训练集中找出与实例最近邻的k个点,涵盖这k个点的邻域记做Nk(x)N_k(x) (2)在Nk(x)N_k(x)中根据分类决策规则决定x的类别优缺点优点:精度高,对异常值不敏感,无数据输入假定 缺点:计算复杂度高原创 2015-08-05 16:03:47 · 6999 阅读 · 0 评论 -
SVD的介绍与原理
一.SVD的介绍SVD,Singular Value Decomposition ,奇异值分解。PCA的实现一般有两种,一种是用特征值分解,一种是用奇异值分解。优点:简化数据,去除噪声,提高算法的结果缺点:数据的转换可能难以理解适用数据类型:数值型数据二.奇异值分解的定义假设MM是一个m∗nm*n的矩阵,如果存在一个分解: Mm∗n=Um∗m∑m∗nVTn∗nM_{m*n}=U_{m*m}原创 2015-08-01 21:12:28 · 9744 阅读 · 0 评论 -
PCA原理以及算法实现
一.算法介绍PCA(Princiapal Component Analysis),主成分分析,是统计数据分析、特征提取和数据压缩的经典方法,起源于Pearson的早期工作。实际上,PCA主要作用就是将一个存在信息冗余的多维空间变成一个无信息冗余的较低维空间,是一种通用的降维方法。举个例子,从一幅数字图像中取出一个8x8的像素窗口,首先通过逐行扫描,变换到向量xx,其元素为64个像素的灰度值,在实时的原创 2015-07-31 18:20:13 · 3339 阅读 · 0 评论 -
4Sum leetCode Java
4Sum-leetCode-Java题目描述Given an array S of n integers, are there elements a, b, c, and d in S such that a + b + c + d = target? Find all unique quadruplets in the array which gives the sum of target.Not原创 2015-05-08 20:11:29 · 638 阅读 · 0 评论