
算法
rolin-刘瑞
技术GEEK
展开
-
统计学概念基础---数学期望,方差,标准差,协方差
1.基本概念数学期望就是平均值:均值公式:标准差:方差:均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均。2.协方差二、为什么需要协方差标准差和方差一般是用来描述一维数据的,但现实生活中我们常常会遇到含有多维数据的数据集,最简单的是大家上学时免不了要统计多个学科的考试成绩原创 2014-12-12 17:04:47 · 20082 阅读 · 0 评论 -
皮尔逊相关度系数原理,以及java实现
皮尔森相关度算法解释以及实现原创 2014-12-12 16:53:47 · 12266 阅读 · 0 评论 -
算法模型大全
隐马尔可夫模型(HMM)http://baike.baidu.com/link?url=_NiQW91Kkdmyla_lyX1C78NVIXnzELO2l4Sr9e6FstHcss6ssmawwwZHXR7MZ_CP8ofgVTBQe-pOhmqZFx2qHKGMM(Gaussian Mixture Model)- 高斯混合模型http://baike.baidu.com/link?url=4zzM原创 2016-04-12 16:52:32 · 9206 阅读 · 0 评论 -
如何对一个算法进行复杂度分析
算法复杂度是在《数据结构》这门课程的第一章里出现的,因为它稍微涉及到一些数学问题,所以很多同学感觉很难,加上这个概念也不是那么具体,更让许多同学复习起来无从下手,下面我们就这个问题给各位考生进行分析。首先了解一下几个概念。一个是时间复杂度,一个是渐近时间复杂度。前者是某个算法的时间耗费,它是该算法所求解问题规模n的函数,而后者是指当问题规模趋向无穷大时,该算法时间复杂度的数量级。转载 2017-06-27 12:05:23 · 7425 阅读 · 0 评论 -
常见的join算法
大表的Join在OLTP/OLAP领域很常见。对于使用SQL的用户,不需关心底层数据的存储格式、join的处理算法。 CBO(cost based optimizor)会根据join table的统计信息,选择Join算法、多表Join还有顺序问题。例如join顺序的选择就很讲究,pgsql的优化器就就采用了动态规划、遗传算法、启发式搜索等比较复杂的技术。对CBO部分,本文不做转载 2018-04-16 18:07:15 · 8150 阅读 · 0 评论 -
图解排序算法(四)之归并排序
基本思想 归并排序(MERGE-SORT)是利用归并的思想实现的排序方法,该算法采用经典的分治(divide-and-conquer)策略(分治法将问题分(divide)成一些小的问题然后递归求解,而治(conquer)的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之)。分而治之 可以看到这种结构很像一棵完全二叉树,本文的归并排序我们采用递归去实现(也可采用迭代的方式去实现)。分阶段...转载 2018-05-10 20:58:00 · 6222 阅读 · 0 评论 -
神奇的HyperLogLog算法
基数计数基本概念基数计数(cardinality counting)通常用来统计一个集合中不重复的元素个数,例如统计某个网站的UV,或者用户搜索网站的关键词数量。数据分析、网络监控及数据库优化等领域都会涉及到基数计数的需求。 要实现基数计数,最简单的做法是记录集合中所有不重复的元素集合S_uSu,当新来一个元素x_ixi,若S_uSu中不包含元素x_ixi,则将x_ix...转载 2018-08-29 12:24:23 · 7715 阅读 · 0 评论