
算法
-早起的码农
这个作者很懒,什么都没留下…
展开
-
B树、B-树、B+树、B*树
B树即二叉查找树(二叉排序树 或 二叉搜索树):1.所有非叶子结点至多拥有两个儿子(Left和Right);2.所有结点存储一个关键字;3.非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树;如:B树的搜索,从根结点开始,如果查询的关键字与结点的关键字相等,那么就命中;否则,如果查询关键字比结点关键字小,就进入左儿子;如果比结点关键字大,就进入右儿子转载 2011-11-19 20:51:21 · 1353 阅读 · 0 评论 -
Spark MLlib之协同过滤
Spark MLlib 协同过滤实例原创 2017-03-23 14:16:20 · 1992 阅读 · 0 评论 -
Spark MLlib之线性回归
回归 RegressionMetrics mllib spark原创 2017-03-22 14:12:46 · 2985 阅读 · 1 评论 -
Spark MLlib之KMeans
Spark MLlib之KMeansimport org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark.api.java.function.Function;im原创 2017-03-22 17:46:04 · 1741 阅读 · 1 评论 -
数据挖掘-高等数学常用概念用法总结
1, 对数:如果a的x次方等于N(a>0,且a不等于1),那么数x叫做以a为底N的对数(logarithm),记作x=logaN。其中,a叫做对数的底数,N叫做真数默认以e为底数>>> from math import *>>> log(8,2)3.0>>> log(100,10)2.0>>> log10(100)2.0>>> log(10)2.302585092994046原创 2016-11-29 17:35:03 · 2178 阅读 · 0 评论 -
JAVA矩阵包JAMA学习
jama是一个基本的线性代数java包,它提供了实数非稀疏矩阵类,程序员可构造操控这些类。对于经常使用到矩阵运算的码农来说,即使不精通线性代数也没有关系,因为jama包提供的功能已经够用,调用方便,使用自然,而且易于理解。 JAMA功能汇总Jama.Matrix 对象操作 构造函数 set 方法 set(int i, i原创 2015-07-22 16:59:00 · 8622 阅读 · 1 评论 -
权重随机算法
一个简单的按照权重来随机的实现,权重为几个随机对象(分类)的命中的比例,权重设置越高命中越容易,之和可以不等于100;简单实现代码如下: import java.util.ArrayList;import java.util.List;import java.util.Random;public class WeightRandom { static List categorys =原创 2015-02-15 14:48:17 · 5906 阅读 · 1 评论 -
多边形范围点判定算法
判断一个二维坐标点是否在一个多边形范围框内,首先给出范围框各顶点的坐标(按顺时针方向给出),分别放到两个数组中再比较大小范围从而判定点是否在多边形返回框中 code如下:public class RangePoint { double[] x_points; double[] y_points; public RangePoint(){} public RangePoint(doub原创 2015-02-15 16:15:30 · 3365 阅读 · 2 评论 -
用python和awk实现二分法查找
实现根据ip查找出对应的地区code,对应的查找文本内容格式如下iparea 22165248 22165503 CN6109iparea 22165504 22347775 CN6100iparea 22347776 22413311 CN6101iparea 22413312 22544383 CN6100iparea 22544384 23068671 CN1102iparea 243793原创 2011-08-28 22:32:50 · 3053 阅读 · 2 评论 -
递归实现两个二叉树的比较
废话不说,上代码package com.alan.basic;import com.alan.basic.Tree.Node;/** * 二插树 * * @author alan * */class Tree { Node root; public Tree() { root = null; } pu原创 2012-10-27 11:04:48 · 2252 阅读 · 0 评论 -
Youtube视频推荐算法:从10页论文到4页论文的变迁
所以说豆瓣广播是个好东西,长久以来已经怠于主动关注paper的我,每次都能通过我那些专业敬业的友邻们发现有意思的文章或话题,知识因分享而伟大!而这一次,这篇来自youtube的4页论文[1],最初是通过Chen_1st同学的博客介绍知道的。追溯过去,又找到了Greg Linden的评荐博客。这篇文章很新,以至于我根本找不到免费的全文下载,于是很感谢zibuyu博士帮了一忙,还把youtube在08转载 2012-05-16 23:09:15 · 1665 阅读 · 0 评论 -
关于UserCF和ItemCF的那点事
UserCF和ItemCF是协同过滤中最为古老的两种算法,在top-N的推荐上被广泛应用。这两个算法之所以重要,是因为他们使用了两个不同的推荐系统基本假设。UserCF认为一个人会喜欢和他有相同爱好的人喜欢的东西,而ItemCF认为一个人会喜欢和他以前喜欢的东西相似的东西。这两个假设都有其合理性。根据我的测试,用UserCF和ItemCF做出的推荐列表中,只有50%是一样的,还有50%完全不同。但转载 2012-06-02 13:52:20 · 4958 阅读 · 0 评论 -
机器学习入门-过拟合欠拟合
机器学习最重要的就是模型训练训练结果怎么反馈,一般有三种叫法,欠拟合,拟合,过拟合。下面介绍下白话介绍下具体含义下面三个图分别展示的是欠拟合,合适拟合,过拟合针对线性回归模型:针对逻辑回归模型:解释:1,形象例子欠拟合:光看书不做题觉得自己会了,上了考场啥都不会。过拟合: 课后题全能做对但是理解的不好,好多题答案都是强背下来的,上考场变一点儿人就懵逼差不多的拟合: 做了题,背了老师给画了重点,考试...原创 2018-04-08 16:34:09 · 1408 阅读 · 0 评论