
模型
文章平均质量分 76
iteye_4814
这个作者很懒,什么都没留下…
展开
-
归纳链表题的另一类解法
经初步研究发现,所有公司的面试中链表是必考的内容,所以找了些题整理了一下。链表的题型虽然千变万化,很难捉摸,但其中还是有一些共性问题的,在这里选几道简单总结一下。 1. 如何找出单链表的中间节点?你可以先遍历一次,数一下结点个数。然后结点个数除以2再数一遍。这样做是可以的,但这样的解法与本文的主题无关。本文是要介绍“两个变量”的解法。1) 定义两个指针fast和s...原创 2011-04-22 22:15:06 · 95 阅读 · 0 评论 -
awk and hadoop之mapper
1. 在awk 中mapper的时候我们经常会合并不同的文件,取我们想要的不同的字段。 awk -F "\t" '{ filename = ENVIRON["mapreduce_map_input_file"]; if (index(filename, "xxxx") > 0) { // xxx } else { //xxxx...原创 2013-08-07 17:19:27 · 168 阅读 · 0 评论 -
awk and hadoop 之reducer
配合上面一篇 mapper篇,这篇主要讲在reducer的时候怎么处理两个文件中的内容,在mapper中我们给每个文件中的内容打了 tag ,在第二个字段,然后就能处理了,只要key一样,就可以弄到一个文件中去。awk -F '\t' '{ id = $1; tag = $2; if (0 == tag){ idPre = $1; }else (1 == t...原创 2013-11-07 15:50:59 · 177 阅读 · 0 评论 -
mahout中LDA简介以及示例
翻译自: https://cwiki.apache.org/confluence/display/MAHOUT/Latent+Dirichlet+Allocation 简介:Latent Dirichlet Allocation (Blei et al, 2003)是一个强大的学习方法将words聚到一些topics里面,以及把一些document表示成topics的一些集合。...原创 2013-11-18 13:07:08 · 243 阅读 · 0 评论 -
simhash
转子:http://blog.sina.com.cn/s/blog_81e6c30b0101cpvu.html原创 2015-12-17 17:57:27 · 112 阅读 · 0 评论