- 博客(36)
- 收藏
- 关注
原创 Java 线程池的原理与实现
转自:http://hi.baidu.com/obullxl/blog/item/ee50ad1ba8e8ff1f8718bf66.html [size=large]最近在学习线程池、内存控制等关于提高程序运行性能方面的编程技术,在网上看到有一哥们写得不错,故和大家一起分享。[分享]Java 线程池的原理与实现这几天主要是狂看源程序,在弥补了一些以前知识空白的同时,也学...
2014-04-22 17:20:54
150
原创 10种排序算法总结
[color=red]转自:http://m.blog.youkuaiyun.com/blog/keda8997110/8677533[/color]排序算法有很多,所以在特定情景中使用哪一种算法很重要。为了选择合适的算法,可以按照建议的顺序考虑以下标准: (1)执行时间 (2)存储空间 (3)编程工作 对于数据量较小的情形,(1)(2)差别不大,主要考虑(3);而对于数据量...
2014-04-09 11:34:43
306
原创 归并排序的JAVA实现
http://www.blogjava.net/zhengzhili/archive/2008/06/13/207531.html
2014-04-09 11:33:29
137
原创 http://m.blog.youkuaiyun.com/blog/keda8997110
http://m.blog.youkuaiyun.com/blog/keda8997110
2014-04-08 18:40:00
389
原创 java的8大排序
转载:http://blog.youkuaiyun.com/jzhf2012/article/details/84666101, 直接插入排序 (1)基本思想:在要排序的一组数中,假设前面(n-1)[n>=2] 个数已经是排好顺序的,现在要把第n个数插到前面的有序数中,使得这n个数也是排好顺序的。如此反复循环,直到全部排好顺序。 package com.test; publ...
2014-03-26 17:09:48
121
原创 海量数据处理
http://blog.youkuaiyun.com/v_july_v/article/details/7382693http://blog.youkuaiyun.com/v_july_v/article/details/6637014http://blog.youkuaiyun.com/kingjinzi_2008/article/details/7683551求tophttp://blog.csdn....
2014-03-26 16:00:48
120
原创 JAVA好文章链接
http://www.cnblogs.com/redcreen/tag/jvm/http://blog.youkuaiyun.com/zhaomirong/article/details/7826525http://www.cnblogs.com/redcreen/archive/2011/05/09/2040977.htmlhttp://www.blogjava.net/zhangw...
2014-03-11 15:40:52
158
原创 GC工作机制
转载http://blog.sina.com.cn/s/blog_6ac6f6040100xxpb.htmlSUN的jvm内存池被划分为以下几个部分:Eden Space (heap)内存最初从这个线程池分配给大部分对象。Survivor Space (heap)用于保存在eden space内存池中经过垃圾回收后没有被回收的对象。Tenured Generatio...
2014-03-09 19:08:55
142
原创 好文章链接收藏
http://blog.sina.com.cn/s/blog_502c8cc40100o3dn.htmlhttp://www.importnew.com/4736.htmlhttp://www.idouba.net/hadoop_job_submit_service_init/http://blog.youkuaiyun.com/xhh198781/article/details/70...
2014-03-06 10:44:35
181
原创 CentOS 常用命令及快捷键整理
转载:http://blog.youkuaiyun.com/lilong_dream/article/details/17081067[size=medium][/size]常用命令:文件和目录:# cd /home 进入 '/home' 目录# cd .. 返回上一级目...
2014-02-27 13:23:30
647
原创 sqoop导入数据至hive
[size=large]转载:http://lookqlp.iteye.com/blog/1666449文章的链接:http://blog.youkuaiyun.com/maixia24/article/details/9266295使用sqoop导入数据至hive常用语句 直接导入hive表 sqoop import --connect jdbc:p...
2014-02-25 16:45:00
278
原创 Hive优化总结
转载:http://sznmail.iteye.com/blog/1499789长期观察hadoop处理数据的过程,有几个显著的特征:1.不怕数据多,就怕数据倾斜。2.对jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,没半小时是跑不完的。map reduce作业初始化的时间是比较长的。3.对sum,count来说,不...
2014-02-24 19:37:41
130
原创 Hive SQL解析/执行计划生成流程分析
转载:http://blog.youkuaiyun.com/wf1982/article/details/9122543Hive SQL解析/执行计划生成流程分析近在研究Impala,还是先回顾下Hive的SQL执行流程吧。Hive有三种用户接口:cli (Command line interface) bin/hive或bin/hive –service cli 命令...
2014-02-24 19:36:16
507
原创 Hive中小表与大表关联(join)的性能分析
转载:http://blog.sina.com.cn/s/blog_6ff05a2c01016j7n.html经常看到一些Hive优化的建议中说当小表与大表做关联时,把小表写在前面,这样可以使Hive的关联速度更快,提到的原因都是说因为小表可以先放到内存中,然后大表的每条记录再去内存中检测,最终完成关联查询。这样的原因看似合理,但是仔细推敲,又站不住脚跟。多小的表算小表?如果所谓的...
2014-02-24 19:35:28
161
原创 java 集合ArrayList及LinkList源码分析
转:http://www.cnblogs.com/javait03/archive/2011/10/22/2403826.html首先是ArrayList的继承体系,代码如下:Java代码 public class ArrayList extends AbstractList implements List, RandomAccess, Cl...
2014-02-24 19:02:02
132
原创 Java的HashCode,Equal和==
转自:1:http://zhaoxudonglove.iteye.com/blog/2571862:http://cangzhitao.com/java/equals-hashcode.html我们都知道Java语言是完全面向对象的,在java中,所有的对象都是继承于Object类。Ojbect类中有两个方法equals、hashCode,这两个方法都是用来比较两个对象...
2014-02-24 18:59:51
139
原创 Hadoop中的各种排序
转载:http://blog.youkuaiyun.com/kingjinzi_2008/article/details/77381881:shuffle阶段的排序(部分排序)shuffle阶段的排序可以理解成两部分,一个是对spill进行分区时,由于一个分区包含多个key值,所以要对分区内的按照key进行排序,即key值相同的一串存放在一起,这样一个partition内按照key值整...
2014-02-21 19:26:00
127
原创 Hadoop MapReduce高级编程
转载:http://www.cnblogs.com/end/archive/2013/01/18/2866824.html第一部分:重要的组件Combiner•什么是Combiner•combine函数把一个map函数产生的对(多个key, value)合并成一个新的. 将新的作为输入到reduce函数中,其格式与reduce函数相同。•这样可以有效的较少中间结...
2014-02-21 19:18:17
115
原创 Hadoop技术原理总结
转载自:http://www.360doc.com/content/14/0107/20/15109633_343416433.shtml1、Hadoop运行原理 Hadoop是一个开源的可运行于大规模集群上的分布式并行编程框架,其最核心的设计包括:MapReduce和HDFS。基于 Hadoop,你可以轻松地编写可处理海量数据的分布式并行程序,并将其运行于由成百上千个结...
2014-02-21 19:12:22
165
原创 Hadoop : MapReduce中的Shuffle和Sort分析
[size=large][size=xx-small][/size]转载自:http://cache.baidu.com/c?m=9f65cb4a8c8507ed4fece763104c90354501de2b3fdcda107cd6924a84642c1a0131a8ec302267558e9a61375ff21c41e9f7357731012ba3de95c81cd2facf68699f274...
2014-02-21 14:47:25
131
算法链接
http://www.cnblogs.com/hexiaochun/category/411706.htmlhttp://www.csdn123.com/html/blogs/20131103/92638.htmhttp://blog.youkuaiyun.com/matrixdwy/article/details/3102868http://www.360doc.com/...
2014-02-18 19:11:28
138
原创 java实现快速排序
转载:http://158067568.iteye.com/blog/914049快排是分治法的一个应用,快排主要是通过一个设定枢轴,然后以这个枢轴为标杆,将待排序列按大小分成比枢轴大的,和比枢轴小的两部分。然后在对划分完的子序列进行快排,知道子序列中元素的个数为1位置。快速排序实现快排是程序员必须掌握的,举一个例子来解释,如下图:首先选定枢轴,一般设置low所对应...
2014-02-14 18:38:03
120
原创 时间复杂度和空间复杂度详解
[size=medium]转http://blog.youkuaiyun.com/booirror/article/details/7707551算法的时间复杂度和空间复杂度合称为算法的复杂度。1.时间复杂度(1)时间频度 一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。但我们不可能也没有必要对每个算法都上机测试,只需知道哪个算法花费的时间多,哪个算法花费的...
2014-02-13 17:38:08
120
原创 Map/Reduce hadoop 细节
[size=large][size=large][/size]转自:Venus神庙原文:http://www.cnblogs.com/duguguiyu/archive/2009/02/28/1400278.html分布式计算(Map/Reduce)分布式式计算,同样是一个宽泛的概念,在这里,它狭义的指代,按Google Map/Reduce框架所设计的分布式框架。在Hadoop中...
2014-02-13 14:15:26
131
原创 归并排序的JAVA实现
归并排序归并排序是另一类不同的排序方法,所谓归并,就是把两个或者两个以上的有序表合并成一个新的有序表的过程。归并排序的基本思想:将一个含有n个序列的有序表看成是n个长度为1的有序表,然后两两归并,得到[n/2]个长度为2的有序表,然后再两两归并,直到得到一个长度为n的有序表为止。 下面是归并排序的一个简单的例子:初始值 【49】 【38】 【65】 ...
2014-01-26 16:10:51
128
原创 java面试中常用的排序算法
转载自:http://blog.youkuaiyun.com/spy19881201/archive/2010/09/07/5867721.aspx 一、冒泡排序 view plaincopy to clipboardprint?package sort.bubble; import java.util.Random; /** ...
2014-01-26 16:09:04
136
原创 java面试算法
1.写一个方法,用一个for循环打印九九乘法表 Java codepublic void nineNineMulitTable(){ for (int i = 1,j = 1; j endIndex){ return -1; } while(beginIndex
2014-01-26 16:08:26
140
原创 java二叉树1
树是有穷节点的组,其中有一个节点作为根,根下面的其余节点以层次化方式组织。引用其下节点的节点是父节点,类似,由上层节点引用的节点是孩子节点。没有孩子的节点是叶子节点。一个节点可能同时是父节点和子节点。一个父节点可以引用所需的多个孩子节点。在很多情况下,父节点至多只能引用两个孩子节点,基于这种节点的树称为二叉树。图13给出了一棵以字母表顺序存储了七个String单词的二叉树。在二叉树或其他类...
2014-01-26 16:06:14
123
原创 java二叉树
[java] view plaincopyprint?package com.utils; import java.util.Iterator; import java.util.NoSuchElementException; /** * 平衡二叉树 * 定义:首先它是一种特殊的二叉排序树,其次它的左子树和右子树都是平衡二叉树, * 且左子树和右子树的深度之...
2014-01-26 16:05:17
145
原创 hadoop mapreduce作业流程概论
http://www.cnblogs.com/ggjucheng/archive/2012/04/22/2465782.html
2014-01-23 18:13:46
95
原创 收藏好的链接
http://huashuizhuhui.iteye.com/http://blog.yidooo.net/http://blog.pureisle.net/archives/1845.htmlhttp://blog.youkuaiyun.com/huoyunshen88/article/details/8611629http://m.blog.youkuaiyun.com/blog/keda8997...
2014-01-22 15:02:43
195
原创 Hadoop Metrics1(转自:http://yangyoupeng-cn-fujitsu-com.iteye.com/)
Hadoop Metrics Hadoop内部包含一套对外开放的各种metrics接口支持。每一个hadoop的守护进程都可以被配置定期去收集其自身内部组件的数据信息,然后可以通过调用某些插件来处理这一批metrics。目前已经有很多与hadoop配套的插件,这些插件可以应用在一般的部署场景。相互联系的一部分metrics划归为context(上下文),每一个context都是可以被独立对待。...
2013-08-29 17:25:10
155
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅