
Java 编程
文章平均质量分 56
RicDong
这个作者很懒,什么都没留下…
展开
-
[HDFS] Hadoop Over Ftp 项目的两点改进
[b]General[/b]We developed FTP server which works on a top of HDFS. It allows to connect to HDFS using any FTP client.FTP server is configurable by hdfs-over-ftp.conf and users.conf. Also it all...2009-05-26 17:25:54 · 185 阅读 · 0 评论 -
关于MapReduce解析XML算法的一点构思
没想到Hadoop在解析XML时如此纠结,以至于新版api的mapreduce竟然放弃了XML格式的format以及reader,在老版(hadoop-0.19.*)的streaming模块提供了这样的api,由于我用的hadoop-0.20.23U1版本,因此需要把处理XML的几个类移植过来使用。 移植所带来的问题是各处依赖包,和各种api不兼容。没关系,我可以看一下源码,然后...原创 2011-12-18 10:39:44 · 210 阅读 · 0 评论 -
FTP主动模式与FTP被动模式所需的端口
FTP是仅基于TCP的服务,不支持UDP。 与众不同的是FTP使用2个端口,一个数据端口和一个命令端口(也可叫做控制端口)。通常来说这两个端口是21(命令端口)和20(数据端口)。但FTP工作方式的不同,数据端口并不总是20。这就是主动与被动FTP的最大不同之处。(一)主动FTP主动方式的FTP是这样的:客户端从一个任意的非特权端口N(N>1024)连接到FTP服务器的命令端口,也...原创 2011-06-20 10:43:49 · 444 阅读 · 0 评论 -
TCP-TIME_WAIT
[size=small]近来网站随着访问量的增加,服务器的压力也随之上升,一个很明显的状况便是服务端产生了大量的TIME_WAIT状态,它究竟是什么、对系统有何影响、为什么很多人对它如此敏感?Google一下TIME_WAIT会有成千上万的文章,但总是别人的,今天自己整理一下对TIME_WAIT的认识。[/size][size=small][b]TCP连接的终止[/b]TCP建立一...原创 2011-08-17 17:43:30 · 204 阅读 · 0 评论 -
Hadoop 坑爹的Be Replicated to 0 nodes, instead of 1 异常
[i][size=medium]有段时间不写博客了,感觉自己懒惰了不少,当然也是不够努力。近一年的时间一直在开发Hadoop基础应用。[/size][/i] 新的项目上线之后发现,有些会员上传资源到我们集群的速度,既然跟我们集群的吞吐量差不多,达到了70M+/s的速度。 在向集群put数据时,抛出了异常:[code="java"]org.apache.hadoop.ipc.RemoteE...原创 2011-05-11 11:57:12 · 339 阅读 · 0 评论 -
Hadoop 客户端长期运行造成Datanode 连接泄露, 0.21.0 仍然存在这问题
上篇文章中说到我在Hadoop的50070的web页面增加了每个node的xceiver count,这个问题也是通过这个指标发现的。由于我的客户端从始至终都是一个Filesystem实例,因此在put完文件时java实例并不会销毁,客户端在运行较长时间后,发现每个Node的xceiver count值很高,当初以为是节点读写量比较大,但通过stack分析来看,却是写的线程比较多,难道又是...2010-09-09 17:29:06 · 175 阅读 · 0 评论 -
影响Hadoop集群稳定性后续
由于目前处理的数据量还未称的上大规模,但每个节点的压力都不小,真是稳定压倒一切呀。在系统的作业过程中,不仅仅是关注磁盘使用量,CPU,Load,以及IOWait等指标,更重要的是深入到进程内部,来发现潜在的问题。近期一直在关注Hadoop系统的运行,我把dfshealth.jsp 的web管理页面加了一个新的指标,就是每个Node的Xceiver Count,该参数表示当前Node有多少线...2010-09-09 17:27:22 · 221 阅读 · 0 评论 -
Hadoop-0.21.0今天3:20AM正式发布到Apache
可以说等待这个版本花儿都谢过两次了, 很开心今天早上收到来自Nabble, Tom White发布0.21.0 Hadoop的邮件。这个版本一共记录了超过1300个issues, 有improvements, new features, bug fixes and optimizations,下载地址:[url]http://hadoop.apache.org/common/release...原创 2010-08-25 05:53:54 · 119 阅读 · 0 评论 -
Plans for a 0.21 Hadoop Release
相信大家对Hadoop 0.21 的版本已经期待以久了吧,确实该版本在各个模块都有比较大的变化,单JIRA中的关于该版本的issues已经多达1000多。 至于0.21版本的变化大伙可以在releae中查看Changes Log,目前Tom White正在做RC版,可以在[url]http://people.apache.org/~tomwhite/hadoop-0.21.0-cand...原创 2010-08-22 20:49:09 · 123 阅读 · 0 评论 -
一个记录近某段时间内流量的小程序
在应用程序中, 有时并不希望只是为了存储某些数据而引入数据库这个大载体, 在文件下载服务器中, 可以用一个 List记录某IP, 或者某用户在最近一段时间内所读取的流量.新建一个用于存放流量的列表:[code="java"]/** A list for storing recently past 30 minutes reads */ static final List LIN...原创 2010-02-08 10:43:43 · 141 阅读 · 0 评论 -
线程安全性-volatile
[b]引[/b]今晚读了新同事关于P2P做种的Java 代码,Code风格很漂亮,但仔细多看几眼,就会出现瑕疵。其中有一点关于线程的安全性,还是觉得有必要拿出来说说。代码的意图是利用一个标识性Boolean变量来控制一个线程的开启(Service)与结束(Shutdown)。A类:[code="java"]private Boolean isStarted = false;...原创 2010-05-09 20:01:06 · 109 阅读 · 0 评论 -
理解Load Average做好压力测试
SIP的第四期结束了,因为控制策略的丰富,早先的的压力测试结果已经无法反映在高并发和高压力下SIP的运行状况,因此需要重新作压力测试。跟在测试人员后面做了快一周的压力测试,压力测试的报告也正式出炉,本来也就算是告一段落,但第二天测试人员说要修改报告,由于这次作压力测试的同学是第一次作,有一个指标没有注意,因此需要修改几个测试结果。那个没有注意的指标就是load average,他和我一样开始只是注...2010-04-16 14:06:47 · 222 阅读 · 0 评论 -
Hadoop-0.21 版本, NEW FEATURES-Append设计文档.
关于Hadoop的Append功能相信有很多人都会觉得非常有用, 自从0.18.3版本支持Append, Hadoop在此功能上付出了剧痛的代价, 后来版本中, Hadoop干脆加了fs.append.support选项来禁止Append功能的使用. 当时Append功能的bug主要有下面几个 [code="java"] * HDFS-142 “Datanode should...2010-04-14 09:44:55 · 126 阅读 · 0 评论 -
Java nio的一个严重BUG
这个BUG会在linux上导致cpu 100%,使得nio server/client不可用,具体的详情可以看这里http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6403933。令人失望的是这个BUG直到jdk 6u4才解决,sun的拖沓让人难以相信。这个BUG在server端容易出现,因为server端有频繁地接入断开连接。 ...2010-04-11 16:06:36 · 174 阅读 · 0 评论 -
New language features in Java 7
Here are 7 of the new features that have been completed:• Language support for collections• Automatic Resource Management• Improved Type Inference for Generic Instance Creation (diamond)• Unde...2010-04-01 12:33:58 · 112 阅读 · 0 评论 -
[JVM-翻译]揭开java.lang.OutOfMemoryError面纱之一
[b]Java.lang.OutOfMemoryError是什么[/b]Java.lang.OutOfMemory是java.lang.VirtualMachineError的一个子类,当Java虚拟机中断,或是超出可用资源时抛出。很明显,OutOfMemory是在Java虚拟机资源耗尽的情况下无法分配对象时抛出的。不过很不幸,Java的说明文档并没有对该异常进行进一步的阐述。 Jav...2010-03-23 18:10:03 · 323 阅读 · 0 评论 -
[JVM]-OutOfMemoryError: unable to create new native thread
近来在系统的运行过程中碰到了一位老朋友,它正是大家所熟悉的OutOfMemory*,不过跟以前那位不太一样,它托着一个Error的尾巴,另外则是系统在抛出该例外时,并没有退出JVM实例。那么这位改头换面的朋友究竟是何许人也,Google了一下居然也有一大片的介绍,甚至有些Blog已经探索到JVM寻址技术。这里赞一下,很好很强大,但如同我老大所说,精确到这层面,那么我们所能做的优化工作还剩多...2010-03-17 14:40:04 · 124 阅读 · 0 评论 -
Hadoop源码分析-HDFS
经过近66个工作日的时间,终于搞定了HDFS系统,在我们的项目中,称为Fordim0.1。为了能够让更多的朋友认识Hadoop在此附上一Google’s Solution --> Open Source Word’s Solution : Google File System – Hadoop Distributed FS Map-Reduce – Hadoop Map-Red...2010-03-11 20:46:29 · 108 阅读 · 0 评论 -
LSM-Tree
Google的BigTable架构在分布式结构化存储方面大名鼎鼎,其中的MergeDump模型在读写之间找到了一个较好的平衡点,很好的解决了web scale数据的读写问题。MergeDump的理论基础是LSM-Tree (Log-Structured Merge-Tree), LSM思想非常朴素,就是将对数据的更改hold在内存中,达到指定的threadhold后将该批更改批量写入到磁盘,在...原创 2012-07-16 10:43:18 · 173 阅读 · 0 评论