- 博客(443)
- 资源 (38)
- 收藏
- 关注
原创 第七章:druid.io实践分享之Realtime+kafka 二
本节重点介绍在运行过程中,这两个组件会出现什么问题及解决方式 场景如下: 场景1、第一次上线kafka的partition与realtime的个数关系
2016-08-18 10:18:47
8117
原创 第七章:druid.io实践分享之realtime+kafka 一
目前使用druid已经有3年了,在整个国内互联网广告行业了解下来,我们算较早使用的团队。其优势太明显了,就是快,绝大多数的场景都可以在毫秒或秒级响应(特别是数据量足够大的情况下,还能保持良好的速度)。 其二就是提供的功能特别能解决我们业务上的问题。 其三整个系统相对来说还是比较封闭的,减少了不必要的依赖,json的灵活性提供了更好的二次开发的潜力。 其四整体源码风格是函数式,可以使之前面向对象
2016-08-16 13:51:18
11276
转载 kudu master design(kudu主节点设计)
转载:http://blog.youkuaiyun.com/lookqlp/article/details/51355195The Catalog Manager and System TablesCatalog Manager 监听用户创建的kudu表和tablet。所有table和tablet的元数据信息以写入时复制(copy-on-write)的objects形式存储在内存和磁盘里,kudu系统的sys.
2016-07-31 18:40:58
3713
转载 kudu tablet design(kudu表设计)
Tablet是kudu表的水平分区,类似于google Bigtable的tablet,或者HBase的region。每个tablet存储着一定连续range的数据(key),且tablet两两间的range不会重叠。一张表的所有tablet包含了这张表的所有key空间。Tablet由RowSet组成,RowSet由一组rows组成(n条数据、n行数据)。RowSet是不相交的,即不同的RowSet
2016-07-31 17:46:52
9657
原创 spark机器学习 源码解析及原理分析
最近我们组的尹同学将机器学习剖析完成,特分享给大家学习和参考。 https://github.com/endymecy/spark-ml-source-analysis
2016-04-28 11:07:45
3496
原创 druid.io中文版文档
最近我们公司另一个大牛已经在进行druid.io文档的翻译并增加了自己的一些注解,后续翻译还在进行中,如有错误多多反馈。
2015-05-21 16:05:05
10278
6
原创 第四章:druid.io的功能
目前druid.io的版本已经发展到0.7.1了,其功能也在不断的完善中,功能的基本描述及使用在官方文档上面已经有很详细的介绍。
2015-05-15 09:32:44
5698
原创 big data for realtime (druid.io)
最近很久没写blog了,主要是这几个月在带领团队去做一个big data for realtime的项目,因为时间较为紧张。所以等上线后,再分享其内容
2014-03-30 19:41:50
3875
转载 鲜为人知的编程真相(转)
当程序员的经历让我知道了一些关于软件编程的事情。下面的这些事情可能会让朋友们对软件开发感到惊讶: 一个程序员用在写程序上的时间大概占他的工作时间的10-20%,大部分的程序员每天大约能写出10-12行的能进入最终的产品的代码 — —不管他的技术水平有多高。 好的程序员花去90%的时间在思考、研究和实验,来找出最优方案。差的程序员花去90%的时间在调试问题程序、盲目的修改程
2014-03-30 19:39:30
2860
原创 Hbase的使用压缩日志反应的问题
最近hbase的日志量提升到了几百MB,通过日志发现:2013-12-24 11:05:08,307 INFO org.apache.hadoop.io.compress.CodecPool: Got brand-new decompressor2013-12-24 11:05:09,283 INFO org.apache.hadoop.io.compress.CodecPool: Got
2013-12-24 11:42:32
4374
原创 执行HBase的MR程序出现的一个异常
最近在某台机器上面执行MR时,出现了以下这样的异常,信息如下:2013-12-20 16:58:48,745 INFO org.apache.zookeeper.ZooKeeper: Client environment:user.dir=/data3/mapred/local/taskTracker/hadoop/jobcache/job_201311152318_24137/attempt
2013-12-20 18:57:33
4200
原创 hadoop集群job出现一个奇怪的问题
今天集群的job运行出现了一个奇怪的问题,集群监控如下:通过各个节点的执行状态,日志信息如下:2013-12-20 06:38:49,580 [Main Thread] INFO org.apache.hadoop.mapred.Task: Using ResourceCalculatorPlugin : org.apache.hadoop.util.LinuxResourceCal
2013-12-20 18:40:56
3467
原创 hbase的0.94.4版本一个问题
最近在使用过程中,发现了一个问题:就是对某一个rowkey做delete操作后,马上重新插入一条相同的rowkey的值。然后使用get方式操作后无法显示新插入的记录。
2013-12-19 22:04:32
1416
1
原创 hive在实际运行压缩模式中出现的问题
java.io.IOException: IO error in map input file hdfs://master:8020/tmp/hive-hadoop/hive_2013-12-05_14-11-45_842_4285479348256958995/-ext-10033/000267_0.snappy at org.apache.hadoop.mapred.MapTask$Tra
2013-12-05 15:27:38
2754
原创 hadoop任务运行报错记录
org.apache.hadoop.ipc.RemoteException:org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException: No lease on/order_closed_compress/_temporary/_attempt_201311152318_5890_m_000065_0/part-m-0006
2013-11-29 18:17:40
3099
3
原创 发现一个淘宝API中的BUG
最近发现一个淘宝分销API中的一个bug,主要问题是返回xml格式时,获取商品名称错误;返回是json格式时,获取商品名称正常。目前采用xml格式获取返回值,主要是因为某些店铺返回json格式时,一直报错,无法正常给用户提供产品相关信息,而采用xml的格式就正常了。测试的步骤如下:API接口: taobao.fenxiao.products.get系统参数:app_key
2013-11-25 15:28:26
2393
原创 hbase测试压缩效果报告
测试环境:Linux master 2.6.18-348.12.1.el5 #1 SMP Wed Jul 10 05:28:41 EDT 2013 x86_64 x86_64 x86_64 GNU/Linuxhadoop-1.0.3hbase-0.94.2hive-0.9.0Oracle JRockit(R) (build R28.1.5-20-146757-1.6.0_29-
2013-11-20 11:04:53
8772
2
原创 hadoop再次配置lzo
最近又重新进行了一次配置lzo压缩,步骤如下:安装前,必须的工具: lib* glibc* gcc*ant mvn注意:确定gcc版本,之前网上有人说不能使用超过4.4版本的gcc,我在安装过程中使用的gcc4.1.2的版本,也是正常的 操作系统名称:Linux master 2.6.18-194.el5 #1 SMP Tue Mar 16 21:52:39 EDT 2
2013-11-14 11:06:22
3075
原创 hadoop节点出现了一个异常问题
最近集群有个节点出现一个奇怪的问题,就是jps命令可以看到Child进程,但通过top命令却显示不存在。而且在/proc目录下也没有对应的进程目录,如下图:
2013-09-09 11:33:08
1804
原创 补充hive升级常规操作
1、首先是安装包部署(这个不用介绍了,就是环境变量等设置)2、就是shema的升级,运行的sql文件在scripts/metastore/upgrade/mysql/,升级到什么版本就运行对应的sql,这里以0.9升级到0.10为例 用mysql客户端登录mysql, mysql> use hivemeta; mysql> source /home/h
2013-08-15 10:21:17
1184
原创 关于hive升级到0.11的版本问题2
通过网友的帮助,打印加载路径地址,发现果然有个类在其他地方里存在,如下:[hadoop@master ~]$ hivefile:/home/hadoop/hadoop-1.0.3/conf/file:/home/hadoop/jrockit-jdk1.6.0_29/lib/tools.jarfile:/home/hadoop/hadoop-1.0.3/file:/home/ha
2013-08-14 18:27:35
1697
原创 hive升级到0.11的问题
最近发现hive的0.11版本修改很大,其中解决了之前我碰到到一个使CPU100%的BUG(0.9版本是我自己改过的)那么在使用0.11的时候,启动hive命令,出现了下面的错误:13/07/31 10:31:15 WARN conf.HiveConf: DEPRECATED: Configuration property hive.metastore.local no longer
2013-08-06 14:42:14
2406
转载 Unsupported major.minor version 51.0
设置:window-> Preferences->java->Compiler里设置成对应的java版本即可。
2013-05-26 09:41:47
1777
原创 关于时间格式化后出现的问题
最近有个同事问我一个问题,关于时间格式化的。代码如下:public static void main(String[] args) throws ParseException { SimpleDateFormat fors = new SimpleDateFormat("yyyy-MM-dd hh:mm:ss"); String dates = "198
2013-05-21 18:43:04
880
转载 jBPM4.4 eclipse插件安装
一、工具下载 jBPM 图形化流程设计器采用eclipse做为平台,我们可以先到jBPM官方网站下jBPM4.4,地址:http://sourceforge.net/projects/jbpm/files/,下载后的文件为jbpm-4.4.zip,目录结构如下: [attach]271[/attach][attach]271[/attach] 这里面包含有jbpm-gdp-si
2013-05-21 16:25:32
10280
原创 hive开发环境中问题随记
javax.jdo.JDOFatalUserException: There is no available StoreManager of type "rdbms". Please make sure you have specified "datanucleus.storeManagerType" correctly and that all relevant plugins are in t
2013-05-13 18:27:02
2365
原创 关于如何用Zookeeper实现分布式锁机制
之前对zk的应用场景比较好奇,后来发现hive当中已经有使用zk来实现分布式锁的实现。为了更好的理解分布式锁的实现,所以对hive这块的代码进行阅读,提升了对技术实现的理解。hive使用的是ZooKeeperHiveLockManager类来进行处理的。hive锁目前有两个类型,代码如下:public enum HiveLockMode{ SHARED, EXCL
2013-05-13 10:37:29
4557
J2EE Connector Architecture and Enterprise Application Integration
2009-03-22
Pattern-Oriented+Software+Architecture_resource.management3
2009-01-03
SWT.The.Standard.Widget.Toolkit.Volume.1
2008-12-09
Pattern-Oriented+Software+Architecture_resource.management
2008-11-22
Java-Concurrency-in-Practice
2010-02-01
iPhone Open Application Development
2010-01-30
Database Porgramming With Jdbc And Java 2nd Edition
2009-11-07
Java™ Performance and Scalability Volume 1
2009-10-08
Pattern.Oriented.Software.Architecture.Volume.4
2009-09-05
Game.Programming.with.Python.Lua.And.Ruby
2009-08-25
Parsing Techniques - A Practical Guide
2009-08-15
Modern Compiler Implementation in Java Second Edition
2009-08-09
Garbage Collection Algorithms For Automatic Dynamic Memory Management
2009-04-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人