自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

寂空师叔

做一个安安静静的屌丝~

  • 博客(13)
  • 收藏
  • 关注

原创 Spark核心类介绍

Spark核心类介绍SparkContent SparkContext是Spark的入口,负责连接Spark集群,创建RDD,累积量和广播量等。 其中有两个关键调度器会在SparkContext实例化时启动:dagScheduler: DAGSchedulertaskScheduler: TaskSchedulerDAGScheduler DAGScheduler主要属性:eventPr

2015-12-07 17:24:05 765

原创 Spark 学习笔记二开发环境

一、在这里本码奴强烈推荐一款IDE   intellij Idea 官网地址 http://www.jetbrains.com/idea/ 只能用一句话来概括~ 您值得拥有二、 正题1、插件安装下载安装 scala 然后重启 Intellij Idea2、新建一个 scala 项目File -> New Project 可以找到如下图菜单

2015-04-30 14:30:17 446

原创 Spark学习笔记一 环境搭建

一、环境介绍我在这里用的是三台虚拟机master 192.168.1.100slave1 192.168.1.101slave2 192.168.1.102二、程序下载这里已经把程序传到网盘上这,方便大家下载1、hadoop-2.5.22、scala-2.11.63、spark-1.3.1-bin-hadoop2.4三、开始安装1、安装hadoop,安装

2015-04-23 20:44:03 1612

原创 利用Wget 直接将数据Put到HDFS 上

如题:wget http://117.79.226.247:8888/impala/download/1565/xls -O - | hadoop fs -put - /tmp/wget_to_hdfs-O 重命名-O  后面的 - 为重定向到标准输出,(这里就是控制台) -put 后面的 - 标准输入(对应前面的标准输出)这样 就可以是数据不落地直接PUT 到

2015-02-11 18:18:53 2080

原创 Hive Impala Count 效率比对

Hive 主要是跑批处理的,Impala主要是做准实时的内存查询,我拿他俩做比较~~感觉我好没意思阿~~一、count 比较十万数量级Imapal[cdh-node2:21000] > select count(1) from userinfo;Query: select count(1) from userinfo+----------+| count(1) |+----

2015-01-31 18:09:56 1542

原创 Hive SQL 使用笔记

一、建表语句  1、普通建表,指定分隔符  create table user( name string, ips string COMMENT 'IP Address of the User') COMMENT 'This is the user view table' ROW FORMAT DELIMITED FIELDS TERMINATED

2015-01-30 21:02:17 625

原创 Hive 执行sql 报 2015-01-22 17:07:59,263 WARN conf.HiveConf (HiveConf.java:initialize(1507)) - DEPRECAT

在执行Hive的时候报2015-01-22 17:07:59,263 WARN  conf.HiveConf (HiveConf.java:initialize(1507)) - DEPRECATED: Configuration property hive.metastore.local no longer has any effect. Make sure to provide a val

2015-01-30 20:55:00 541

原创 Cloudera Manager 使用笔记---远程访问不了Hue的管理页面

安装好Hue 后 发现 远程访问不了Hue的管理页面,而内网可以,一番周折,发现需要勾选 将 Hue 服务器绑定到通配符地址

2015-01-30 20:51:42 4620

原创 Hive 研发笔记---LEFT JOIN 中的坑

因为日志急速增长,原来放在Mysql上的统计 越来越吃力,所以公司决定把统计业务迁移到Hadoop上。在比对数据的时候,发现了Hive中的一个坑select a.* from default.t_softuser aleft join t_softuser b ona.hid=b.hid and a.corp=b.corp and a.softid=b.softid and a.s

2015-01-29 17:19:56 2483

原创 Cloudera Manager Server 5.0.2 Hadoop 集群搭建笔记

题记:现学现卖、多多交流~~~

2014-11-25 16:04:47 553

原创 java 获取 类的绝对路径

package com.venus.helper;import java.io.File;import java.io.UnsupportedEncodingException;import java.net.URL;/** * Copyright: 版权所有 ( c ) 北京启明星辰信息安全技术有限公司 2013。保留所有权利 * 作者: 郭宁 * 创建时间: 14-8-31

2014-08-31 20:50:27 545

原创 JS将表单序列化成 json

最近项目用到JqGrid。在查询的时候需要把Form表单序列花

2014-08-27 17:16:35 1265

原创 IP 验证,IP转Long,Long转IP

import java.util.regex.Matcher;import java.util.regex.Pattern;/** * Copyright: 版权所有 ( c ) 北京启明星辰信息安全技术有限公司 2013。保留所有权利 * 作者: 郭宁 * 创建时间: 14-8-1 下午上午10:32 * 文件描述: * 修改描述: */public class IpHelp

2014-08-27 16:47:34 607

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除