大数据_keepons的博客-优快云博客

大数据

关注

文章平均质量分 69

关注数：文章数：8 文章阅读量：4886 文章收藏量：5

作者: keepons

Maybe I am not good enough,but you still chose me in the end .What can I to do is repay you with my whole life.----Dream

展开

专栏收录文章

docker安装

centos1.在线安装 sudo wget -qo- https://get.docker.com/ |sh 如果是普通用户，再执行一个赋权限操作 sudo usermod -aG docker 用户名

原创 2018-07-09 18:58:11 · 149 阅读 · 0 评论
spark的优势

1、速度快比mapreduce快100倍。 2.使用方便一大推封装好的方法。并且Scala 和java可以都是运行在jvm上 3.强通用性有spark生态圈。 4.强适用性可以运行在yarn等等任务分配框架上...

翻译 2018-07-11 20:29:57 · 1511 阅读 · 0 评论
HBase学习之路（三）HBase集群Shell操作

http://www.cnblogs.com/qingyunzong/p/8671153.html

转载 2018-07-23 21:57:51 · 261 阅读 · 0 评论
sqoop导入导出

1.列出有多少数据库 sqoop list-databases \ –connect jdbc:mysql://192.168.85.3:3306/hadoop \ –username root \ –password Caofeng2012@ 2.简单导入HDFS sqoop import \ –connect jdbc:mysql://192.168.85.3:3306/h...

原创 2018-07-19 21:08:09 · 400 阅读 · 0 评论
hive基础命令实验

环境 centos7 Hadoop2.6.5 hive 1.x 一. 从普通文本加载数据到hive仓库1.使用命令hive 进入hive命令行； 2.创建数据库 create database if not exists hivetest; 3.切换数据库 use hivetest; 4. 创建表 create table if not exists s...

原创 2018-07-14 13:17:38 · 885 阅读 · 0 评论
hive基础知识

内部表：创建表时，默认创建的就是内部表，删除时会删除元数据（数据库中tabs中的表数据）和数据内容（hdfs dfs -ls /user/hive/warehouse/数据库名.db/表名），都会删除掉，所以内部表多用于临时表和中间表外部表：创建时需要一个关键字external，删除时，只删除元数据，不删除数据内容，所以多用于数据源。...

原创 2018-07-14 21:52:58 · 328 阅读 · 0 评论
scala基本语法笔记

1.类型推导定义时可以省略类型，会根据值来推导出类型scala> var str = “hello”str: String = helloscala> var int = 1int: Int = 1定义时也可明确指定类型：scala> var str2:String = “2”str2: String = 21.2.4 函数编程风格 ...

转载 2018-08-16 21:08:04 · 182 阅读 · 0 评论
编写spark WorkCount字数统计代码详解

1.maven配置没有设置default setting ，导致下载依赖包的时候变慢了。以下是设置方式，一劳永逸。 2.scala-maven-plugin作用 The scala-maven-plugin is used for compiling/testing/running/documenting scala code in maven. 常见的组件作用，可以参照https:...

原创 2018-09-13 22:32:11 · 1170 阅读 · 1 评论

大数据

作者: keepons

docker安装

spark的优势

HBase学习之路 （三）HBase集群Shell操作

sqoop导入导出

hive基础命令实验

hive基础知识

scala基本语法笔记

编写spark WorkCount字数统计代码详解

HBase学习之路（三）HBase集群Shell操作