大数据
权飞虎
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Spark搭建及第一个Spark程序
Spark简介spark: 一个基于内存的,分布式的大数据处理框架(计算引擎)官网: http://spark.apache.org/ 中文官网: http://spark.apachecn.org/docs/cn/2.2.0/比较Hadoop中间结果的存储,spark优先使用内存,hadoop 使用磁盘spark的容错性更高。RDD,底层实现不一样 DAG...原创 2018-06-04 20:23:44 · 494 阅读 · 0 评论 -
Hadoop常用API
Hadoop API命令上传文件 hadoop fs -put 文件 hdfs文件夹hadoop fs -put test.txt /files #将test.txt文件上传到hdfs文件夹files下删除文件hadoop fs -rm -r 文件/文件夹hadoop fs -rm -rf /quanfeihu/test.txt查看文件hadoop fs -ls ...原创 2018-06-04 20:26:16 · 5280 阅读 · 0 评论 -
Hadoop 集群搭建
Hadoop环境安装官网:http://hadoop.apache.org/下载地址:http://hadoop.apache.org/releases.html安装步骤:下载安装包(废话)解压(废话)tar -zxvf hadoop-2.8.3.tar.gz -C /usr/local/soft/ #将文件解压到/usr/local/soft下解压完的目录为...原创 2018-06-04 20:27:48 · 239 阅读 · 0 评论
分享