自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 大数据技术与应用实验报告7

大数据技术与应用实验报告7Saprk基于Hadoop的安装与配置,进行使用内容:Spark shell实现HDFS文件的读入,本地文件的读入,以及WordCount通过spark shell、scala、java的实现Spark的编程模型:三种语言:Scala Java Python1.安装Scala下载地址:http://www.scala-lang.org/downlo...

2019-05-26 21:36:47 1424

原创 大数据技术与应用实验报告6

大数据技术与应用实验报告6Hive数据仓库的搭建和简单的使用HiveQL语句的认知和WordCount的实现安装并配置Hive1.先确保完成hadoop环境配置,下载hive,解压文件。2.安装MySQL:wget -i -c http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpmyum ...

2019-05-26 21:20:46 2107

原创 大数据技术与应用实验报告5

大数据技术与应用实验报告5NoSQL数据库的简单使用(Redis,MongoDB等)安装Redis:1,redis的安装环境需要安装gcc(编译依赖gcc)yuminstall gcc-c++2.安装redis:下载redis压缩文件,上传至centos7中解压缩:tar -zxvf redis-5.0.0.tar.gz3,进入到解压的文件夹进行编译输入ma...

2019-05-26 21:05:21 2121

原创 大数据技术与应用实验报告4

大数据技术与应用实验报告4Hbase的安装、配置以及进行使用环境:Linuxubuntu 16.04jdk-1.8.0_144hadoop-2.8.3hbase-1.2.6在已安装好的Hadoop环境基础上,安装并配置Hbase1.首先,在Linux本地,在目录、/usr/local新建一个hbase目录,用于存放所需文件sudo mkdir hbase2....

2019-05-26 20:49:52 3607

原创 大数据技术与应用实验报告3

大数据技术与应用实验报告3用JAVA写一个WordCount例子,并生成jar包运行于集群上编写MapReduce程序MapReduce1.编程调试WordCount程序2.生成jar包,在虚拟机上运行首先我在Eclipse中新建java项目,项目建成后,src文件时是空的,接下来右键单击src新建包和类,然后就进入Wordcount程序的代码编写阶段,导入jar包...

2019-05-26 20:37:42 2325

原创 大数据技术与应用实验报告2

大数据技术与应用实验报告2HDFS常用shell命令的使用,以及用JAVA API实现HDFS常用shell命令的功能实现上传文件,下载文件实现上传和下载文件的主要的shell命令把本地文件上传到hdfs:hdfs dfs -put anaconda-ks.cfg /aa 把本地文件上传到hdfs:hdfs dfs -copyFromLocal a.t...

2019-05-26 20:37:24 2926

原创 大数据技术与应用实验报告1

大数据技术与应用实验报告1Hadoop的安装配置、运行一个WordCount 例子根据文件里的word文档以及百度的教程进行一下的安装配置(包括后面的实验需要的)1.VMWare Workstation pro安装激活2.使用VMWare Workstation pro安装CentOS 73.安装并配置hadoop4.安装并配置jdk5.安装并配置HBase6.安装...

2019-05-26 20:36:39 9651

原创 大数据应用技术学习日志1

学习内容大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。四大基本特征:1.数据量大2.要求快速响应3.数据多样性4.价值密度低Volume (容量)Variety (种类)Velocity (速度)Variability (可变性)两大核心技术:分布式存储分布式处理关键技术:数据采集数据存储和管理数...

2019-03-08 21:41:59 229

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除