@天道酬勤@-优快云博客

组件版本下载地址JDK1.8https://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.htmlHadoop2.7.1https://archive.apache.org/dist/hadoop/common/hadoop-2.7.1/hadoop-2.7.1.tar.gzZookeeper3.4.5https://archive.apache.org/dist/zookeeper/...

2021-10-20 16:15:35 658

原创 KaFka快速搭建单机版

KaFka快速搭建，配置代理

2021-10-20 15:45:39 524

原创 Linux 离线安装Redis

Linux 离线安装redis库

2021-10-19 17:09:08 570

原创 Flink On yarn

1、下载地址https://archive.apache.org/dist/flink/2、解压flink[root@master ~]#tar -xzvf /chinaskills/flink-1.10.2-bin-scala_2.11.tgz -C /usr/local/src3、重命名[root@master ~]#mv /usr/local/src/flink-1.10.2 /usr/local/src/flink4、配置环境变量(当前用户)[root@master ~]#

2021-10-19 16:17:56 1212

原创 Flink 编程案例(Strandalone 模式)

flink 单机模式编写wordCount;flink web提交任务

2021-10-19 15:02:30 445

原创 idea打jar包

2021-10-19 14:18:29 414

原创 Flink 集群搭建（standalone）

1、下载地址https://archive.apache.org/dist/flink/2、解压flink[root@master ~]#tar -xzvf /chinaskills/flink-1.10.2-bin-scala_2.11.tgz -C /usr/local/src3、重命名[root@master ~]#mv /usr/local/src/flink-1.10.2 /usr/local/src/flink4、配置环境变量(当前用户)[root@master ~]#

2021-10-19 09:47:32 503

原创 hadoop(2.7.7) 完全分布式 + Hive2.3.4

组件版本组件版本下载地址Hadoop2.7.7https://archive.apache.org/dist/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gzJDK1.8https://www.oracle.com/java/technologies/javase/javase-jdk8-downloads.htmlFlink1.10.2https://archive.apache.org/dist/flink/fl

2021-10-19 01:03:45 1425

原创 linux 部署flink standalone

搭建flinkflink standalone模式

2021-10-18 21:05:31 476

原创大数据pom文件集

2021-10-18 18:01:07 360

原创 win10 安装和使用winscp

winscp的安装和使用**下载地址:**https://winscp.net/eng/download.php1、安装步骤2、连接linux

2021-10-18 14:53:25 586

原创 flume 监听端口数据案例

flume 监听本地端口数据

2021-10-13 15:54:09 547

原创 flume安装

flume搭建

2021-10-13 15:29:24 482

原创 Flask_HelloWord

使用pycharm运行flask第一个程序代码:from flask import Flaskapp = Flask(__name__)@app.route("/")def hello_word(): return "<h1>hello word!</h1>"if __name__ == '__main__': app.run()运行结果:访问地址: http://127.0.0.1:5000/...

2021-10-13 11:17:02 185

原创 win10 本地测试Mapreduce任务环境部署

win10 运行Spark程序win10 运行Mapreduce程序

2021-10-10 16:37:37 355

原创 Spark 3.0.3 伪分布式

1、spark 概述Spark是一种基于内存的快速、通用、可扩展的大数据分析计算引擎Spark Core中提供了Spark的最基础的与最核心的功能Spark SQL是Spark用来操作结构化数据的组件Spark Streaming是Spark平台上针对实时数据进行流式计算的APISpark MLib 是Spark提供一个机器学习算法库Spark GraphX 是spark面向图计算提供的框架与算法Spark 3.0默认使用的scala编译版本为2.122、wordcount案例使用

2021-09-02 09:04:38 639

原创 hive基础操作

文章目录Hive第一章 Hive的基本概念1.1 什么是Hive1.2 Hive的由优缺点1.2.1 优点1.2.2 缺点第二章 Hive操作2.1 Hive 常用交互命令2.2 Hive其他命令操作第三章 Hive的数据类型3.1 基本数据类型3.2 集合数据类型查看某个字段的数据访问数组的内容Map的访问struct的访问3.3 Hive数据类型转换1. 隐式类型转换规则如下2. 可以使用cast操作显示进行数据类型转换**3.对cast有一下几点需要说明的：**第四章 DDL数据定义4.1 creat

2021-07-22 17:10:17 466

空空如也

空空如也