- 博客(18)
- 收藏
- 关注
原创 Kali (VMware)
kali官网工具使用大全(使用教程):kali.org/tools。kali的默认用户名和密码:都是kali。放大命令行视图:ctrl+shif+加号。后缀结尾的虚拟机文件即可打开,无需安装。下载完成后解压,双击解压文件里面。kali官网:kali.org。缩小命令行视图:ctrl+减号。
2024-08-15 21:12:03
145
原创 Hive安装配置
文档查看地址:https://cwiki.apache.org/confluence/display/Hive/GettingStarted。hive底层依赖于hdfs,它们两个都有一个Log4j的jar包,将hive里面的jar包另外取名备用。Hive官网下载地址:http://archive.apache.org/dist/hive。github地址:https://github.com/apache/hive。Hive官网地址:http://hive.apache.org。
2024-08-15 17:50:14
420
原创 DataX
阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。出现以下界面为安装成功。
2024-08-13 22:01:31
340
原创 Maxwell
它会实时监控MySQL数据库的数据变更操作(包括insert、update、delete),并将变更数据以 JSON 格式发送给 Kafka、Kinesi等流数据处理平台。下载:https://github.com/zendesk/maxwell/releases/download/v1.29.2/maxwell-1.29.2.tar.gz。若Maxwell发送数据的目的地为Kafka集群,则需要先确保Kafka集群为启动状态。MySQL服务器的Binlog默认是未开启的,如需进行同步,需要先进行开启。
2024-08-13 19:56:40
867
原创 Flume安装配置(Linux)
Flume是开源日志系统。Flume是流式日志采集工具。提供从固定目录下采集日志信息到目的地(HDFS,HBase,Kafka)能力。提供实时采集日志信息(taidir)到目的地的能力。
2024-08-13 15:44:06
1142
2
原创 Kafka安装配置(Linux)
Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。Kafka依赖于zookeeper,尽量把Kafka和zookeeper安装到同一台机器,最常使用的方式是Kafka依赖zookeeper实现分布式。
2024-08-12 23:10:16
665
原创 ZooKeeper安装配置(Linux)
Zookeeper是用Java开发的,需要运行在JVM上,所以安装Zookeeper前需要先安装JDK7及以上的JDK。ZooKeeper是一个分布式的框架,主要功能是给别的框架提供一个分布式的服务支持。
2024-08-12 21:22:08
274
原创 CentOS7安装教程(VMware)
使用ISO映像文件,点击浏览,选择下载的【Centos-7-x86_64-DVD-2009.iso】镜像。
2024-08-09 22:30:44
358
原创 Hadoop3.x安装配置(单机)
hadoop 试图使用root用户操作,但是在环境变量中没有配置使用的用户,所以终止了程序。linux不关闭防火墙,Windows网页访问不到。没有生成、配置公匙,分发给自己。(只第一次安装的时候初始化)
2024-07-31 17:14:26
473
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人