- 博客(4)
- 收藏
- 关注
原创 Kafka学习历程
企业使用Kafka,基本只是用于接收消息队列,基本不会使用Kafka进行流分析MQ(Massage Queue)信息中间件/信息队列目前企业中比较常见的消息队列产品主要有Kafka、ActiveMQ、RabbitMQ、RocketMQ等。在大数据场景主 要采用Kafka作为消息队列。在JavaEE开发中主要采用ActiveMQ、RabbitMQ、RocketMQ。传统的消息队列的主要应用场景包括:缓存/消峰、解耦和异步通信。不同的数据源分别存储进不同的消息队列,即可按需索取。如:MySQL在queue1,
2023-05-14 12:10:39
437
1
原创 Hadoop集群搭建及ZooKeeper、Hbase、Hive配置
NadeNode和SecondaryNameNode不能放在一起,Yarn的ResourceManager不能和NameNode、SecondaryNameNode放在一起,因为这三个都会占用大量资源,放在一起容易崩溃。所有资源都可在百度网盘下载链接: https://pan.baidu.com/s/1SkUfCurICy-RtxuOuiaZ-Q 提取码: dtga。
2023-04-16 18:24:41
1168
1
原创 Flume学习历程
Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。。
2023-04-16 14:34:24
195
1
原创 Hive 学习历程
使用如下表需求1:查询在2017年4月份购买过的顾客及总人数-- substring(str,pos,len) 返回str字符串从pos(下标从1开始)位置开始长度为len的字串 -- 若想查询2017年4月购买过的人 select distinct name from business where substring(orderdate , 1 , 7) = '2017-04';
2023-04-08 20:08:16
258
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅