kafka基本概念以及用法

kafka基本概念以及用法目录



提示:以下是本篇文章正文内容,下面案例可供参考

一、什么是kafka?

kafka是一个分布式流处理工具,被全球大量公司广泛应用在大数据处理领域

二、为什么要使用kafka?

众所周知,在微服务领域或者大数据领域,需要服务和服务之间进行数据交换,数据通信,大数据领域系统和系统之间可能还有海量的数据交换压力。
1.传统的线程和线程之间的数据交换方式
在这里插入图片描述
jvm中会有一块公共的区域叫做堆内存,线程和线程之间会推送数据到堆内存中,其他线程需要获取数据就去堆内存获取
2.传统的进程和进程之间的数据交换方式
在这里插入图片描述

进程和进程之间是通过网络传输数据(Http,或者socket等常见网络传输协议)
但是不管是进程还是线程,传统这种数据传输交换方式,如果在海量数据高并发的场景下,如果接受数据方的内存跟不上推送的速度,就会引起内存溢出,堆内存溢出等生产问题。而kafka就是为了解决这个问题,孕育而生的。他充当了交换数据中间的一个中间件,类似一个消息队列的缓冲区

三、kafka的基本概念

一般市面上面的消息队列都遵循了JMS(Java Message Service)的传输规范
1.P2P(point to point)
在这里插入图片描述
2.PS(publish and subscribe) 发布订阅模式
在这里插入图片描述

四、安装kafka(windows版本)

1.下载kafka
https://kafka.apache.org/downloads
在这里插入图片描述
解压目录:
在这里插入图片描述
启动kafka需要依赖zookeeper,我们可以使用kafka自带的zookeeper
在这里插入图片描述
在log文件夹下面新建zk文件夹区分日志文件
在这里插入图片描述
修改配置文件中zookeeper文件日志文件位置
在这里插入图片描述
修改kafka运行日志保存位置
在这里插入图片描述
启动zookeeper和kafka
cmd到bin目录下面windows执行下面的bat脚本
在这里插入图片描述后面跟上刚才修改的配置文件
在这里插入图片描述
启动zookeeper成功 。
开始启动kafka
启动bat脚本 后面跟上刚才带上的配置文件
在这里插入图片描述
在这里插入图片描述
启动成功
tips:后续可能会出现kafka出现进程挂掉的报错
在这里插入图片描述
可以删除配置的两个文件夹下面的文件,重新启动zookeeper和kafka
在这里插入图片描述

五、命令行控制kafka生产消费数据,创建 删除topic

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值