目录
2.6 创建生产者(producer)和消费者(consumer)
1.简介
Kafka是一种高吞吐量的分布式发布订阅消息系统。详细介绍可查阅官网:kafka官网
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。
详细介绍可查阅官网:zookeeper官网
2.环境搭建
2.1 安装JDK
下载地址:jre8
2.2 安装Zookeeper
下载地址:zookeeper-3.5.5
下载后,解压放在目录D:\bigdata(本文所用的目录)下,关于zookeeper以及kafka的目录,路径中最好不要出现空格,比如D:\Program Files,尽量别用,运行脚本时会有问题。
①进入zookeeper的相关设置所在的文件目录,例如本文的:D:\bigdata\zookeeper\conf
②将"zoo_sample.cfg"重命名为"zoo.cfg" 或将"zoo_sample.cfg"复制一份并改名为"zoo.cfg"
③打开zoo.cfg(至于使用什么编辑器,根据自己喜好选即可),找到并编辑:
dataDir=D:/bigdata/zookeeper/data或 D:\\bigdata\\zookeeper\\data(路径仅为示例,具体可根据需要配置)
④打开log4j.properties配置日志的生成路径
zookeeper.log.dir=D:/bigdata/zookeeper/log
⑤与配置jre类似,在系统环境变量中添加:
a.系统变量中添加ZOOKEEPER_HOME=D:\bigdata\zookeeper
b.编辑系统变量中的path变量,增加%ZOOKEEPER_HOME%\bin
⑥在zoo.cfg文件中修改默认的Zookeeper端口(默认端口2181)
这是本文最终的zoo.cfg文件的内容:
# The number of milliseconds of each tick
tickTime=2000
# The number of ticks that the initial
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just
# example sakes.
#dataDir=/tmp/zookeeper
# the port at which the clients will connect
clientPort=2181
# the maximum number of client connections.
# increase this if you need to handle more clients
#maxClientCnxns=60
#
# Be sure to read the maintenance section of the
# administrator guide before turning on autopurge.
#
# http://zookeeper.apache.org/doc/current/zookeeperAdmin.html#sc_maintenance
#
# The number of snapshots to retain in dataDir
#autopurge.snapRetainCount=3
# Purge task interval in hours
# Set to "0" to disable auto purge feature
#autopurge.purgeInterval=1
dataDir=D:/zookeeper/data
注:我的配置仅供参考!
⑦打开cmd窗口,输入zkserver,运行Zookeeper
当看到有 binding to port 0.0.0.0/0.0.0.0:2181时说明启动成功
2.3 安装kafka
下载地址:2.2.1Scala 2.12版本
解压放在D:\bigdata目录下。
①进入kafka配置文件所在目录,D:\bigdata\kafka\config
②编辑文件"server.properties",找到并编辑:
log.dirs=/bigdata/kafka/kafka-logs 或者 D:\\bigdata\\kafka\\kafka-logs
③在server.properties文件中,zookeeper.connect=localhost:2181代表kafka所连接的zookeeper所在的服务器IP以及端口,可根据需要更改。本文在同一台机器上使用,故不用修改。
④kafka会按照默认配置,在9092端口上运行,并连接zookeeper的默认端口2181。
2.4 运行kafka
提示:请确保启动kafka服务器前,Zookeeper实例已经在运行,因为kafka的运行是需要zookeeper这种分布式应用程序协调服务。
①进入kafka安装目录D:\bigdata\kafka
②按下shift+鼠标右键,选择"在此处打开命令窗口",打开命令行。
③在命令行中输入:.\bin\windows\kafka-server-start.bat .\config\server.properties 回车。
正确的显示为下图:
到目前为止,zookeeper以及kafka都已正确运行。保持运行状态,不要关闭。
2.5 创建主题
①创建主题,命名为"test0811",replicationfactor=1(因为只有一个kafka服务器在运行)。可根据集群中kafka服务器个数来修改replicationfactor的数量,以便提高系统容错性等。
②在D:\bigdata\kafka\bin\windows目录下打开新的命令行
③输入命令:
kafka-topics.bat --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test0811 回车。
该窗口不要关闭。
③同样在该目录下打开新的命令行。
④输入命令,启动consumer:
kafka-console-consumer.bat --zookeeper localhost:2181 --topic test0811
现在生产者、消费者均已创建完成。
⑤在producer命令行窗口中任意输入内容,回车 在consumer命令行窗口中即可看到相应的内容。
至此,已完成kafka在windows下的安装和基本的使用。
2.6 创建生产者(producer)和消费者(consumer)
①在D:\bigdata\kafka\bin\windows目录下打开新的命令行。
②输入命令,启动producer:
kafka-console-producer.bat --broker-list localhost:9092 --topic test0811