Kafka安装配置

下载链接:http://kafka.apache.org/downloads

Kafka简介
一个分布式发布-订阅消息传递系统。 它最初由LinkedIn公司开发,Linkedin于2010年贡献给了Apache基金会并成为*开源项目。Kafka是一种快速、可扩展的、设计内在就是分布式的,分区的和可复制的提交日志服务。
日志收集:一个公司可以用Kafka可以收集各种服务的log,通过kafka以统一接口服务的方式开放给各种consumer,例如hadoop、Hbase、Solr等。
用户活动跟踪:Kafka经常被用来记录web用户或者app用户的各种活动,如浏览网页、搜索、点击等活动,这些活动信息被各个服务器发布到kafka的topic中,然后订阅者通过订阅这些topic来做实时的监控分析,或者装载到hadoop、数据仓库中做离线分析和挖掘。
运营指标:Kafka也经常用来记录运营监控数据。包括收集各种分布式应用的数据,生产各种操作的集中反馈,比如报警和报告。
消息系统:解耦和生产者和消费者、缓存消息等。
流式处理:比如spark streaming和storm

安装步骤
1、上传apache-phoenix-4.14.1-HBase-1.2-bin.tar.gz到software目录下
2、解压
[[email protected] software]$ tar -zxvf kafka_2.11-2.0.1.tgz
3、修改配置文件
[[email protected] ~]$ cd software/kafka_2.11-2.0.1/config/
[[email protected] config]$ vi server.properties
Kafka安装配置

  1. broker.id=0 #当前机器在集群中的唯一标识,和zookeeper的myid性质一样
  2. port=9092 #当前kafka对外提供服务的端口默认是9092
  3. host.name=localhost #这个参数默认是关闭的,在0.8.1有个bug,DNS解析问题,失败率的问题
  4. num.network.threads=3 #这个是borker进行网络处理的线程数
  5. num.io.threads=8 #这个是borker进行I/O处理的线程数
  6. log.dirs=/tmp/kafka-logs #消息存放的目录,这个目录可以配置为“,”逗号分割的表达式,上面的num.io.threads要大于这个目录的个数这个目录,如果配置多个目录,新创建的topic他把消息持久化的地方是,当前以逗号分割的目录中,那个分区数最少就放那一个
  7. socket.send.buffer.bytes=102400 #发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
  8. socket.receive.buffer.bytes=102400 #kafka接收缓冲区大小,当数据到达一定大小后在序列化到磁盘
  9. socket.request.max.bytes=104857600 #这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数,这个值不能超过java的堆栈大小
  10. num.partitions=1 #默认的分区数,一个topic默认1个分区数
  11. log.retention.hours=168 #默认消息的最大持久化时间,168小时,7天
  12. message.max.byte=5242880 #消息保存的最大值5M
  13. default.replication.factor=2 #kafka保存消息的副本数,如果一个副本失效了,另一个还可以继续提供服务
  14. replica.fetch.max.bytes=5242880 #取消息的最大直接数
  15. log.segment.bytes=1073741824 #这个参数是:因为kafka的消息是以追加的形式落地到文件,当超过这个值的时候,kafka会新起一个文件
  16. log.retention.check.interval.ms=300000 #每隔300000毫秒去检查上面配置的log失效时间(log.retention.hours=168),到目录查看是否有过期的消息如果有,删除
  17. log.cleaner.enable=false #是否启用log压缩,一般不用启用,启用的话可以提高性能
  18. zookeeper.connect=localhost:2181 #设置zookeeper的连接端口

4、三台都开启kafka
[[email protected] ~]$ cd software/kafka_2.11-2.0.1
[[email protected] kafka_2.11-2.0.1]$ bin/kafka-server-start.sh -daemon config/server.properties
Kafka安装配置
剩下两台同上

—create表示创建一个topic —zookeeper master:2181 表示连接zookeeper 的服务和端口号
—replication-factor 1表示创建副本数量是1 —partitions 1表示分区数量是1 —topic
test表示创建一个名为test11的topic主题

5、测试生产者与消费者之间的消息发送
启动一个生产者:
[[email protected] kafka_2.11-2.0.1]$ bin/kafka-console-producer.sh --broker-list master:9092 --topic test

—kafka-console-producer.sh表示启动一个生产者 —broker-list
master:9092表示broker服务列表中的master服务和端口号 —topic test表示topic名字为test

启动一个消费者:
[[email protected] kafka_2.11-2.0.1]$ bin/kafka-console-consumer.sh --bootstrap-server master:9092 --from-beginning

—kafka-console-consumer.sh表示启动一个消费者 —zookeeper
master:2181表示连接zookeeper 的服务和端口号 —topic test表示topic名字为test
—from-beginning 表示在消费者还没有一个已经建立的偏移量的时候,从最早的消息开始而不是从最新的消息开始
Kafka安装配置
Kafka安装配置