Kafka负载均衡策略

时间: 2021-03-02

阅读：2668 次

分类: 默认分类

Kafka负载均衡策略介绍

Kafka Producer产生数据发送给Kafka Server，具体的分发逻辑及负载均衡逻辑，全部由Producer维护。分为下面两种情况：

1、没有key的分发逻辑

每隔 topic.metadata.refresh.interval.ms 的时间，随机选择一个partition。这个时间窗口内的所有记录发送到这个partition。发送数据后即便失败也会重新选择一个partition

2、根据key的分发逻辑

对key求hash，然后对partition数量求模

Kafka负载均衡策略底层实现

分区器是生产者层面的负载均衡。Kafka 生产者生产消息时，根据分区器将消息投递到指定的分区中，所以 Kafka 的负载均衡很大程度上依赖于分区器。
Kafka 默认的分区器是 Kafka 提供的 DefaultPartitioner。它的分区策略是根据 Key 值进行分区分配的：

如果 key 不为 null：对 Key 值进行 Hash 计算，从所有分区中根据 Key 的 Hash 值计算出一个分区号；拥有相同 Key 值的消息被写入同一个分区；
如果 key 为 null：消息将以轮询的方式，在所有可用分区中分别写入消息。

如果不想使用 Kafka 默认的分区器，用户可以实现 Partitioner 接口，自行实现分区方法。

Kafka负载均衡策略与消息顺序性的矛盾

Kafka负载负载均衡与消息顺序性有着一定程度上的矛盾。负载均衡的目的是将消息尽可能平均分配，而对于需要保证顺序性的场景，通常会利用 Key 值实现分区顺序性，那么所有 Key 值相同的消息就会进入同一个分区。这样的情况下，对于大量拥有相同 Key 值的消息，会涌入同一个分区，导致一个分区消息过多，其他分区没有消息的情况，即与负载均衡的思想相悖。

标签: none

Kafka负载均衡策略

Kafka负载均衡策略介绍

1、没有key的分发逻辑

2、根据key的分发逻辑

Kafka负载均衡策略底层实现

Kafka负载均衡策略与消息顺序性的矛盾

添加新评论

最近回复

分类

最新文章

热门文章

归档

友情链接