聊聊 Kafka： Consumer 源码解析之 ConsumerNetworkClient

一、Consumer 的使用

Consumer 的源码解析主要来看 KafkaConsumer，KafkaConsumer 是 Consumer 接口的实现类。KafkaConsumer 提供了一套封装良好的 API，开发人员可以基于这套 API 轻松实现从 Kafka 服务端拉取消息的功能，这样开发人员根本不用关心与 Kafka 服务端之间网络连接的管理、心跳检测、请求超时重试等底层操作，也不必关心订阅 Topic 的分区数量、分区副本的网络拓扑以及 Consumer Group 的 Rebalance 等 Kafka 具体细节，KafkaConsumer 中还提供了自动提交 offset 的功能，使的开发人员更加关注业务逻辑，提高了开发效率。

下面我们来看一个 KafkaConsumer 的示例程序：

/**
 * @author: 微信公众号【老周聊架构】
 */
public class KafkaConsumerTest {
    public static void main(String[] args) {
        Properties props = new Properties();

        // kafka地址,列表格式为host1:port1,host2:port2,...，无需添加所有的集群地址，kafka会根据提供的地址发现其他的地址(建议多提供几个，以防提供的服务器关闭) 必须设置
        props.put("bootstrap.servers", "localhost:9092");
        // key序列化方式 必须设置
        props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        // value序列化方式 必须设置
        props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
        props.put("group.id", "consumer_riemann_test");

        KafkaConsumer consumer = new KafkaConsumer<>(props);
        // 可消费多个topic,组成一个list
        String topic = "riemann_kafka_test";
        consumer.subscribe(Arrays.asList(topic));

        while (true) {
            ConsumerRecords records = consumer.poll(Duration.ofMillis(100));
            for (ConsumerRecord record : records) {
                System.out.printf("offset = %d, key = %s, value = %s 
", record.offset(), record.key(), record.value());
                try {
                    Thread.sleep(100);
                } catch (InterruptedException e) {
                    e.printStackTrace();
                }
            }
        }
    }
}

从示例中可以看出 KafkaConsumer 的核心方法是 poll()，它负责从 Kafka 服务端拉取消息。核心方法的具体细节我想放在下一篇再细讲，关乎消费侧的客户端与 Kafka 服务端的通信模型。这一篇我们主要从宏观的角度来剖析下 Consumer 消费端的源码。

二、KafkaConsumer 分析

我们先来看下 Consumer 接口，该接口定义了 KafkaConsumer 对外的 API，其核心方法可以分为以下六类：

subscribe() 方法：订阅指定的 Topic，并为消费者自动分配分区。
assign() 方法：用户手动订阅指定的 Topic，并且指定消费的分区，此方法 subscribe() 方法互斥。
poll() 方法：负责从服务端获取消息。
commit*() 方法：提交消费者已经消费完成的 offset。
seek*() 方法：指定消费者起始消费的位置。
pause()、resume() 方法：暂停、继续 Consumer，暂停后 poll() 方法会返回空。

我们先来看下 KafkaConsumer 的重要属性以及 UML 结构图。

clientId：Consumer 的唯一标识。
groupId：消费者组的唯一标识。
coordinator：控制着 Consumer 与服务端 GroupCoordinator 之间的通信逻辑，读者可以理解为 Consumer 与服务端 GroupCoordinator 通信的门面。
keyDeserializer、valueDeserializer：key 和 value 的反序列化器。
fetcher：负责从服务端获取消息。
interceptors：ConsumerInterceptors 集合，ConsumerInterceptors.onConsumer() 方法可以在消息通过 poll() 方法返回给用户之前对其进行拦截或修改；ConsumerInterceptors.onCommit() 方法也可以在服务端返回提交 offset 成功的响应进行拦截或修改。
client：ConsumerNetworkClient 负责消费者与 Kafka 服务端的网络通信。
subscriptions：SubscriptionState 维护了消费者的消费状态。
metadata：ConsumerMetadata 记录了整个 Kafka 集群的元信息。
currentThread、refcount：分别记录的 KafkaConsumer 的线程 id 和重入次数

三、ConsumerNetworkClient

ConsumerNetworkClient 在 NetworkClient 之上进行了封装，提供了更高级的功能和更易用的 API。

我们先来看下 ConsumerNetworkClient 的重要属性以及 UML 结构图。

client：NetworkClient 对象。
unsent：缓冲队列。UnsentRequests 对象，该对象内部维护了一个 unsent 属性，该属性是 ConcurrentMap>，key 是 Node 节点，value 是 ConcurrentLinkedQueue。
metadata：用于管理 Kafka 集群元数据。
retryBackoffMs：在尝试重试对给定主题分区的失败请求之前等待的时间量，这避免了在某些故障情况下在紧密循环中重复发送请求。对应 retry.backoff.ms 配置，默认 100 ms。
maxPollTimeoutMs：使用 Kafka 的组管理工具时，消费者协调器的心跳之间的预期时间。心跳用于确保消费者的会话保持活跃，并在新消费者加入或离开组时促进重新平衡。该值必须设置为低于 session.timeout.ms，但通常不应设置为高于该值的 1/3。它可以调整得更低，以控制正常重新平衡的预期时间。对应 heartbeat.interval.ms 配置，默认 3000 ms。构造函数中，maxPollTimeoutMs 取的是 maxPollTimeoutMs 与 MAX_POLL_TIMEOUT_MS 的最小值，MAX_POLL_TIMEOUT_MS 默认为 5000 ms。
requestTimeoutMs：配置控制客户端等待请求响应的最长时间。如果在超时之前没有收到响应，客户端将在必要时重新发送请求，或者如果重试用尽，则请求失败。对应 request.timeout.ms 配置，默认 305000 ms。
wakeupDisabled：由调用 KafkaConsumer 对象的消费者线程之外的其它线程设置，表示要中断 KafkaConsumer 线程。
lock：我们不需要高吞吐量，所以使用公平锁来尽量避免饥饿。
pendingCompletion：当请求完成时，它们在调用之前被转移到这个队列。目的是避免在持有此对象的监视器时调用它们，这可能会为死锁打开门。
pendingDisconnects：断开与协调器连接节点的队列。
wakeup：这个标志允许客户端被安全唤醒而无需等待上面的锁。为了同时启用它，避免需要获取上面的锁是原子的。

ConsumerNetworkClient 的核心方法是 poll() 方法，poll() 方法有很多重载方法，最终会调用 poll(Timer timer, PollCondition pollCondition, boolean disableWakeup) 方法，这三个参数含义是：timer 表示定时器限制此方法可以阻塞多长时间；pollCondition 表示可空阻塞条件；disableWakeup 表示如果 true 禁用触发唤醒。

我们来简单回顾下 ConsumerNetworkClient 的功能：

3.1 org.apache.kafka.clients.consumer.internals.ConsumerNetworkClient#trySend

循环处理 unsent 中缓存的请求，对每个 Node 节点，循环遍历其 ClientRequest 链表，每次循环都调用 NetworkClient.ready() 方法检测消费者与此节点之间的连接，以及发送请求的条件。若符合条件，则调用 NetworkClient.send() 方法将请求放入 InFlightRequest 中等待响应，也放入 KafkaChannel 中的 send 字段等待发送，并将消息从列表中删除。代码如下：

long trySend(long now) {
    long pollDelayMs = maxPollTimeoutMs;

    // send any requests that can be sent now
    // 遍历 unsent 集合
    for (Node node : unsent.nodes()) {
        Iterator iterator = unsent.requestIterator(node);
        if (iterator.hasNext())
            pollDelayMs = Math.min(pollDelayMs, client.pollDelayMs(node, now));

        while (iterator.hasNext()) {
            ClientRequest request = iterator.next();
            // 调用 NetworkClient.ready(）检查是否可以发送请求
            if (client.ready(node, now)) {
                // 调用 NetworkClient.send(）方法，等待发送请求。
                client.send(request, now);
                // 从 unsent 集合中删除此请求
                iterator.remove();
            } else {
                // try next node when current node is not ready
                break;
            }
        }
    }
    return pollDelayMs;
}

3.2 计算超时时间

如果没有请求在进行中，则阻塞时间不要超过重试退避时间。

3.3 org.apache.kafka.clients.NetworkClient#poll

判断是否需要更新 metadata 元数据
调用 Selector.poll() 进行 socket 相关的 IO 操作
处理完成后的操作（处理一系列 handle*() 方法处理请求响应、连接断开、超时等情况，并调用每个请求的回调函数）

3.4 调用 checkDisconnects() 方法检测连接状态

调用 checkDisconnects() 方法检测连接状态。检测消费者与每个 Node 之间的连接状态，当检测到连接断开的 Node 时，会将其在 unsent 集合中对应的全部 ClientRequest 对象清除掉，之后调用这些ClientRequest 的回调函数。

private void checkDisconnects(long now) {
    // any disconnects affecting requests that have already been transmitted will be handled
    // by NetworkClient, so we just need to check whether connections for any of the unsent
    // requests have been disconnected; if they have, then we complete the corresponding future
    // and set the disconnect flag in the ClientResponse
    for (Node node : unsent.nodes()) {
        // 检测消费者与每个 Node 之间的连接状态
        if (client.connectionFailed(node)) {
            // Remove entry before invoking request callback to avoid callbacks handling
            // coordinator failures traversing the unsent list again.
            // 在调用请求回调之前删除条目以避免回调处理再次遍历未发送列表的协调器故障。
            Collection requests = unsent.remove(node);
            for (ClientRequest request : requests) {
                RequestFutureCompletionHandler handler = (RequestFutureCompletionHandler) request.callback();
                AuthenticationException authenticationException = client.authenticationException(node);
                // 调用 ClientRequest 的回调函数
                handler.onComplete(new ClientResponse(request.makeHeader(request.requestBuilder().latestAllowedVersion()),
                        request.callback(), request.destination(), request.createdTimeMs(), now, true,
                        null, authenticationException, null));
            }
        }
    }
}

3.5 org.apache.kafka.clients.consumer.internals.ConsumerNetworkClient#maybeTriggerWakeup

检查 wakeupDisabled 和 wakeup，查看是否有其它线程中断。如果有中断请求，则抛出 WakeupException 异常，中断当前 ConsumerNetworkClient.poll() 方法。

public void maybeTriggerWakeup() {
    // 通过 wakeupDisabled 检测是否在执行不可中断的方法，通过 wakeup 检测是否有中断请求。
    if (!wakeupDisabled.get() && wakeup.get()) {
        log.debug("Raising WakeupException in response to user wakeup");
        // 重置中断标志
        wakeup.set(false);
        throw new WakeupException();
    }
}

3.6 再次调用 trySend() 方法

再次调用 trySend() 方法。在步骤 2.1.3 中调用了 NetworkClient.poll() 方法，在其中可能已经将 KafkaChannel.send 字段上的请求发送出去了，也可能已经新建了与某些 Node 的网络连接，所以这里再次尝试调用 trySend() 方法。

3.7 org.apache.kafka.clients.consumer.internals.ConsumerNetworkClient#failExpiredRequests

处理 unsent 中超时请求。它会循环遍历整个 unsent 集合，检测每个 ClientRequest 是否超时，将过期请求加入到 expiredRequests 集合，并将其从 unsent 集合中删除。调用超时 ClientRequest 的回调函数 onFailure()。

private void failExpiredRequests(long now) {
    // clear all expired unsent requests and fail their corresponding futures
    // 清除所有过期的未发送请求并使其相应的 futures 失败
    Collection expiredRequests = unsent.removeExpiredRequests(now);
    for (ClientRequest request : expiredRequests) {
        RequestFutureCompletionHandler handler = (RequestFutureCompletionHandler) request.callback();
        // 调用回调函数
        handler.onFailure(new TimeoutException("Failed to send request after " + request.requestTimeoutMs() + " ms."));
    }
}

private Collection removeExpiredRequests(long now) {
    List expiredRequests = new ArrayList<>();
    for (ConcurrentLinkedQueue requests : unsent.values()) {
        Iterator requestIterator = requests.iterator();
        while (requestIterator.hasNext()) {
            ClientRequest request = requestIterator.next();
            // 检查是否超时
            long elapsedMs = Math.max(0, now - request.createdTimeMs());
            if (elapsedMs > request.requestTimeoutMs()) {
                // 将过期请求加入到 expiredRequests 集合
                expiredRequests.add(request);
                requestIterator.remove();
            } else
                break;
        }
    }
    return expiredRequests;
}

四、RequestFutureCompletionHandler

说 RequestFutureCompletionHandler 之前，我们先来看下 ConsumerNetworkClient.send() 方法。里面的逻辑会将待发送的请求封装成 ClientRequest，然后保存到 unsent 集合中等待发送，代码如下：

public RequestFuture send(Node node,
                                          AbstractRequest.Builder<?> requestBuilder,
                                          int requestTimeoutMs) {
    long now = time.milliseconds();
    RequestFutureCompletionHandler completionHandler = new RequestFutureCompletionHandler();
    ClientRequest clientRequest = client.newClientRequest(node.idString(), requestBuilder, now, true,
            requestTimeoutMs, completionHandler);
    // 创建 clientRequest 对象，并保存到 unsent 集合中。
    unsent.put(node, clientRequest);

    // wakeup the client in case it is blocking in poll so that we can send the queued request
    // 唤醒客户端以防它在轮询中阻塞，以便我们可以发送排队的请求。
    client.wakeup();
    return completionHandler.future;
}

我们重点来关注一下 ConsumerNetworkClient 中使用的回调对象——RequestFutureCompletionHandler。其继承关系如下：

从 RequestFutureCompletionHandler 继承关系图我们可以知道，它不仅实现了 RequestCompletionHandler 接口，还组合了 RequestFuture 类，RequestFuture 是一个泛型类，其核心字段与方法如下：

listeners：RequestFutureListener 队列，用来监听请求完成的情况。RequestFutureListener 接口有 onSuccess() 和 onFailure () 两个方法，对应于请求正常完成和出现异常两种情况。
isDone()：表示当前请求是否已经完成，不管正常完成还是出现异常，此字段都会被设置为 true。
value()：记录请求正常完成时收到的响应，与 exception() 方法互斥。此字段非空表示正常完成，反之表示出现异常。
exception()：记录导致请求异常完成的异常类，与 value() 互斥。此字段非空则表示出现异常，反之则表示正常完成。

我们之所以要分析源码，是因为源码中有很多设计模式可以借鉴，应用到你自己的工作中。RequestFuture 中有两处典型的设计模式的使用，我们来看一下：

compose() 方法：使用了适配器模式。
chain() 方法：使用了责任链模式。

4.1 RequestFuture.compose()

/**
 * 适配器
 * Adapt from a request future of one type to another.
 *
 * @param  Type to adapt from
 * @param  Type to adapt to
 */
public abstract class RequestFutureAdapter {
    public abstract void onSuccess(F value, RequestFuture future);

    public void onFailure(RuntimeException e, RequestFuture future) {
        future.raise(e);
    }
}

/**
 * RequestFuture 适配成 RequestFuture
 * Convert from a request future of one type to another type
 * @param adapter The adapter which does the conversion
 * @param  The type of the future adapted to
 * @return The new future
 */
public  RequestFuture compose(final RequestFutureAdapter adapter) {
    // 适配之后的结果
    final RequestFuture adapted = new RequestFuture<>();
    // 在当前 RequestFuture 上添加监听器
    addListener(new RequestFutureListener() {
        @Override
        public void onSuccess(T value) {
            adapter.onSuccess(value, adapted);
        }

        @Override
        public void onFailure(RuntimeException e) {
            adapter.onFailure(e, adapted);
        }
    });
    return adapted;
}

使用 compose() 方法进行适配后，回调时的调用过程，也可以认为是请求完成的事件传播流程。当调用 RequestFuture 对象的 complete() 或 raise() 方法时，会调用 RequestFutureListener 的 onSuccess() 或 onFailure() 方法，然后调用 RequestFutureAdapter 的对应方法，最终调用RequestFuture ~~对象的对应方法。~~

4.2 RequestFuture.chain()
chain() 方法与 compose() 方法类似，也是通过 RequestFutureListener 在多个 RequestFuture 之间传递事件。代码如下：
public void chain(final RequestFuture future) { // 添加监听器 addListener(new RequestFutureListener() { @Override public void onSuccess(T value) { // 通过监听器将 value 传递给下一个 RequestFuture 对象 future.complete(value); } @Override public void onFailure(RuntimeException e) { // 通过监听器将异常传递给下一个 RequestFuture 对象 future.raise(e); } }); }
好了，ConsumerNetworkClient 的源码分析告一段落了，希望文章对你有帮助，我们下期再见。

展开阅读全文

页面更新：2024-03-08

标签：监听器字段线程服务端函数源码异常对象消费者时间方法

1 2 3 4 5

吐槽：同样的产品，只要国外品牌一退出，国产品牌就立刻涨价了！

快手“爨个门子”自媒体平台吐槽：你个汉奸卖国贼，不用国产就是不爱国！？不知道大家有没有感觉，最近几年同样的产品，只要国外品牌退出国内市场，国产品牌立刻涨价，喊着爱国口号，卖的比国外牌子更贵…… 白酒没有对手，全玩高端奢

三星Galaxy S23旗舰手机将首发康宁Gorilla Glass Victus2玻璃

IT之家 1 月 27 日消息，康宁官方今日宣布，三星电子将在其下一代 Galaxy 旗舰智能手机中使用新型手机面板玻璃 Corning Gorilla Glass Victus 2。当然，三星首发新屏幕也已经成惯例了。IT之家了解到，Gorilla Glass Victus 2

Immuta Detect用于数据安全的持续监控

Immuta宣布发布其最新产品Immuta Detect。凭借其持续的数据安全监控功能，Immuta Detect可向数据和安全团队发出有关风险数据访问行为的警报，从而实现更快速、更准确的风险补救，并改进现代云数据平台的数据安全态势管理。

增程电动汽车未来前景展望：2023年将井喷式增长，有望突破30万辆

在半年之前有个别汽车厂商试图诋毁增程电动驱动技术，其称之为“行业共识之落后技术”；然而在多挡串并混动系统和增程电混技术逐鹿半年有余后，期终考的成绩单脆生生的给了它一记响亮的耳光。只不过截止目前确实没有权威机

江苏无锡：首批智能移动充电机器人“上岗”

视频加载中...江苏省无锡市日前推出当地首批智能移动充电机器人。该充电机器人可在高速服务区等区域线上接收充电指令后，自主灵活移动至目标位置，助力实现从“车找电”到“电找车”的转变。记者：何磊静新华社音视频部制

清华大学计算机毕业生也会失业？这是真的，体制内工作还是太香了

可以考上清华大学计算机专业的毕业生，不光是优秀了；还要在所在省份特别优秀，才可以被清华计算机专业录取；当然毕业生的就业与薪资待遇都是非常不错的，可以用炙手可热来形容。最近三年经济大环境一般，人工智能技术的发展又突

早评-新能源车板块大涨！A股节后也要跟上节奏了？

周五到了，大年初六来了，各位读者朋友大家早上好啊！美好的一天又开始了，今天也是春节长假的最后一天了，明天开始，不少小伙伴就要开始返岗工作了！好好珍惜每一天，每一天都充实快乐！ 1.创十个月新高！港股恒生指数兔年首个交易日大

神经网络变得轻松（第二十部分）：自动编码器

内容概述1. 自动编码器架构2. 自动编码器解决的经典问题3. 自动编码器与 PCA 的比较4. 自动编码器在交易中的潜在用途5. 实践性实验结束语参考文献列表本文中用到的程序概述我们继续研究无监督学习方法。在前几篇

新能源车频繁充电好吗-电动汽车剩多少电再去充最好

对于第一次购买新能源车辆的车主们来说，一定会有很多疑问，担心自己不会正确使用充电方式，而导致电池有所损伤，简短寿命。其实，新能源汽车的确不适合频繁充电，建议每隔几天充一次会更好。新能源车频繁充电好吗每天充电不好，频

百度搜索的代替品？一个新的、免费、注重隐私的搜索引擎

说到百度搜索，它是全球最大的中文搜索引擎，相信大多数人是同意这个观点的。百度搜索引擎，拥有超过千亿的中文网页数据库。我们在其他搜索引擎中找不到的内容，经常可以在百度上找到。更重要的是，百度打造了一个很好的生态

回顾：法国拆下华为3000根天线，却再次变脸？任正非：我早有准备

作为我国民营通信科技公司的领头羊，“华为”这个品牌想必已经是家喻户晓。从1987年成立至今，华为总结“以客户为中心，以奋斗者为本”的企业文化，走过了一路的坎坷曲折，最终取得如今的成就。在华为栉风沐雨的前进路上，经历

撮合“风马牛不相及”的植物物种杂交，成了！

来源：科技日报科技日报记者王延斌通讯员王静用牧草与小麦杂交，可培育出抗病性强的小麦新品种，用竹子和水稻杂交，可培育出品质优良的水稻新品种……将看似“风马牛不相及”的两个物种撮合，在育种界被称为“远缘杂交”，可

特斯拉重新启用，毫米波雷达再添新“爆点”

近日，有消息称，特斯拉公司自动驾驶系统（FSD）新方案曝光，新一代硬件传感器方案涉及两方面变化：摄像头减少，由原先前置3个变成2个，但提高分辨率；同时重新启用之前放弃的毫米波雷达。而这一变化为日益火热的毫米波雷达行业增添了

机构：预计 2023 年至2027 年全球智能手机用户将稳定增长

集微网消息，近日调研机构 Strategy Analytics （现属于 TechInsights）的最新研究显示，全球智能手机用户规模从 2023 年到 2027 年间将增长 11%。来源：Strategy AnalyticsStrategy Analytics 表示，全球智能手机的普及率将保持

少了屏幕的迷你主机，比台式机和笔记本都要香！零刻SEI12 Pro测评

前段时间小米发布了自家的迷你电脑产品，小米迷你主机，本来外界对小米入局迷你主机市场是充满期待的，因为在很久很久以前，小米就是价格屠夫的代名词，可是现在变了，小米手机越来越贵，等小米主机一发布，将近四千的价格，让很多人都

上滑加载更多 ↓

所有内容加载完毕

聊聊 Kafka： Consumer 源码解析之 ConsumerNetworkClient

一、Consumer 的使用

二、KafkaConsumer 分析

三、ConsumerNetworkClient

3.1 org.apache.kafka.clients.consumer.internals.ConsumerNetworkClient#trySend

3.2 计算超时时间

3.3 org.apache.kafka.clients.NetworkClient#poll

3.4 调用 checkDisconnects() 方法检测连接状态

3.5 org.apache.kafka.clients.consumer.internals.ConsumerNetworkClient#maybeTriggerWakeup

3.6 再次调用 trySend() 方法

3.7 org.apache.kafka.clients.consumer.internals.ConsumerNetworkClient#failExpiredRequests

四、RequestFutureCompletionHandler

4.1 RequestFuture.compose()

4.2 RequestFuture.chain()

吐槽：同样的产品，只要国外品牌一退出，国产品牌就立刻涨价了！

三星Galaxy S23旗舰手机将首发康宁Gorilla Glass Victus2玻璃

Immuta Detect用于数据安全的持续监控

增程电动汽车未来前景展望：2023年将井喷式增长，有望突破30万辆

江苏无锡：首批智能移动充电机器人“上岗”

清华大学计算机毕业生也会失业？这是真的，体制内工作还是太香了

早评-新能源车板块大涨！A股节后也要跟上节奏了？

神经网络变得轻松（第二十部分）：自动编码器

新能源车频繁充电好吗-电动汽车剩多少电再去充最好

百度搜索的代替品？一个新的、免费、注重隐私的搜索引擎

回顾：法国拆下华为3000根天线，却再次变脸？任正非：我早有准备

撮合“风马牛不相及”的植物物种杂交，成了！

特斯拉重新启用，毫米波雷达再添新“爆点”

机构：预计 2023 年至2027 年全球智能手机用户将稳定增长

少了屏幕的迷你主机，比台式机和笔记本都要香！零刻SEI12 Pro测评

什么是时间序列？有什么应用

汽车团购经销商跑路，近千名消费者维权

JavaScript选择 map而非对象(object)存储键值对的 5

聊聊 Kafka：Producer 源码解析

警告无效，德国确定交付“豹”2坦克时间：为乌军组建两个

注意！本周上班时间有变

让芜菁和拟南芥处对象，这个技术不得了！

权威访谈丨张扬对话张首刚：“雕刻”时间的人带你准点

迪马：巴卡约科尚未接受代米尔体育报价，他需花几天时间决

名记：浓眉明日如复出出场时间将被限制在20-24分钟