【色修源码】【ransac源码】【strcmp源码】kafka源码原理-皮皮网

【色修源码】【ransac源码】【strcmp源码】kafka源码原理

时间:2024-12-29 08:44:00 分类:雪中莲源码来源:r源码安装

1.sarama 源码解析--Kafka的码原重平衡
2.Kafka源码分析(五) - Server端 - 基于时间轮的延时组件
3.浅析源码 golang kafka sarama包(一)如何生产消息以及通过docker部署kafka集群with kraft
4.Kafka Logcleaner源码分析
5.Kafka消费者源码：重平衡（1）-初始化与FIND_COORDINATOR
6.源码解析kafka删除topic

kafka源码原理

sarama 源码解析--Kafka的重平衡

重平衡操作

重平衡是动态调整Consumer Group下的Consumer订阅Topic的分区的一个关键操作。Sarama中的码原BalanceStrategyRange和BalanceStrategySticky策略具体实施这一操作。

重平衡触发条件之一是码原成员数变更。这一过程包括以下步骤：

1. 启动一个新的码原消费者实例。

2. 调用Consume方法。码原

3. Consume方法初始化连接信息，码原色修源码并启动一个goroutine。码原程序会阻塞在sess.ctx.Done()上。码原

4. 在newSession方法中找到协调者信息，码原并发起join请求和syncgroup请求。码原Consumer Leader执行一次重平衡。码原

5. 创建consumer group session，码原并初始化offset manager和开启心跳goroutine。码原

6. 当心跳超时或收到coordinator的码原重平衡通知时，调用cancel()方法取消操作，码原退出Consume逻辑。

7. 此时，Consume函数优雅退出。由于外层循环的存在，会重新执行Consume，实现一次重平衡。

另一个触发重平衡的条件是订阅主题分区数发生变更。这一过程如下：

1. 在Consume方法中开启心跳goroutine，并将consumer group session传递给它。

2. 分区数发生变化时，调用sess.cancel()，Consume优雅退出并重新执行，实现重平衡。

Kafka源码分析(五) - Server端 - 基于时间轮的延时组件

Kafka内部处理大量的延时操作，例如，在接收到PRODUCE请求后，副本可以等待一个timeout的ransac源码时间再响应客户端。下面我们来探讨一个问题：为什么Kafka要自己实现一个延时任务组件，而不是直接使用Java的java.util.concurrent.DelayQueue呢？我们可以从以下两个方面来分析这个问题。

1.1 DelayQueue的能力

DelayQueue相关的接口/类如下所示：

相应地，DelayQueue提供的能力如下：

1.2 Kafka的业务场景

Kafka的业务背景具有以下特点：

相应地，Kafka对延时任务组件有以下两点要求：

这两点要求都无法通过直接应用DelayQueue的方式得到满足。

二. 组件接口

让我们来看看Kafka的延时任务组件对外提供的接口，从而了解其提供的能力和使用方式。

如下所示：

左边的两个类定义了"延时操作"，右边的DelayedOperationPurgatory类定义了一个维护DelayOperaton的容器，其核心操作如下：

三. 实现

以下是关于"延时"实现方式的介绍。

3.1 业务模型

时间轮延时组件的思路如下：

接下来，通过一个具体的例子来说明这种映射逻辑：

首先关注上图中①号时间轮。圆环中的每一个单元格表示一个TimerTaskList。单元格有其关联的时间跨度；下方的"1s x "表示时间轮上共有个单元格，每个单元格的时间跨度为1秒。有一个指针指向了"当前时间"所对应的单元格。顺时针方向为时间流动方向。

当收到一个延迟时间在0-1s的TimerTask时，会将其追加到①号时间轮的橙色单元格中。当收到一个延迟时间在3-4s的TimerTask时，会将其追加到①号时间轮的**单元格中。以此类推。

现在有一个问题：①号时间轮能表示的最大延迟时间是秒，那如果收到了延迟秒的任务该怎么办？这时该用到②号时间轮了，我们称②号为①号的"溢出时间轮"。②号时间轮的特点如下：

如此，延迟时间在-s的TimerTask会被追加到②号的紫色单元格，延迟时间在-s的TimerTask会被追加到②号的绿色单元格中。③号时间轮同理。

刚刚是按①->②->③的顺序来分析时间轮的逻辑，反过来也可以得到有用的strcmp源码想象手里有一个"放大镜"，其实③号时间轮的蓝色单元格"放大"后是②号时间轮；②号时间轮的蓝色单元格"放大"后是①号时间轮；蓝色单元格并不实际存储TimerTask。

3.2 数据结构

DelayedOperationPurgatory有一个Timer类型的timeoutTimer属性，用于维护延时任务。实际使用的是Timer的实现类：SystemTimer。该类用于维护延时任务的核心属性有两个：delayQueue和timingWheel。TimingWheel表示单个时间轮，接下来我们来看看其类图：

各属性含义如下：

3.3 算法

3.3.1 添加任务

添加任务的入口是DelayedOperationPurgatory.tryCompleteElseWatch，其核心逻辑分为如下两步：

SystemTimer.add直接调用了addTimerTaskEntry方法，后者逻辑如下：

TimingWheel.add的逻辑也很清晰，分如下4种场景处理：

3.3.2 尝试提前触发任务

入口是DelayedOperationPurgatory.checkAndComplete：

接下来看Watchers.tryCompleteWatched方法的内容：

DelayedOperation.maybeTryComplete方法最终调用了DelayedOperation.tryComplete；

DelayedOperation的子类需要在后者中实现自己的"触发条件"检查逻辑；若满足了提前触发的条件，则调用forceComplete方法执行事件触发场景下的业务逻辑。

3.3.3 任务到期自动执行

DelayedOperationPurgatory中维护了一个expirationReaper线程，其职责就是循环调用kafka.utils.timer.SystemTimer#advanceClock来从时间轮中获取已超时的任务，并更新时间轮的"当前时间"指针。

四. 总结

才疏学浅，未能窥其十之一二，随时欢迎各位交流补充。若文章质量还算及格，可以点赞收藏加以鼓励，后续我继续更新。

另外，也可以在目录中找到同系列的其他文章：

感谢阅读。

浅析源码 golang kafka sarama包(一)如何生产消息以及通过docker部署kafka集群with kraft

本文将深入探讨Golang中使用sarama包进行Kafka消息生产的过程，以及如何通过Docker部署Kafka集群采用Kraft模式。首先，我们关注数据的生产部分。

在部署Kafka集群时，我们将选择Kraft而非Zookeeper，通过docker-compose实现。集群中，理解LISTENERS的ones源码含义至关重要，主要有几个类型：

Sarama在每个topic和partition下，会为数据传输创建独立的goroutine。生产者操作的起点是创建简单生产者的方法，接着维护局部处理器并根据topic创建topicProducer。

在newBrokerProducer中，run()方法和bridge的匿名函数是关键。它们反映了goroutine间的巧妙桥接，通过channel在不同线程间传递信息，体现了goroutine使用的精髓。

真正发送消息的过程发生在AsyncProduce方法中，这是数据在三层协程中传输的环节，虽然深度适中，但需要仔细理解。

sarama的架构清晰，但数据传输的核心操作隐藏在第三层goroutine中。输出变量的使用也有讲究：当output = p.bridge，它作为连接内外协程的桥梁；output = nil则关闭channel，output = bridge时允许写入。

Kafka Logcleaner源码分析

Kafka日志保留策略包括按时间/大小和compact两种。Logcleaner遵循compact策略清理日志，只保留最新的消息，当多个消息具有相同key时，只保留最新的一个。

每个日志由两部分组成：clean和dirty。dirty部分可以进一步划分为cleanable和uncleanable。uncleanable部分不允许清理，包括活跃段和未达到compact延迟时间的段。

清理过程由后台线程定期执行，选择最脏的日志进行清理，脏度由dirty部分字节数与总字节数的比例决定。清理前，pudin源码Logcleaner构建一个key->last_offset映射，包含dirty部分的所有消息。清理后，日志文件过滤掉过期消息，并合并较小的连续段为较大文件。

payload为null的消息被Logcleaner删除，这类消息在topic配置的时间内保留，然后被清理。清理过程需与幂等性和事务性生产者兼容，保留活跃生产者最后一批消息，直到产生新消息或生产者不活跃。只清理提交或终止事物中的消息，未提交事物中的消息不清理。

Logcleaner通过cleanOrSleep方法启动清理，选择最脏日志，调用clean清理并合并段。在清理前计算tombstone的移除时间，确保在clean部分驻留一定时间后移除。清理过程包括构建offset映射，分组段文件并清理合并。

Logcleaner的清理逻辑确保了高效和一致的日志管理，助力Kafka系统稳定运行。

Kafka消费者源码：重平衡（1）-初始化与FIND_COORDINATOR

在Kafka 2.5.2的消费者组中，重平衡是关键，它定义了消费者如何根据订阅关系调整对Topic分区的分配。当消费者数量、订阅的Topic或GroupCoordinator所在的Broker发生变更时，会触发重平衡。

消费者组状态由GroupState类管理，共有五个状态：Empty（无成员）、PreparingRebalance（加入中）、CompletingRebalance（等待分配）、Stable（已平衡）和Dead（元数据已删除）。状态间的转换基于预先定义的前置状态。例如，从Empty到PreparingRebalance，预示着重平衡的开始。

重平衡过程分为几个步骤，首先是消费者和Broker之间的协调。服务端启动时，GroupCoordinator组件即已就绪，而Consumer通过ConsumerCoordinator与之通信。在启动时，消费者首先会通过FindCoordinatorRequest找到GroupCoordinator，通过最小负载节点发送请求，然后服务端确定哪个Broker负责协调，如groupId的hash值对consumer_offsets分区数取模确定。

一旦找到GroupCoordinator，消费者会发送JoinGroupRequest。后续步骤如SYNC_GROUP和HEARTBEAT确保消费者与协调器保持同步。这部分详细内容在后续的文章中会进一步探讨。

源码解析kafka删除topic

本文以kafka0.8.2.2为例，解析如何删除一个topic以及其背后的关键技术和源码实现过程。

删除一个topic涉及两个关键点：配置删除参数以及执行删除操作。

首先，配置参数`delete.topic.enable`为`True`，这是Broker级别的配置，用于指示kafka是否允许执行topic删除操作。

其次，执行命令`bin/kafka-topics.sh --zookeeper zk_host:port/chroot --delete --topic my_topic_name`，此命令指示kafka删除指定的topic。

若未配置`delete.topic.enable`为`True`，topic仅被标记为删除状态，而非立即清除。此时，通常的做法是手动删除Zookeeper中的topic信息和日志，但这仅会清除Zookeeper的数据，并不会真正清除kafkaBroker内存中的topic数据。因此，最佳做法是配置`delete.topic.enable`为`True`，然后重启kafka。

接下来，我们介绍几个关键类和它们在删除topic过程中的作用。

1. **PartitionStateMachine**：该类代表分区的状态机，决定分区的当前状态及其转移。状态包括：NonExistentPartition、NewPartition、OnlinePartition、OfflinePartition。

2. **ReplicaManager**：负责管理当前机器的所有副本，处理读写、删除等具体操作。读写操作流程包括获取partition对象，再获取Replica对象，接着获取Log对象，并通过其管理的Segment对象将数据写入、读出。

3. **ReplicaStateMachine**：副本的状态机，决定副本的当前状态和状态之间的转移。状态包括：NewReplica、OnlineReplica、OfflineReplica、ReplicaDeletionStarted、ReplicaDeletionSuccessful、ReplicaDeletionIneligible、NonExistentReplica。

4. **TopicDeletionManager**：管理topic删除的状态机，包括发布删除命令、监听并开始删除topic、以及执行删除操作。

在删除topic的过程中，分为四个阶段：客户端执行删除命令、未配置`delete.topic.enable`的流水、配置了`delete.topic.enable`的流水、以及手动删除Zookeeper上topic信息和磁盘数据。

客户端执行删除命令时，会在"/admin/delete_topics"目录下创建topicName节点。

未配置`delete.topic.enable`时，topic删除流程涉及监听topic删除命令、判断`delete.topic.enable`状态、标记topic为不可删除、以及队列删除topic任务。

配置了`delete.topic.enable`时，额外步骤包括停止删除topic、检查特定条件、更新删除topic集合、激活删除线程、执行删除操作，如解除分区变动监听、清除内存数据结构、删除副本数据、删除Zookeeper节点信息等。

关于手动删除Zookeeper上topic信息和磁盘数据，通常做法是删除Zookeeper的topic相关信息及磁盘数据，但这可能导致部分内存数据未清除。是否会有隐患，需要进一步测试。

总结而言，kafka的topic删除流程基于Zookeeper实现，通过配置参数、执行命令、管理状态机以及清理相关数据，以实现topic的有序删除。正确配置`delete.topic.enable`并执行删除操作是确保topic完全清除的关键步骤。

Spring Kafka：Retry Topic、DLT 的使用与原理

Spring Kafka 在核心功能之外，扩展了Retry Topic和DLT（死信队列）的支持。这个增强在spring-kafka 2.7.及更高版本中可用，早期版本则不支持。

默认情况下，当消费逻辑遇到异常，Spring Kafka会进行快速重试，最多次，每次无间隔。如果重试后依旧失败，它会尝试commit记录。重试的机制基于SeekUtils#doSeeks，可以通过自定义SeekToCurrentErrorHandler来调整，例如设置重试间隔和失败后将消息发送到DLT。

定制SeekToCurrentErrorHandler后，异常后的处理会间隔秒重试3次，如果所有尝试都失败，消息会被转移到死信队列。这样的设计避免了单个消息重试占用消费线程，而是通过专用的retry线程处理。

开启Retry Topic和DLT的使用可以通过注解和全局配置实现。@RetryableTopic注解可以应用在`@KafkaListener`方法上，设置默认重试3次，间隔1秒，如果重试后依然失败，消息将转到死信队列。用户还可以自定义死信处理逻辑。

配置方面，可以调整重试次数、延迟时间和死信策略，支持Spring EL表达式。`fixedDelayTopicStrategy`的选择很重要，但具体策略可以根据需求调整。

源码解析显示，Spring Kafka通过暂停和恢复分区实现延迟重试。消息在Retry Topic中带有延迟时间，监听器在消费前检查并暂停分区，确保在期望的时间重新开始消费。这种设计有助于控制消息的延迟时间。

关于Retry Topic策略，FixedDelayStrategy有MULTIPLE_TOPICS和SINGLE_TOPIC两种。前者会创建多个主题以实现指数级增长的重试时间，而后者保持固定延迟，但可能在分区分配上产生不一致。如何配置多个retry线程，可以根据需要调整KafkaListener的并发设置或自定义ContainerFactory。

对于更深入的学习和实践，可以参考GitHub上的Spring Kafka示例：github.com/TavenYin/tav...

上一条：嚴正抗議！中國啟用W122、W123航路我民航局：要求儘速協商
下一条：揪波音飛安問題　吹哨者：人身安全受威脅

【色修源码】【ransac源码】【strcmp源码】kafka源码原理

相关文章