【彩虹量能线源码】【Javassm商城项目源码】【看android源码工具】zookeeper源码epoch-皮皮网

【彩虹量能线源码】【Javassm商城项目源码】【看android源码工具】zookeeper源码epoch

时间:2024-12-30 00:10:31 来源：战神软件源码

1.修复 ZooKeeper 数据视不一致
2.ZK currentEpoch&acceptedEpoch
3.Zookeeper çè®ºåºç¡

zookeeper源码epoch

修复 ZooKeeper 数据视不一致

ZooKeeper是一个开源的分布式系统协调中间件，常用于实现选主、pub/sub模式、分布式锁等功能。ZooKeeper的核心是Zab协议，即ZooKeeper原子广播协议。彩虹量能线源码Zookeeper通过ZKDatabase保存数据，数据结构是DataTree，它维护了一个路径到DataNode的哈希表。Snapshot是DataTree序列化后保存在磁盘的一系列文件，而启动时Zookeeper会使用磁盘上的Snapshot在内存中重建DataTree。

Zookeeper的客户端在进行读操作时，会从本地服务器获取数据，与Raft模型中的非领导者节点不同。每个事务都有一个zxid标识，它是全局唯一的位整数，由位的Javassm商城项目源码Epoch和位的自增ID（Counter）组成。每次事务提交，Counter加1，当有新成员当选领导者时，Epoch加1。当zxid溢出时，会触发选举并重置为0。

ZooKeeper提供了一个类似文件系统的API，用于组织和操作Znode。看android源码工具Znode以树状结构排列，并支持create、delete、getData和setData等操作。

ZooKeeper的一致性保证属于ordered sequential consistency，即在写操作中保证线性一致性，在读操作中只保证顺序一致性。这意味着，eclipse推箱子源码客户端A更新ZnodeZ后，客户端B读取Z时，B可能无法立即读到最新值，但在读到最新值后，B不应该再读到任何过期数据。

在解决服务在ZooKeeper节点A上更新数据后，一段时间内读取到过期数据的问题时，发现了一个名为ZOOKEEPER-的键盘钩子记录源码类似问题。该问题在新版本的ZooKeeper中已经修复。通过分析ZooKeeper的工作过程，我们可以了解到其Zab协议包括选举、恢复和广播三个阶段。

每个成员在启动时会进入选举状态，选出lastZxid最大的节点作为领导者。领导者进入恢复阶段，首先通过选票找到当前领导者，然后与领导者同步已提交事务，确保本地数据副本与领导者一致。同步策略包括DIFF Sync、TRUNC Sync和SNAP Sync。DIFF Sync通过发送一系列的PROPOSAL和COMMIT消息进行数据同步。TRUNC Sync通过删除比leader更大的事务进行同步。SNAP Sync则通过发送快照进行数据恢复。在恢复完成后，领导者向follower发送NEWLEADER消息，等待多数follower确认后，发送UPTODATE消息，follower接收到UPTODATE并确认后开始对外提供服务。

当follower在接收到NEWLEADER消息后，ACK NEWLEADER之前需要持久化所有未提交的DIFF Sync Proposal。这样可以确保在领导者永久下线并最终导致客户端认为已提交请求在同步过程中被丢弃的情况下，数据一致性得到保证。通过这种方式，ZooKeeper成功修复了ZOOKEEPER-问题。

在理解了问题的原因和修复方式后，我司通过将关键的patch回滚到v3.5.9版本，并从3.4.升级到3.5.9来解决实际问题。经过一系列的调试和修正，最终解决了Socket关闭导致的单测失败问题，完成了对ZOOKEEPER-问题的修复及版本回滚。

总结来看，分布式系统的设计和维护充满挑战，需要细致入微的调试和深入的理解。通过这次经验，我深刻认识到分布式系统的复杂性和工作背后的辛勤付出，同时也对维护和优化分布式系统环境的重要性有了更深刻的认识。

ZK currentEpoch&acceptedEpoch

Leaders epoch, 6 is less than accepted epoch, 9

æ¥ç/data/zookeeper/data/version-2ç®å½ä¸ç¡®å®æ2ä¸ªæä»¶,åå«æ¯

acceptedEpochãcurrentEpoch,è¿2ä¸ªæä»¶éçå¼é½æ¯9

è¿æ¯ä¸ºä»ä¹å¢?è¿ä¸¤ä¸ªæä»¶æ¯åä»ä¹ç?

.atlassian.jira.plugin.system.issuetabpanels%3Acomment-tabpanel#comment-

è¿ä¸¤ä¸ªåéä¸»è¦æ¯ä¸ºäºè§£å³éç¾¤å¤±è´¥æ¢å¤çåºæ¯

As mentioned, the implementation up to version 3.3.3 has not included epoch variables acceptedEpoch and currentEpoch. This omission has generated problems [5]

(issue ZOOKEEPER- in Apacheâs issue tracking system) in a production version

and was noticed by many ZooKeeper clients. The origin of this problem is at the beginning of Recovery Phase (Algorithm 4 line 2), when the leader increments its epoch

(contained in lastZxid) even before acquiring a quorum of successfully connected followers (such leader is called false leader ). Since a follower goes back to FLE if its

epoch is larger than the leaderâs epoch (line ), when a false leader drops leadership

and becomes a follower of a leader from a previous epoch, it finds a smaller epoch (line

ç®åæ¥è¯´å°±æ¯: ä»¥åæ¯ä¸åºåacceptedEpoch å currentEpochçï¼ä»¥åepochæ¯ç´æ¥ä»zxidä¸åä½éæåçãä½è¿ä¼å¯¼è´ä¸ä¸ªé®é¢ï¼åè®¾æä¸ä¸ªæå¡å¨s1, s2, s3. éç¾¤s1ås2åå¾èç³»ï¼ä¸s1ä¸ºleaderï¼s3ä¸ºLOOKING:

s2éå¯ï¼å ä¸s3çéç¥¨ï¼å°s3éä¸ºleader

s3ä½ä¸ºfolloweråç°èªå·±çepochæ¯æ§leaderçepochè¿å¤§ï¼ä¾¿ååå°FLE

è¿ä¸ªç¼åæ¶é´çåçæ¯:å¿è·³å

é£ä¹acceptedEpochåcurrentEpochæ¯æä¹è§£å³æéæ¢å¤é®é¢çå¢?

if (newEpoch > self.getAcceptedEpoch()) {

wrappedEpochBytes.putInt((int) self.getCurrentEpoch());

self.setAcceptedEpoch(newEpoch);

} else if (newEpoch == self.getAcceptedEpoch()) {

// since we have already acked an epoch equal to the leaders, we cannot ack

// again, but we still need to send our lastZxid to the leader so that we can

// sync with it if it does assume leadership of the epoch.

// the -1 indicates that this reply should not count as an ack for the new epoch

wrappedEpochBytes.putInt(-1);

} else {

throw new IOException("Leaders epoch, "

+ newEpoch

+ " is less than accepted epoch, "

+ self.getAcceptedEpoch());

ç´æ¥æ¥é,å¼ºå¶ä¸åè®¸å¤§äºleaderçepochçèç¹å å¥éç¾¤

Zookeeper çè®ºåºç¡

zookeeper çå®ç½ï¼ mit åè½ãå·ä½çä¸é¢çæè¿°ã

Paxos ç®æ³ç 3PC æ§è¡è¿ç¨ååä¸ºä¸ä¸ªé¶æ®µï¼åå¤é¶æ®µ prepareãæ¥åé¶æ®µ acceptï¼ä¸æäº¤é¶æ®µ commitã

ZAB ï¼Zookeeper Atomic Broadcastï¼zk ååæ¶æ¯å¹¿æåè®®ï¼æ¯ä¸ä¸º ZooKeeper è®¾è®¡çä¸ç§æ¯æå´©æºæ¢å¤çååå¹¿æåè®®ï¼å¨ Zookeeper ä¸ï¼ä¸»è¦ä¾èµ ZAB åè®®æ¥å®ç°åå¸å¼æ°æ®ä¸è´æ§ã

å¦å¤ï¼ZAB è¿ä½¿ç¨ Google ç Chubby ç®æ³ä½ä¸ºåå¸å¼éçå®ç°ï¼è Google ç Chubby ä¹æ¯ Paxos ç®æ³çåºç¨ã

ä½ Leader éä¸¾æ¯ Paxos ç®æ³çä½ç°ï¼å ä¸º Leader å®æºåï¼ææ Follower åå¯æäº¤ææ¡ï¼ å®ä»¬å¨æåé½æ¯âæéæâãå¶å±äº 2PC æäº¤ã

Learnerï¼å¦ä¹ èï¼åæ¥èã

Learner = Follower + Observer

QuorumPeer = Participant = Leader + Follower

å¨ ZAB ä¸æä¸ä¸ªå¾éè¦çæ°æ®ï¼

AãserverId

Bã é»è¾æ¶é

é»è¾æ¶éï¼Logicalclockï¼æ¯ä¸ä¸ªæ´åæ°ï¼è¯¥æ¦å¿µå¨éä¸¾æ¶ç§°ä¸º logicalclockï¼èå¨éä¸¾ç»æåç§°ä¸ºepochãå³ epoch ä¸ logicalclock æ¯åä¸ä¸ªå¼ï¼å¨ä¸åæåµä¸çä¸ååç§°ã

Aãéç¾¤å¯å¨ä¸ç Leader éä¸¾

Bã å®æºåç Leader éä¸¾

å·ä½è¿ç¨å¦ä¸ï¼

Leader ä¸ä¿åç Observer åè¡¨å¶å®æä¸¤ä¸ªï¼

allï¼åå«ææ Observerã

serviceï¼å·²ç»å®æäºä» Leader åæ¥æ°æ®çä»»å¡ãservice <= allãå¶æ¯å¨æçã

Leader ä¸ä¿åç Follower åè¡¨å¶å®ä¹æä¸¤ä¸ªï¼

allï¼è¦æ±å¶ä¸å¿é¡»æè¿åç Follower åLeader åé¦ACK

serviceï¼

æ£å¸¸æåµä¸ï¼å½ Leader æ¶å°è¶è¿åæ° Follower ç ACKs åï¼å°±ååä¸ª Follower å¹¿æCOMMIT æ¶æ¯ï¼æ¹ååä¸ªServer æ§è¡è¯¥åæä½äºå¡ãå½åä¸ªServer å¨æ¥æ¶å°Leader çCOMMIT æ¶æ¯åå°±ä¼å¨æ¬å°æ§è¡è¯¥åæä½ï¼ç¶åä¼åå®¢æ·ç«¯ååºåæä½æåã

BASE æ¯Basically Availableï¼åºæ¬å¯ç¨ï¼ãSoft stateï¼è½¯ç¶æï¼å Eventually consistentï¼æç»ä¸è´æ§ï¼ä¸ä¸ªçè¯çç®åã

æå¤±ååºæ¶é´ï¼

æå¤±åè½ï¼

ä»è¾¾å°ä¸è´æ§çæ¶é´è§åº¦æ¥ååï¼å¯ä»¥åä¸ºï¼

åä»å®¢æ·ç«¯è®¿é®å°çåå®¹è§åº¦æ¥ååï¼å¯ä»¥åä¸ºï¼

ï¼1ï¼æåµä¸

ï¼2ï¼æåµäº

ï¼5ï¼æåµäº

想知道更多资讯>>>点击进入“焦点”频道