职业技能 | etcd实战课
etcd实战课 – etcd 核心原理到大规模实践
作者简介:
唐聪,腾讯云资深工程师,etcd 活跃贡献者。
唐聪一直从事于内部公共组件建设,曾负责大规模排行榜、Redis 平台建设,目前负责腾讯云及内部公共 etcd 平台的建设与维护,是腾讯云 etcd 负责人。
他主导了腾讯 etcd 平台从 0 到 1 的建设,解决过众多大规模业务增长过程中遇到的存储稳定性、可扩展性等痛点,拥有万级 Kubernetes 和 etcd 集群规模的实战、治理经验。同时,他也是 2020 年 etcd 社区全球 Top3 的活跃贡献者,修复了 etcd 数据不一致、内存泄露、死锁、panic 等众多问题,提升了 etcd 在大规模数据场景下的启动、读性能等。
课程简介:
随着 Kubernetes 成为容器编排领域霸主,etcd 也越来越火热。目前,etcd 的 GitHub star 数已超过 34.2K,它的应用场景相当广泛,从服务发现到分布式锁,从配置存储到分布式协调等等。可以说,etcd 已经成为了云原生和分布式系统的存储基石。
另外,etcd 作为最热门的云原生存储之一,在腾讯、阿里、Google、AWS、美团、字节跳动、拼多多、Shopee 等公司都有大量的应用,覆盖的业务可不仅仅是 Kubernetes 相关的各类容器产品,更有视频、推荐、安全、游戏、存储、集群调度等核心业务。
但是很多同学在使用 Kubernetes、etcd 的过程中,或多或少都会遇到下面这些问题:
- etcd Watch 机制能保证事件不丢吗? (原理类)
- 哪些因素会导致你的集群 leader 发生切换呢? (稳定性类)
- 为什么基于 Raft 实现的 etcd 还可能会出现数据不一致呢? (一致性类)
- 当你在一个 namespace 下创建了数万个 Pod/CRD 资源时,同时频繁通过标签去查询指定 Pod/CRD 资源时,APIServer 和 etcd 为什么扛不住呢? (最佳实践类)
基于此,唐聪老师从自己万级 Kubernetes 集群和 etcd 集群规模的治理相关经验出发,把 etcd 的学习过程分为了大中小三个目标,让你由小及大,从掌握一个个知识点的小目标出发,做到了解、熟练使用 etcd 的中等目标,最终能够完美解决业务过程中的各类痛点。
模块设置
课程主体分为两大模块,分别是基础篇和实践篇。
基础篇
基础篇会帮助你建立起对 etcd 的整体认知,搞懂读写请求、各个核心特性背后的原理,为后面的实践篇打下基础。
另外,基础篇也是对一个中小型分布式存储系统从 0 到 1 的实现案例解读,学习它你收获的不仅仅是 etcd,更是如何构建分布式存储系统的理论知识。
实践篇
实践篇将带你从 0 到 1 亲手参与构建一个简易的分布式 KV 数据库,进一步提升你对分布式存储系统的认知。为你分析 etcd 在 Kubernetes 中的应用,让你对 Kubernetes 原理有更深层次的理解。
当然,顾名思义,实践篇还会为你解读 etcd 在实际使用过程中可能会出现的各类典型问题,帮助你提前避坑,遇到类似问题时能独立分析、解决。
课程大纲:
- 为什么你要学习etcd?
- etcd的前世今生:为什么Kubernetes使用etcd?
- 基础架构:etcd一个读请求是如何执行的?
- Raft协议:etcd如何实现高可用、数据强一致的?
- 鉴权:如何保护你的数据安全?
- 租约:如何检测你的客户端存活?
- MVCC:如何实现多版本并发控制?
- Watch:如何高效获取数据变化通知?
- 事务:如何安全地实现多key操作?
- boltdb:如何持久化存储你的key-value数据?
持续更新中…
热门平台:得到2024 看理想 樊登读书2024 混沌大学2024
联系微信:11628983 或扫描下方二维码  获取资源  电子书目录  课程目录
热搜 吴军课程 生财有术第八期 时寒冰·2024 AI写作绘画 冯唐 李笑来 看理想 凯叔 ChatGPT 王东岳 电子书