6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

写在前面

大家都知道历史上有段佳话叫“司马相如和卓文君”。“皑如山上雪,皎若云间月”。卓文君这么美,却也抵不过多情女儿薄情郎。

  司马相如因一首《子虚赋》得汉武帝赏识,飞黄腾达之后便要与卓文君“故来相决绝”,寄来给家乡留守的妻子一封《两地书》,上面只有一行数字:“一二三四五六七八九十百千万。”意义是:无亿,我已经无意于你啦。

  卓文君看了这封信也不示弱,回了一首《怨郎诗》,司马相如看了发现虽然我是靠写诗吃饭的。要说写诗还是我媳妇厉害,于是亲自将卓文君迎回长安。

  卓文君其实是个二婚。头婚的丈夫结婚不久就死了。这估计也是司马相如后来想对她始乱终弃的原因之一。但是文君老奶奶是有实力的。人家第一敢连夜私奔,第二还hold得住老公。就我这文采,你想不要我,你大Boss汉武帝都会不高兴的。

  正是卓文君的才智,不仅成就了她自己,更成就了他老公。诗圣杜甫都用“茂陵多病后,尚爱卓文君”来赞美他们的爱情。如果司马相如娶了别人,那曲《凤求凰》就可以看出,骨子里胡兰成一样的人物。

  今天的主题不是爱情不是诗,咱们来谈谈K8s(Kubernetes):

  一个目标:容器操作;两地三中心;四层服务发现;五种Pod共享资源;六个CNI常用插件;七层负载均衡;八种隔离维度;九个网络模型原则;十类IP地址;百级产品线;千级物理机;万级容器;相如无亿,K8s有亿:亿级日服务人次。

K8s(Kubernetes)理论篇

这么理解集群控制器,能行!

  • 控制器原理
  • 简易的冰箱
  • 统一入口
  • 控制器
  • 控制器管理器
  • Sharednfomer
  • ListWatcher
  • 服务控制器
  • 路由控制器

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

集群网络详解

  • 鸟瞰
  • 集群网络搭建
  • 通信

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

集群伸缩原理

  • 节点增加原理
  • 手动添加已有节点
  • 自动添加已有节点
  • 集群扩容
  • 自动伸缩
  • 节点减少原理

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

认证与调度

  • “关在笼子里的”程序
  • 得其门而入
  • 择优而居

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

集群服务的三个要点和一种实现

  • 自带通信员
  • 把服务照进现实
  • 一种现实

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

镜像拉取这件小事

  • 理解OAuth2.0协议
  • Docker扮演的角色
  • K8s实现的私有镜像自动拉取
  • 阿里云实现的Acr credential helper

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

K8s(Kubernetes)实践篇

读懂这一篇,集群节点不下线

  • 问题一直在发生
  • 需要知道的 Kubernetes 知识
  • 容器 runtime
  • 什么是 Dbus
  • Systemd 是硬骨头
  • 问题修复

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

节点下线姊妹篇

  • 大逻辑
  • 就绪三分钟
  • 止步不前的 PLEG
  • 无响应的 Terwayd
  • 修复

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

我们为什么会删除不了集群的命名空间?

  • 背景
  • 从集群入口开始
  • Controller 在做什么?
  • 再次回到集群入口
  • 节点与 Pod 之间的通信
  • Route Controller 为什么不工作?
  • 集群节点访问云资源
  • 问题大图

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

阿里云ACK产品安全组配置管理

  • 安全组在 ACK 产品中扮演的角色
  • 安全组与 ACK 集群网络
  • 怎么样管理 ACK 集群的安全组规则
  • 限制集群访问外网
  • IDC 与集群互访
  • 使用新的安全组管理节点
  • 典型问题与解决方案
  • 使用多个安全组管理集群节点
  • 限制集群访问公网或者运营级 NAT 保留地址
  • 容器组跨节点通信异常

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

二分之一活的微服务

  • 二分之一活的微服务
  • 绕不过去的大图
  • 代理与代理的生命周期管理
  • 就绪检查的实现
  • 控制面和数据面
  • 简单的原因

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

半夜两点Ca证书过期问题处理惨况总结

  • 不断重启的 Citadel
  • 一般意义上的证书验证
  • 大神定理
  • Citadel 证书体系
  • 犯的错

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船

6个核心原理+6个典型问题,解决了k8s(Kubernetes)在阿里云上的大翻船