Isito从懵圈到熟练 - 半夜两点Ca证书过期问题处理惨况总结

shengdong 2019-11-25 1964人浏览

11月22号半夜2点,被值班同学的电话打醒。了解下来,大概情况是,客户某一台K8s集群节点重启之后,他再也无法创建Istio虚拟服务和Pod了。 一来对Istio还不是那么熟悉,二来时间可能有点晚,...

K8S从懵圈到熟练 - 节点下线姊妹篇

shengdong 2019-09-09 5723人浏览

之前分享过一例集群节点NotReady的问题。在那个问题中,我们的排查路劲,从K8S集群到容器运行时,再到sdbus和systemd,不可谓不复杂。那个问题目前已经在systemd中做了修复,所以基本...

K8S从懵圈到熟练 – 集群服务的三个要点和一种实现

shengdong 2019-07-26 5532人浏览

以我的经验来讲,理解K8S集群服务的概念,是比较不容易的一件事情。尤其是当我们基于似是而非的理解,去排查服务相关问题的时候,会非常不顺利。 这体现在,对于新手来说,ping不通服务的IP地址这样基础...

K8S从懵圈到熟练 - 我们为什么会删除不了集群的命名空间?

shengdong 2019-07-22 7834人浏览

阿里云售后技术团队的同学,每天都在处理各式各样千奇百怪的线上问题。常见的有,网络连接失败,服务器宕机,性能不达标,请求响应慢等。但如果要评选,什么问题看起来微不足道事实上却足以让人绞尽脑汁,我相信答案...

K8S从懵圈到熟练 – 这么理解集群控制器,能行!

shengdong 2019-06-13 16320人浏览

当我们尝试去理解K8S集群工作原理的时候,控制器肯定是一个难点。这是因为控制器有很多,具体实现大相径庭;且控制器的实现用到了一些较为晦涩的机制,不易理解。但是,我们又不能绕过控制器,因为它是集群的“大...

K8S从懵圈到熟练 – 集群伸缩原理

shengdong 2019-05-31 3212人浏览

阿里云K8S集群的一个重要特性,是集群的节点可以动态的增加或减少。有了这个特性,集群才能在计算资源不足的情况下扩容新的节点,同时也可以在资源利用率降低的时候,释放节点以节省费用。 这篇文章,我们讨论...

K8S从懵圈到熟练 – 集群网络详解

shengdong 2019-05-30 3728人浏览

阿里云K8S集群网络目前有两种方案,一种是flannel方案,另外一种是基于calico和弹性网卡eni的terway方案。Terway和flannel类似,不同的地方在于,terway支持Pod弹性...

K8S从懵圈到熟练:认证与调度

shengdong 2019-04-21 2621人浏览

不知道大家有没有意识到一个现实,就是大部分时候,我们已经不像以前一样,通过命令行,或者可视窗口来使用一个系统了。现在我们上微博、或者网购,操作的其实不是眼前这台设备,而是一个又一个集群。 通常,...

K8S从懵圈到熟练:读懂这一篇,集群节点不下线

shengdong 2019-04-21 5699人浏览

排查完全陌生的问题,完全不熟悉的系统组件,是售后工程师的一大工作乐趣,当然也是挑战。今天借这篇文章,跟大家分析一例这样的问题。排查过程中,需要理解一些自己完全陌生的组件,比如systemd和dbus。...

上一页 1 下一页 1
GO
还想看哪方面的经验分享?去反馈>>

也有实践经验想要分享?欢迎投稿

到cloudshare@service.aliyun.com

扫一扫,关注阿里云支持与服务

阿里云支持与服务|

188 篇文章

张医博|

73 篇文章

仙游|

32 篇文章

牧原|

31 篇文章

宁希波若|

23 篇文章

驻云科技|

18 篇文章

手辨|

17 篇文章

田杰|

16 篇文章

烨烁|

15 篇文章

何昔|

15 篇文章

立即注册,享免费套餐