李鹤 - 个人中心 - 腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

李鹤

LV1

全部文章

调度器性能调优系列
线上调度器触发资源使用量报警，在定位问题的过程中又系统性的看了最新的 scheduler framework 的实现，以及涉及到的一些用来优化性能的 PR，这里...
李鹤 2024-08-182024-08-18 16:24:01
遍历、插件、数据、性能、优化
f**king k8s - pod namespace
太长不看版：在拦截 pod 创建请求时，在业务逻辑中不要直接依赖 admission request 的 pod namespace 属性。可以使用 admin...
李鹤 2024-05-232024-05-23 14:19:33
对象、服务、配置、设计、nginx
k8s watch 丢事件 - 3
v1.27 的 K8s，在 kube-apiserver 的日志中会看到 “etcd event received with PrevKv=nil” 的字样，资...
李鹤 2024-03-232024-03-23 09:59:37
事件、数据、watch、服务端、客户端
k8s watch 丢事件 - 2
v1.27 的 K8s，在 kube-apiserver 的日志中会看到 “etcd event received with PrevKv=nil” 的字样，资...
李鹤 2024-03-102024-03-10 09:23:46
watch、客户端、事件、数据、异常
k8s watch 丢事件 - 1
Kube-apiserver 提供了 Watch API 来支持实时接收资源对象变化的功能，也是 Informer 实现的基础，那么我们通过 Watch 或者 ...
李鹤 2024-03-032024-03-03 10:48:27
对象、事件、数据、原理、watch
kube-apiserver 又 Panic 了 - handler
Kube-apiserver 在处理外部请求时发生不可恢复的报错，直接 Fatal 退出运行。看日志调用堆栈，会发现 concurrent map iterat...
李鹤 2024-02-052024-02-05 07:56:33
header、并发、对象、接口、handler
k8s 越来越复杂了吗？
这个约定存在的原因是为了保持开启 WatchCache 功能前后 list 请求返回结果的一致性。在关闭 WatchCache 功能的情况下，请求直接透传给 E...
李鹤 2024-01-232024-01-23 08:23:06
客户端、内存、排序、数据、对象
k8s: 到底谁才是草台班子？
大家在对 2023 年诸多互联网公司故障的总结中多次提到了控制 “爆炸半径”，几乎都在说缩小集群规模，那除了缩小集群规模外还有没有其他办法呢？如果一出问题就通过...
李鹤 2024-01-072024-01-07 08:55:52
服务器、集群、客户端、连接、内存
一条 Watch 请求的一生
前面已经通过一个系列来介绍 kube-apiserver cache 相关内容，本篇旨在通过分析 Watch 请求的生命周期把前面涉及到的关键内容串联起来，系统...
李鹤 2023-12-282023-12-28 09:51:13
event、watch、服务端、客户端、数据
kube-apiserver 连接数也会影响内存？
之前从资源对象的获取方式、序列化、深拷贝的角度分别分析了对 kube-apiserver 内存使用量的影响以及社区是如何进行优化的，这一篇围绕网络连接展开分析其...
李鹤 2023-12-202023-12-20 10:47:53
服务端、集群、客户端、连接、内存
从容器调度到降本增效
前一篇中介绍了大规模容器平台的资源预算、精算、核算，本篇围绕容器调度开展。容器调度旨在有效地协调和管理系统中的有限资源，在保障服务 SLO 的前提下，满足任务和...
李鹤 2023-12-122023-12-12 14:26:59
容器、服务、工作、基础、系统
让子弹飞一会儿
近期互联网故障频发，各大公众号各抒己见，指点江山，激扬文字，颇有百花齐放，百家争鸣的味道。一众吃瓜群众也是对此乐此不疲，津津乐道。
李鹤 2023-12-072023-12-07 13:53:33
容器、运维、工作、管理、集群
kube-apiserver 内存优化进阶
前面我们已经对 kube-apiserver 内存消耗进行了阐述，文中最后提到了使用流式的请求来支持 List 的效果，从而实现对于单个请求来说，空间复杂度从...
李鹤 2023-12-032023-12-03 12:05:40
缓存、对象、内存、序列化、优化
从故障中我们学到了什么？
继阿里云之后，滴滴崩了上了热搜，故障原因了解了一些，会在文章最后谈到。近期国内多个公司发生了 P0 事故，当然也包括我司，只不过可能不出名，很多人不知道而已。本...
李鹤 2023-12-032023-12-03 12:01:49
容器、服务、集群、设计、系统
从 ListWatch 到 WatchList
前面我们已经对 kube-apiserver 内存消耗进行了阐述，文中最后提到了使用流式的请求来支持 List 的效果，从而实现对于单个请求来说，空间复杂度从 ...
李鹤 2023-11-112023-11-11 10:42:59
对象、服务端、客户端、事件、数据
Kubernetes 陈年老 bug - Stale Read
前两篇已经介绍过 Informer 和 Cacher 的实现，也介绍了其中存在的一些问题，本篇主要针对 Stale read 问题展开，分析新版 Informe...
李鹤 2023-11-042023-11-04 10:12:54
kubernetes、缓存、bug、服务端、数据
kube-apiserver 又 OOM 了？
前一篇已经介绍了 Informer 的实现，Informer 对 kube-apiserver 发起了 list 和 watch 请求。我们知道大规模集群下，k...
李鹤 2023-10-282023-10-28 09:38:18
缓存、客户端、内存、数据、优化
你真的搞懂 Informer 了吗？
Informer 作为 client-go 的核心，网上有众多的源码分析，原理解析相关文章，可以教给大家如何"正确"的使用 Informer。当然其前提是在 I...
李鹤 2023-10-162023-10-16 08:19:00
对象、内存、事件、数据、同步
Kubernetes 陈年老 bug - 绑核
最近遇到一个线上问题，使用了 lxcfs 的容器，跑在 cgroup v2 的机器上时，在容器内使用 top 或者 htop 看到的核数和 cpu 使用率有问题...
李鹤 2023-09-162023-09-16 08:20:03
容器、kubernetes、bug、container、重构
high QPS for configmap GET requests in kube-apiserver - 3
线上 k8s 集群 kube-apiserver 的 ConfigMap Get 操作 QPS 较高，且同时间段 Etcd 中 ConfigMap 资源的 Ge...
李鹤 2023-09-092023-09-09 15:29:23
缓存、get、requests、集群、数据

12 3 4 下一页

个人简介

虾皮北京
kinitiras, kluster-capacity 作者；kubernetes、karmada 共享者；
kubernetes
大连理工大学 | 软件学院
https://www.likakuli.com
北京
加入社区时间：2018-04-27

个人成就

获得 159 次赞同
文章被阅读 41.3K 次

关注了：2关注者：17