Kubeservice博客

是非审之于己,毁誉听之于人,得失安之于数

性能调优之 Kubenetes Pod 部署&滚动升级调优

Kubenetes Pod 部署&滚动升级调优

Kubenetes Pod 部署&滚动升级 调优 Pod 在滚动升级部署中部署pod个数到可用指标更新速率 是衡量 Kubenetes 调度能力最核心指标 举个例子: rollingUpdate: maxSurge: 25% #每个滚动更新的实

技术调优之 大规模 Kubernetes 集群调优设置

大规模 Kubernetes 集群调优设置

大规模 Kubernetes 集群调优设置 0. 前置条件 0.1 网段划分 首先集群网段划分,支持5000+ Node, 10000+ Service 和 100000+ Pod, 因此需要: 1个B段IP 用于Node划分 3个B段I

TIPS之 Kubernetes Pod TaskSet 绑核

Kubernetes Pod TaskSet 绑核

主机系统进程驱逐 和 容器绑核 操作步骤 避免os进程影响,使系统进程调度在 0,1 CPU 验证CPU独占性能,将工具亲和到空闲的 CPU上 具体步骤 1. 使用isol

Kubernetes生态 之 Kubernetes 1.21 版本重要特性

Kubernetes 1.21 版本重要特性

Kubernetes 1.21 版本 release ReleaseNote: https://github.com/kubernetes/kubernetes/blob/master/CHANGELOG/CHANGELOG-1.21.md Kube-proxy IPVS变更 需要 net.ipv4.conf.all.route_localnet 设置为 1. 默认情况下已经不在设置此项 kubelet 添加内存管理 kubelet 组件生态中新增了一个 内存管理器 ,在 Linux 系统中,为需要保证 QoS

Kubernetes生态 之 Kubernetes 1.25 版本重要特性

Kubernetes 1.25 版本重要特性

Kubernetes 1.25 版本 release div.notices { margin: 2rem 0; position: relative; } div.notices p { padding: 15px; white-space: pre-wrap; display: block; margin-top: 0rem; margin-bottom: 0rem; color: #666; } div.notices p:first-child:before { position: absolute; top: 2px; color: #fff; font-family: "Font Awesome 5 Free"; font-weight: 900; content: "\f06a"; left: 10px; } div.notices p:first-child:after { position: absolute; top: 2px; color: #fff; left: 3rem; } div.notices.info p { border-top: 30px solid #F0B37E; background:

技术方案之 对 Kubernetes Namespace 和 Node 做亲和部署

对 Kubernetes Namespace 和 Node 做亲和部署

技术方案之 Kubernetes Namespace 和 Node 做亲和部署 背景 在共享集群(多租户共享底层硬件资源)中, 遇到特殊租户需要独享特定资源(比如:独占GPU资源、独占Node节点

TIPS之 Kubernetes Etcd 启动失败问题排查

Kubernetes Etcd 启动失败问题排查

Kubernetes Etcd 启动失败问题排查 etcd etcd 一直重启。查看本地 db size etcd 默认调整的 DB Size 2G, 并且收到boltdb压缩周期和模式影响 处理步骤 碎片整理 $ etcdctl --cacert xxx --key xxx --endpoints=https://127.0.0.1:2379 defrag Finished defragmenting etcd

TIPS之 Kubernetes Node Containerd Runtime 问题排查

Kubernetes Node Containerd Runtime 排查

Kubernetes Node Containerd Runtime 问题排查 Containerd containerd 硬重启后,出现failed to recover state: failed to reserve sandbox name node1 containerd[80463]: time="2022-08-02T17:13:13.092422629Z" level=fatal msg="Failed to run CRI service" error="failed to recover state: failed to reserve sandbox name "kube-scheduler-node1_kube-system_705e7ce1217a37349a5567101e60165d_2": name "kube-scheduler-node1_kube-system_705e7ce1217a37349a5567101e60165d_2" is reserved for "139bb0ac7e050e9e28b994e78f651a8609f426f1b5bbfc887a0d4a3350b4eee2"" 日志很明显提升,容日中有一层