Kubeservice博客

是非审之于己,毁誉听之于人,得失安之于数

TIPS之 CentOS7 停止维护,yum源失效更改国内源地址

CentOS 7停止维护,yum源失效更改国内源地址

CentOS7 停止维护,yum源失效更改国内源地址 背景 2020年12月08日,CentOS官方宣布了停止维护CentOS的计划,并推出了CentOS St

TIPS之 Kubernetes Pod Container Memory high问题排查

Kubernetes Pod Container Memory high问题排查

Kubernetes Pod Container Memory high问题排查 1. 现象 线上k8s集群报警,告警群里突然告警某容器内存使用率高于90%,并且后续一直有告警出现。随即登入指标监控系统查

DevOps设计之 Kubenetes 容器日志收集方案

Kubenetes 容器日志收集方案

Kubenetes 容器日志收集方案 应用日志收集痛点 业务无要求: div.notices { margin: 2rem 0; position: relative; } div.notices p { padding: 15px; white-space: pre-wrap; display: block; margin-top: 0rem; margin-bottom: 0rem; color: #666; } div.notices p:first-child:before { position: absolute; top: 2px; color: #fff; font-family: "Font Awesome 5 Free"; font-weight: 900; content: "\f06a"; left: 10px; } div.notices p:first-child:after

TIPS之 Kubernetes CPUSet Pod 在各节点上numa分布不均

Kubernetes CPUSet Pod 在各节点上numa分布不均

Kubernetes CPUSet Pod 在各节点上numa分布不均 背景 在 CPU Manager 管理的CPU亲和过程中,发现有部分机器numa空闲, 但是有部分机器Pod在 binding过程中,一

TIPS之 Kubernetes 自动清理 Failed/Successed Pod

Kubernetes 自动清理 Failed/Successed Pod

Kubernetes 自动清理 Failed/Successed Pod 背景 Pod 部署应为某些原因,Pod 部署失败Failed 或者 部署完成Successed等历史pod 不会被删除,导致 kubectl get pod -A 大量异常p

TIPS之 Kubernetes Numa CPU亲和失败问题排查

Kubernetes Numa CPU亲和失败问题排查

Kubernetes Numa CPU亲和失败问题排查 背景 在配置numa拓扑管理 和 CPU管理后(Kubernetes Pod/Container NUMA亲和管理), 业务CPU亲和不生效; spec: containers: - name:

TIPS之 Kubernetes GPU share 能力

Kubernetes GPU share 能力

Kubernetes GPU share 能力 GPU 软隔离模式 通过 gpu-monitoring-tools 还获得 gpu device 驱动,并通过 deviceplugin 向kubelet注册GPU信息。 底层通过 NVIDIA docker-smi 可对容器进行gpu分配 **GPU虚拟化技术:

TIPS之 Kubernetes 外部流量引入

Kubernetes 外部流量引入: ClusterIp、NodePort、LoadBalancer 和 Ingress

Kubernetes 外部流量引入: ClusterIp、NodePort、LoadBalancer 和 Ingress 背景 今天,我被问到了一个从测试初期遇到的最常见问题之一开始