Kubeservice博客

是非审之于己,毁誉听之于人,得失安之于数

TIPS之 Kubernetes Pod 容器退出状态码

Kubernetes Pod 容器退出状态码

Kubernetes Etcd 启动失败问题排查 问题 大家在使用 Kubernetes 时,会遇到创建Pod失败,这时会分析什么原因导致创建Pod失败? Pod status 状态解释 [1] CrashLoopBack

技术方案之 Kubernetes大规模容器网络优化

Kubernetes大规模容器网络优化

技术方案之 Kubernetes大规模容器网络优化 背景 1.1 大规模集群特点 大业务:单模块超大规模副本(300+) 小业务:资源减少边际成本(平摊控制

AI之 NVIDAI GPU节点驱动安装和问题排除

NVIDAI GPU节点驱动安装和问题排除

NVIDAI GPU节点驱动安装和问题排除 前置要求 CentOS Linux release 7.9.2009 (Core) Kernel 5.4.x Kubernetes >= 1.10 GCC 版本 >= 9.3.1 NVIDAI device >= 384.81 Runtime 支持 nvidia-container-toolkit >= 1.7.0 cuda版本与 NVIDAI device 匹配 GPU Node 更新步骤 第一步. 出现GPU

TIPS之 Kubernetes etcd 高可用实现方式

Kubernetes etcd 高可用实现方式

Kubernetes etcd 高可用实现方式 一. 继承上一章节 单集群etcd性能调优 超大规模Kubernetes集群调优 1.1 现象和挑战 现象1: 全量数据range问题:et

技术分享之 CoreDNS 集群层粒度 autoscaling

CoreDNS 集群层粒度 autoscaling

CoreDNS DNS集群粒度 autoscaling 第一篇: 使用 NodeLocal DNSCache 提高 clusterDNS 性能和可靠性 一、什么是集群比例自动扩缩器 (Cluster Proportional Autoscaler即CPA) ? 集群比例自动扩缩器 (CPA) 是一

TIPS之 Kubernetes 自定义指标hpa实现: prometheus-adapter

Kubernetes 自定义指标hpa实现

Kubernetes 自定义指标hpa实现:prometheus-adapter 如何实现自定义指标采集 其中包括: 自定义指标暴露,并采集 完成将原生自定义指标转换为

DevOps之 日志采集存储性能对比 es vs loki vs victorialogs

日志采集存储性能对比 es vs loki vs victorialogs

存储引擎介绍 elasticsearch 不多介绍 loki Promtail 采集器, 通过daemonset方式部署在全部node上。 通过promtail中 configmap 配置两个东西: a.配置固定路径下的

TIPS之 Kubernetes IPv4/IPv6 双协议栈

Kubernetes IPv4/IPv6 双协议栈

Kubernetes IPv4/IPv6 双协议栈 背景 “Kubernetes 何时支持 IPv6” 自从 k8s v1.9 版本中首次添加对 IPv6 的 alpha 支持以来,这个问题的讨论越来越频繁。 虽然 Kubernetes 从 v1.18 版本开始