Kubeservice博客

是非审之于己,毁誉听之于人,得失安之于数

TIPS之 Kubernetes 外部流量引入

Kubernetes 外部流量引入: ClusterIp、NodePort、LoadBalancer 和 Ingress

Kubernetes 外部流量引入: ClusterIp、NodePort、LoadBalancer 和 Ingress 背景 今天,我被问到了一个从测试初期遇到的最常见问题之一开始

GPU 共享/虚拟化方案: 故障隔离、显存隔离、算力隔离

GPU 共享/虚拟化方案: 故障隔离、显存隔离、算力隔离

GPU 共享/虚拟化方案: 故障隔离、显存隔离、算力隔离 AI 任务一般都会用到 GPU,这类资源相对 CPU/内存 来说往往更加昂贵,目前实现混部的开源方案有

TIPS之 Kubernetes descheduler使用方式

Kubernetes descheduler使用方式

Kubernetes descheduler使用方式 descheduler是对于现有的 kube-scheduler 精细化调度丰富. de-scheduler 当业务长期运行后, 出现warning到一定情况,通过预

TIPS之 Kubernetes Pod动态mount nfs方式

Kubernetes Pod动态mount nfs方式

Kubernetes Pod动态mount nfs方式 背景 为Pod 挂在一个nfs目录, 临时处理数据使用。 确保pod不重启。 验证方式 准备 nfs-server [root@xxxxx /var/lib/paascontainer/nfs]# exportfs -s /var/lib/paascontainer/nfs *(sync,wdelay,hide,no_subtree_check,sec=sys,rw,secure,no_root_squash,no_all_squash) [root@xxxxx /var/lib/paascontainer/nfs]# showmount -e 172.16.0.8 Export list

TIPS之 Kubernetes kubelet 与 apiserver 断连后,依旧使用关闭连接

Kubernetes kubelet 与 apiserver 断连后,依旧使用关闭连接

Kubernetes kubelet 与 apiserver 断连后,依旧使用关闭连接 现象 表现是:通过kubelet 报错,一段时间后节点NotReady。 日志: E0906 02:03:08.585672 392662 reflector.go:123] object-"089f93c2"/"a697eaa005a-4b60b0": Failed to list *v1.ConfigMap: Get https://127.0.0.1:6443/api/v1/namespaces/089f93c2/configmaps?fieldSelector=metadata.name%3Da697eaa005a-4b60b0&limit=500&resourceVersion=0: read tcp 127.0.0.1:62060->127.0.0.1:6443: use of closed

TIPS之 Kubernetes client-go 常用配置

Kubernetes client-go 常用配置

Kubernetes client-go 常用配置 第一篇: Kubernetes client-go使用方式 client-go config 配置 type Config struct { // Host must be a host string, a host:port pair, or a URL to the base of the apiserver. // If a URL is given then the (optional) Path of that URL represents a prefix that must //

TIPS之 Kubernetes APIServer 异常504 GatewayTimeout

Kubernetes APIServer 异常504 GatewayTimeout

Kubernetes APIServer 异常 504 GatewayTimeout 问题一: Kubernetes APIServer 503 logging error output: service unavailable metrics.k8s.io/v1beta1 api-resource 不存在问题 I0908 17:58:06.013828 1 httplog.go:89] "HTTP" verb="GET" URI="/apis/metrics.k8s.io/v1beta1?timeout=32s" latency="511.066µs" userAgent="kubectl/v1.21.5 (linux/amd64) kubernetes/83c85a6" srcIP="10.253.101.202:56436" resp=503 statusStack=" goroutine 178079822 [running]: .... "

运行时之 nydus vs estargz image format对比

nydus vs estargz image format对比

nydus vs estargz image format对比 背景 OCIv2 vs OCIv1 OCIv1是开源容器 规定的镜像格式标准(image format spec). OCIv2是解决OCIv1部分问题后,解决的镜像标准