Kubeservice博客

是非审之于己,毁誉听之于人,得失安之于数

GPU 共享/虚拟化方案: 故障隔离、显存隔离、算力隔离

GPU 共享/虚拟化方案: 故障隔离、显存隔离、算力隔离

GPU 共享/虚拟化方案: 故障隔离、显存隔离、算力隔离 AI 任务一般都会用到 GPU,这类资源相对 CPU/内存 来说往往更加昂贵,目前实现混部的开源方案有

TIPS之 Kubernetes descheduler使用方式

Kubernetes descheduler使用方式

Kubernetes descheduler使用方式 descheduler是对于现有的 kube-scheduler 精细化调度丰富. de-scheduler 当业务长期运行后, 出现warning到一定情况,通过预

Golang之 golang common goroutine scheduler 定时调度引擎

Golang 通用基础库: goroutine scheduler 定时调度引擎

定时调度引擎 goroutine scheduler 背景 类似于 python schedule的伟大设计,实现golang版本的 golang scheduer模块 使用方式 package main import ( "flag" "fmt" "time" "github.com/kubeservice-stack/common/pkg/schedule" ) func ExampleTask(name string) { fmt.Println("Example Task "

技术方案之 基于节点真实负载情况调度之二:crane-scheduler-plus

crane-scheduler-plus 独立于 Prometheus 实现版本

crane-scheduler-plus 独立于 Prometheus 实现版本 1. 背景 请查看第一篇:https://kubeservice.cn/2022/11/24/k8s-crane-schedul

技术方案之 基于节点真实负载情况调度之一:crane-scheduler-plus

基于crane-scheduler组件的二次升级:crane-scheduler-plus

技术方案之 基于节点真实负载情况调度:crane-scheduler-plus crane-scheduler 解决了Kubernetes仅仅基于资源的 resource request 进行调度,然而 Pod 的