Kubeservice博客

是非审之于己,毁誉听之于人,得失安之于数

TIPS之 集群中大量Pod处于UnexpectedAdmissionError状态排查

集群中大量Pod处于UnexpectedAdmissionError状态

TIPS之 集群中大量Pod处于UnexpectedAdmissionError状态排查 现象 查询集群中的Pod时,发现大量Pod实例处于Une

GPU 共享/虚拟化方案: 故障隔离、显存隔离、算力隔离

GPU 共享/虚拟化方案: 故障隔离、显存隔离、算力隔离

GPU 共享/虚拟化方案: 故障隔离、显存隔离、算力隔离 AI 任务一般都会用到 GPU,这类资源相对 CPU/内存 来说往往更加昂贵,目前实现混部的开源方案有