Kubeservice博客

是非审之于己,毁誉听之于人,得失安之于数

AI之 NVIDAI:Operator、Cuda、CNI、Device、Device plugin环境变量使用

Operator、CNI、Device、Device plugin环境变量使用

NVIDAI GPU 相关环境变量 1. nvidia-container-runtime OCI规范 环境变量 参数说明 描述 NVIDIA_VISIBLE_DEVICES 0,1,2或者GPU-fef8089b,GPU-edab347b或者all或者none 此

GPU 共享/虚拟化方案: 故障隔离、显存隔离、算力隔离

GPU 共享/虚拟化方案: 故障隔离、显存隔离、算力隔离

GPU 共享/虚拟化方案: 故障隔离、显存隔离、算力隔离 AI 任务一般都会用到 GPU,这类资源相对 CPU/内存 来说往往更加昂贵,目前实现混部的开源方案有