Kubeservice博客

是非审之于己,毁誉听之于人,得失安之于数

AI之 NVIDAI:Operator、Cuda、CNI、Device、Device plugin环境变量使用

Operator、CNI、Device、Device plugin环境变量使用

NVIDAI GPU 相关环境变量 1. nvidia-container-runtime OCI规范 环境变量 参数说明 描述 NVIDIA_VISIBLE_DEVICES 0,1,2或者GPU-fef8089b,GPU-edab347b或者all或者none 此

AI之 NVIDAI GPU节点驱动安装和问题排除

NVIDAI GPU节点驱动安装和问题排除

NVIDAI GPU节点驱动安装和问题排除 前置要求 CentOS Linux release 7.9.2009 (Core) Kernel 5.4.x Kubernetes >= 1.10 GCC 版本 >= 9.3.1 NVIDAI device >= 384.81 Runtime 支持 nvidia-container-toolkit >= 1.7.0 cuda版本与 NVIDAI device 匹配 GPU Node 更新步骤 第一步. 出现GPU