
nvidia-smi --help-query-gpu
格式:
nvidia-smi --query-gpu=<field_name> --format=csv查询 GPU 名称:
nvidia-smi --query-gpu=gpu_name --format=csv
查询 GPU 温度:
nvidia-smi --query-gpu=temperature.gpu --format=csv
查询功耗和显存使用情况:
nvidia-smi --query-gpu=power.draw,memory.used --format=csv
查询多个字段:
nvidia-smi --query-gpu=gpu_name,driver_version,power.draw --format=csv
查询多个 GPU
如果想查询多个 GPU 的信息,可以使用逗号分隔多个索引或 UUID。
nvidia-smi --query-gpu=gpu_name,power.draw --format=csv -i=0,1定时查询
如果想查询多个 GPU 的信息,可以使用逗号分隔多个索引或 UUID。
nvidia-smi --query-gpu=gpu_name,power.draw,temperature.gpu --format=csv --loop=1 借助pynvml,官方文档:::
pip install nvidia-ml-py >>> from pynvml import *
>>> nvmlInit()
>>> print(f"Driver Version: {nvmlSystemGetDriverVersion()}")
Driver Version: 11.515.48
>>> deviceCount = nvmlDeviceGetCount()
>>> for i in range(deviceCount):
... handle = nvmlDeviceGetHandleByIndex(i)
... print(f"Device {i} : {nvmlDeviceGetName(handle)}")
...
Device 0 : Tesla K40c
>>> nvmlShutdown()