GPU 云服务器
文档中心>GPU 云服务器

常见问题

最近更新时间:2024-10-28 14:52:53

我的收藏

什么是 NVIDIA Tesla?

NVIDIA Tesla(特斯拉)是 NVIDIA 继专业加速卡 QUADRO 及娱乐图形卡 GeForce 系列后,推出的一个全新的产品线,主要应用于广大科学研究的高性能计算需求。利用 NVIDIA® Tesla® GPU 加速器更快地处理要求超级严格的 HPC 与超大规模数据中心的工作负载。

什么是加速计算?

加速计算是指使用硬件加速器或协同处理器来执行浮点数计算和图形处理,比使用在 CPU 上运行的软件更高效。腾讯云提供三种加速计算选型:适用于通用计算的 GPU 计算型(GN2、GN8)和适用于图形密集型应用程序的 GPU 渲染型 GA2。

GPU 相对于 CPU 有哪些优势?

GPU 比 CPU 拥有更多的逻辑运算单元(ALU),支持多线程大规模并行计算。

何时应选择使用 GPU 的实例?

GPU 实例最适用于并行度极高的应用程序。例如,使用数千个线程的工作负载。当图形处理有大量的计算要求,其中的每个任务都相对较小时,执行的一组操作形成了一个管道,而此管道的吞吐量要比单个操作的延迟更为重要。要构建能充分利用这种并行度的应用程序,用户需要掌握 GPU 设备的专项知识,了解如何针对各种图形 API(DirectX、OpenGL) 或 GPU 计算编程模型(CUDA、OpenCL)进行编程。

如何根据不同实例类型和场景选择驱动?

NVIDIA GPU 实例的类型包括物理直通卡实例(整卡 GPU)和 vGPU 实例(非单颗 GPU,例如1/4GPU)。
物理直通的 GPU 可以使用 Tesla 驱动,也可以使用 GRID 驱动(少数卡型不支持 GRID 驱动)来实现不同场景的计算加速。
vGPU 只能使用特定版本的 GRID 驱动来实现计算加速。
NVIDIA GPU 相关实例的驱动安装步骤请参见 安装 NVIDIA Tesla 驱动安装 NVIDIA GRID 驱动。您可参见下表,结合实例类型及应用场景来选择驱动类型:
实例类型
场景
驱动类型
推荐安装方式
计算型实例 - 直通卡型
通用计算
Tesla 驱动
购买页勾选后台自动安装GPU驱动
NVIDIA 官网下载驱动后安装
图形渲染
GRID 驱动
在购买页镜像市场中选择已预装 GRID 驱动的付费镜像
NVIDIA 官网申请 GRID 驱动和 License 后安装
计算型实例 - vGPU - vCS
通用计算
GRID 驱动
选择已预装 GRID 驱动的指定镜像
渲染型实例 - vGPU - vDWS/vWS
图形渲染
GRID 驱动
选择已预装 GRID 驱动的指定镜像

GPU 实例如何安装驱动?

您可结合实际情况,直接创建已安装 GPU 驱动的实例,或在已有实例上自行安装对应 GPU 驱动:
创建已安装 GPU 驱动的实例
在已有实例上安装 GPU 驱动
您可在创建 GPU 实例时,通过以下3种方式直接使用已安装 GPU 驱动的实例:
在购买页的“镜像”中,选择公共镜像,勾选后台自动安装GPU驱动即可预装相应版本驱动,建议您选择该方式。该方式仅支持部分 Linux 公共镜像,详情请参见 各实例支持的 GPU 驱动版本及安装方式
在购买页的“镜像”中,若选择云镜像市场,则可选择已预装 GPU 驱动的镜像,详情请参见 使用预装 GPU 驱动的镜像
选择已预装 GRID 驱动的公共镜像的 vGPU 实例,无需单独安装驱动。
若您在创建 GPU 实例时未选择自动安装 GPU 驱动,或在公共镜像中没有您需要的操作系统或版本,为确保您能够正常使用 GPU 实例,请参见 安装 NVIDIA 驱动指引安装 NVIDIA GRID 驱动指引 手动安装对应驱动。关于如何选择 GPU 驱动类型请参见:
NVIDIA 系列 GPU 实例如用作通用计算,则需安装 Tesla Driver + CUDA,详情请参见 安装 NVIDIA Tesla 驱动指引安装 CUDA 驱动指引
NVIDIA 系列 GPU 实例如用作 3D 图形渲染任务(高性能图形处理,视频编解码等),则需安装 GRID Driver 和配置 License Server,详情请参见 安装 NVIDIA GRID 驱动

GPU 云服务器如何计费?

目前 GPU 云服务器支持包年包月计费模式和按量计费模式。包年包月计费模式需要您提前按单月或数月支付 GPU 云服务器的费用,适用于设备需求量长期稳定的成熟业务。按量计费模式是按秒计费,按小时结算,随时购买随时释放,适用于电商抢购等设备需求量瞬间大幅波动的场景。具体内容请参见 价格总览

GPU 云服务器是否支持调整实例配置?

GPU 云服务器 PNV4、GT4、GN10X/GN10Xp、GN6/GN6S、GN7、GN8、GNV4v、GNV4、GN7vw、GI1 支持同实例族下调整实例配置,其中 GN7 实例不支持直通型(整卡 GPU)调整为 vGPU 型(非单颗 GPU,例如1/4 GPU)。 GI3X 暂时不支持调整实例配置。
说明:
配置调整的前提、注意事项及操作指南,请参见 调整实例配置
调整配置费用说明请参见 实例调整配置费用说明

什么是 SSD 本地盘?

SSD 本地盘是来自云服务器所在物理机的本地存储,该类存储为实例提供块级别的数据访问能力,具有低时延、高随机 IOPS、高吞吐量的 I/O 能力。 GPU 计算型搭载 SSD 本地盘,不支持硬件(CPU、内存)的升级,仅支持带宽的升级。

GPU 云服务器是否支持访问 CVM ?

支持,GPU 云服务器具有内网 IP 和 公网 IP,支持与 CVM 等其他云产品互通访问。

哪些 GPU 机型支持 HARP 网络协议?

所有的 GPU 实例类型均支持 HARP 网络协议,配置步骤可参见 配置 HARP 分布式训练环境

为什么 GPU 云服务器 nvidia-smi 展示显存比实际 GPU 显存小?

Tesla 系列 GPU 默认开启了 ECC(error correcting code)功能,用来检查和纠正可能会在数据传输和存储过程中引发的比特错误,开启时会使可用显存减少,并伴随部分性能损失。为提高数据的正确性,建议您保持开启状态。

使用自定义镜像创建多卡 GPU 实例,为什么 nvidia-smi 展示的 GPU 数目少于实际 GPU 数目?

由于制作自定义镜像时驱动会被固化,创建自定义镜像时的机器 GPU 卡数会影响使用自定义镜像创建的实例 GPU 是否可被正常加载,一般建议使用同实例规格或者同实例搭载更多张 GPU 卡的规格制作镜像,可使所有的 GPU 自动加载驱动。