什么是 NVIDIA Tesla?
NVIDIA Tesla(特斯拉)是 NVIDIA 继专业加速卡 QUADRO 及娱乐图形卡 GeForce 系列后,推出的一个全新的产品线,主要应用于广大科学研究的高性能计算需求。利用 NVIDIA® Tesla® GPU 加速器更快地处理要求超级严格的 HPC 与超大规模数据中心的工作负载。
什么是加速计算?
加速计算是指使用硬件加速器或协同处理器来执行浮点数计算和图形处理,比使用在 CPU 上运行的软件更高效。腾讯云提供三种加速计算选型:适用于通用计算的 GPU 计算型(GN2、GN8)和适用于图形密集型应用程序的 GPU 渲染型 GA2。
GPU 相对于 CPU 有哪些优势?
GPU 比 CPU 拥有更多的逻辑运算单元(ALU),支持多线程大规模并行计算。
何时应选择使用 GPU 的实例?
GPU 实例最适用于并行度极高的应用程序。例如,使用数千个线程的工作负载。当图形处理有大量的计算要求,其中的每个任务都相对较小时,执行的一组操作形成了一个管道,而此管道的吞吐量要比单个操作的延迟更为重要。要构建能充分利用这种并行度的应用程序,用户需要掌握 GPU 设备的专项知识,了解如何针对各种图形 API(DirectX、OpenGL) 或 GPU 计算编程模型(CUDA、OpenCL)进行编程。
如何根据不同实例类型和场景选择驱动?
NVIDIA GPU 实例的类型包括物理直通卡实例(整卡 GPU)和 vGPU 实例(非单颗 GPU,例如1/4GPU)。
物理直通的 GPU 可以使用 Tesla 驱动,也可以使用 GRID 驱动(少数卡型不支持 GRID 驱动)来实现不同场景的计算加速。
vGPU 只能使用特定版本的 GRID 驱动来实现计算加速。
实例类型 | 场景 | 驱动类型 | 推荐安装方式 |
计算型实例 - 直通卡型 | 通用计算 | Tesla 驱动 | 购买页勾选后台自动安装GPU驱动 NVIDIA 官网下载驱动后安装 |
| 图形渲染 | GRID 驱动 | 在购买页镜像市场中选择已预装 GRID 驱动的付费镜像 NVIDIA 官网申请 GRID 驱动和 License 后安装 |
计算型实例 - vGPU - vCS | 通用计算 | GRID 驱动 | 选择已预装 GRID 驱动的指定镜像 |
渲染型实例 - vGPU - vDWS/vWS | 图形渲染 | GRID 驱动 | 选择已预装 GRID 驱动的指定镜像 |
GPU 实例如何安装驱动?
您可结合实际情况,直接创建已安装 GPU 驱动的实例,或在已有实例上自行安装对应 GPU 驱动:
您可在创建 GPU 实例时,通过以下3种方式直接使用已安装 GPU 驱动的实例:
在购买页的“镜像”中,选择公共镜像,勾选后台自动安装GPU驱动即可预装相应版本驱动,建议您选择该方式。该方式仅支持部分 Linux 公共镜像,详情请参见 各实例支持的 GPU 驱动版本及安装方式。
在购买页的“镜像”中,若选择云镜像市场,则可选择已预装 GPU 驱动的镜像,详情请参见 使用预装 GPU 驱动的镜像。
选择已预装 GRID 驱动的公共镜像的 vGPU 实例,无需单独安装驱动。
若您在创建 GPU 实例时未选择自动安装 GPU 驱动,或在公共镜像中没有您需要的操作系统或版本,为确保您能够正常使用 GPU 实例,请参见 安装 NVIDIA 驱动指引 和 安装 NVIDIA GRID 驱动指引 手动安装对应驱动。关于如何选择 GPU 驱动类型请参见:
NVIDIA 系列 GPU 实例如用作通用计算,则需安装 Tesla Driver + CUDA,详情请参见 安装 NVIDIA Tesla 驱动指引 和 安装 CUDA 驱动指引。
NVIDIA 系列 GPU 实例如用作 3D 图形渲染任务(高性能图形处理,视频编解码等),则需安装 GRID Driver 和配置 License Server,详情请参见 安装 NVIDIA GRID 驱动。
GPU 云服务器如何计费?
目前 GPU 云服务器支持包年包月计费模式和按量计费模式。包年包月计费模式需要您提前按单月或数月支付 GPU 云服务器的费用,适用于设备需求量长期稳定的成熟业务。按量计费模式是按秒计费,按小时结算,随时购买随时释放,适用于电商抢购等设备需求量瞬间大幅波动的场景。具体内容请参见 价格总览。
GPU 云服务器是否支持调整实例配置?
GPU 云服务器 PNV4、GT4、GN10X/GN10Xp、GN6/GN6S、GN7、GN8、GNV4v、GNV4、GN7vw、GI1 支持同实例族下调整实例配置,其中 GN7 实例不支持直通型(整卡 GPU)调整为 vGPU 型(非单颗 GPU,例如1/4 GPU)。 GI3X 暂时不支持调整实例配置。
什么是 SSD 本地盘?
SSD 本地盘是来自云服务器所在物理机的本地存储,该类存储为实例提供块级别的数据访问能力,具有低时延、高随机 IOPS、高吞吐量的 I/O 能力。 GPU 计算型搭载 SSD 本地盘,不支持硬件(CPU、内存)的升级,仅支持带宽的升级。
GPU 云服务器是否支持访问 CVM ?
支持,GPU 云服务器具有内网 IP 和 公网 IP,支持与 CVM 等其他云产品互通访问。
哪些 GPU 机型支持 HARP 网络协议?
为什么 GPU 云服务器 nvidia-smi 展示显存比实际 GPU 显存小?
Tesla 系列 GPU 默认开启了 ECC(error correcting code)功能,用来检查和纠正可能会在数据传输和存储过程中引发的比特错误,开启时会使可用显存减少,并伴随部分性能损失。为提高数据的正确性,建议您保持开启状态。
使用自定义镜像创建多卡 GPU 实例,为什么 nvidia-smi 展示的 GPU 数目少于实际 GPU 数目?
由于制作自定义镜像时驱动会被固化,创建自定义镜像时的机器 GPU 卡数会影响使用自定义镜像创建的实例 GPU 是否可被正常加载,一般建议使用同实例规格或者同实例搭载更多张 GPU 卡的规格制作镜像,可使所有的 GPU 自动加载驱动。