首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >vGPU显存任意切终于来了,Nvidia vGPU支持混合大小模式

vGPU显存任意切终于来了,Nvidia vGPU支持混合大小模式

作者头像
SuperDream
发布2025-11-14 12:41:46
发布2025-11-14 12:41:46
2230
举报
文章被收录于专栏:云计算-私有云云计算-私有云

有一段时间没有Update知识,回望最熟悉的领域都已过时!

一:背景与说明

曾经在VDI类的Nvidia vGPU场景,每个GPU核心只能采用1种固定切分模式,例如Nvidia A40只有一个GA102的核心,就只能切分一种模式,48G显存要么切分12个A40-4Q,要么8个A40-6Q。 这也是过去很多用户尤其是高速发展的SMB用户诟病的一点,一个设计部门,有2个需要12Q,剩余的人只需要4Q,只能采购2张显卡,如果有更多需求,则还得增加更多显卡。

二:Nvidia vGPU混合大小模式(Mixed-Size Mode)

因此在Nvidia vGPU 18.0版本,英伟达开始支持混合大小模式,

下面为英伟达官方描述:

NVIDIA vGPU 软件支持在同一物理 GPU 上混合使用不同类型的时间片 vGPU。具有任意数量帧缓冲区的 A 系列、B 系列和 Q 系列 vGPU 的任何组合都可以同时驻留在同一物理 GPU 上。分配给物理 GPU 上 vGPU 的帧缓冲区总量不得超过物理 GPU 的帧缓冲区量。例如,以下 vGPU 组合可以同时驻留在同一个物理 GPU 上:A40-2B 和 A40-2QA40-2Q 和 A40-4QA40-2B 和 A40-4Q默认情况下,GPU 或 GPU 实例仅支持具有相同帧缓冲区量的 vGPU,因此处于等大小模式。要支持具有不同帧缓冲区量的 vGPU,必须将 GPU 或 GPU 实例置于混合大小模式。在混合大小模式下,GPU 或 GPU 实例上允许的某些类型的 vGPU 的最大数量小于等大小模式下的最大数量

  • A40-2B 和 A40-2Q
  • A40-2Q 和 A40-4Q
  • A40-2B 和 A40-4Q

默认情况下,GPU 或 GPU 实例仅支持具有相同帧缓冲区量的 vGPU,因此处于等大小模式。要支持具有不同帧缓冲区量的 vGPU,必须将 GPU 或 GPU 实例置于混合大小模式。在混合大小模式下,GPU 或 GPU 实例上允许的某些类型的 vGPU 的最大数量小于等大小模式下的最大数量

支持的Hypervisor类型:

虽然支持混合部署模式,但并非所有Hypervisor支持,根据最新Nvidia vGPU 19.5的描述,当前主要支持的Hypervisor信息如下:

Hypervisor

版本要求

VMware vsphere

8.0U3或更新版本9.0或更新版本

XenServer

8.4

Ubuntu

20.0422.0424.04

Redhat KVM

10.09.6, 9.48.10

Note:

支持在同一物理 GPU 上混合使用不同类型的时间片 vGPU。A 系列、B 系列和 Q 系列 vGPU 的任意组合以及任意数量的帧缓冲区可以同时驻留在同一个物理 GPU 上。分配给物理 GPU 上 vGPU 的帧缓冲区总量不得超过物理 GPU 的帧缓冲区量。

例如,以下 vGPU 组合可以同时驻留在同一个物理 GPU 上:

  • A40-2B 和 A40-2Q
  • A40-2Q 和 A40-4Q
  • A40-2B 和 A40-4Q

支持的GPU型号:

支持从Volta架构(V100等)、Turing架构(T4、RTX 6000)及后续型号(如A40、L20、L40)以及最新的Blackwell架构(RTX PRO 6000)、等,覆盖了2017年以来发布的所有型号。

混合切分的限制与注意事项:

1. 调度模式:

Nvidia vGPU具有3种算力调度模式,在混合切分下会有部分模式不可用:

模式

默认切分

混合切分

调度模式

•Best Effort(默认):为了多个VM的性能保证所以有了FPS限制•Equal:模式是多个VM算力均分,如切分4个vm情况下,关闭一个VM后,3个VM算力均分•Fixed:固定模式主要是公有云厂商会用,就是这个卡切分1/4就只有1/4的算力,其它会被空的时间片占用

•Best Effort(默认):为了多个VM的性能保证所以有了FPS限制•Equal:模式是多个VM算力均分,如切分4个vm情况下,关闭一个VM后,3个VM算力均分

2. 重启影响:

  • 如果虚拟机管理程序主机重新启动、重新加载 NVIDIA 虚拟 GPU 管理器或重置 GPU,混合大小模式下的 GPU 或 GPU 实例的行为方式取决于虚拟机管理程序:
    • 在具有 KVM 虚拟机管理程序的 Linux 上,处于混合大小模式的 GPU 或 GPU 实例将恢复为默认模式。
    • 在 VMware vSphere 上,处于混合大小模式的 GPU 仍处于混合大小模式。GPU 不会恢复到其默认模式

三:配置Nvidia vGPU混合大小模式

下面以VMware为例,从vCenter的虚拟机配置界面现在多了一个vGPU Mode配置:

Same Size:传统的等额切分模式

Mixed Size: 新的混合切分模式

最后:希望国产桌面云越来越好!桌面云势必会成为AI时代 Agent Infra的复杂任务底座!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-11-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 云与虚拟化 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档