前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >新的 Nvidia AI Enterprise Suite 加入 VMware vSphere 以虚拟化 AI 工作负载

新的 Nvidia AI Enterprise Suite 加入 VMware vSphere 以虚拟化 AI 工作负载

作者头像
计算机视觉研究院
发布2023-08-24 08:57:22
2180
发布2023-08-24 08:57:22
举报

项目地址:https://github.com/xijiu9/Train_Transformers_with_INT4

计算机视觉研究院专栏

Column of Computer Vision Institute

Nvidia和VMware将新的Nvidia AI Enterprise软件工具套件与VMware最新的vSphere 7 Update 2虚拟化平台结合在一起,使企业能够更轻松地虚拟化其不断扩展的AI工作负载。

CV

资讯

Nvidia和VMware将新的Nvidia AI Enterprise软件工具套件与VMware最新的vSphere 7 Update 2虚拟化平台结合在一起,使企业能够更轻松地虚拟化其不断扩展的AI工作负载。

据两家公司称,英伟达(纳斯达克股票代码:NVDA)于9月7日(星期二)宣布的新AI工具和框架套件仅在VMware刚刚发布的vSphere 2 Update 7上运行。Nvidia AI Enterprise 工具和 vSphere 2 Update <> 的结合意味着传统上在裸机服务器上运行的 AI 工作负载现在可以在 VMware 的虚拟化平台上运行。据两家公司称,这将使这些工作负载能够直接访问Nvidia的CUDA应用程序,AI框架,预先训练的模型和部署在混合云上的软件开发工具包。

最新的 Nvidia 工具支持数据中心 AI 训练和推理、边缘 AI 推理以及数据分析和机器学习工作负载。

到目前为止,人工智能一直是“一个基础设施孤岛,人们不得不[自己动手]方法来设置和管理它,”英伟达企业和边缘计算部门总经理贾斯汀博伊塔诺说。“与VMware的合作使我们能够真正构建人们习惯于在vSphere上使用的基础架构,但真正针对AI对其进行优化,因此您不必创建一个孤立的项目来解决这个问题。我们希望为 IT 管理员提供交钥匙服务。

最新的合作延续了两个合作伙伴去年开始的一项举措,旨在为广泛的用户实现人工智能的民主化。

“我们正在为开发人员和数据科学家带来人工智能体验,并同样地接触我们的企业客户,”VMware云平台业务部门副总裁Lee Caswell说。

最新更新的vSphere版本还经过认证,可以运行Nvidia的A100 Tensor Core GPU。英伟达表示,它还将支持vSphere客户为其新的AI软件套件获得许可证。

新的 Nvidia VMware 合作为 vSphere 虚拟机管理程序提供了迁移到多个 GPU 实例的支持,允许根据工作负载要求将 A100 GPU 分区为多达七个实例。该选项将跨多个节点扩展AI工作负载的训练,包括现在可以在VMware Cloud Foundation上运行的大型深度学习模型。

Boitano表示,英伟达的AI软件套件将使构建AI模型并在企业数据中心进行扩展变得更加容易,从而将生产中部署AI模型所需的时间从80周减少到八周。

过去,此类 AI 工作负载传统上设计为在裸机服务器上运行。Boitano补充说,新的Nvidia工具和vSphere 7的更新改变了这一切。“vSphere 的性能与裸机几乎没有区别。

这些收益与对Nvidia A100 GPU的支持有关,合作伙伴称其性能提升了20倍。

推动人工智能基础设施民主化的努力还结合了VMware的Tanzu应用程序服务,旨在为基于容器的应用程序和Nvidia的容器工具提供vSphere支持。“你基本上支持容器和具有通用操作模型的[虚拟机],”Caswell说。“我们正在做的是确保当数据科学家、开发人员或人工智能研究人员的新应用程序出现时,他们可以[通过]一个通用视图应用所有相同的[vSphere]工具。

vSphere上的AI平台由Nvidia服务器合作伙伴Dell Technologies,Hewlett Packard Enterprise,Lenovo和Supermicro提供支持。

除了A100支持外,vSphere 7更新还包括Nvidia的GPU互连,可直接访问GPU内存。“我们正在做的是使用[GPU架构增强],并有效地确保GPU可以与网络中的其他GPU进行通信,而不会受到系统中任何其他阻塞点的瓶颈,”Boitano说。

企业 AI 平台以永久许可证的形式提供,每个 CPU 插槽 3,595 美元。英伟达表示,VMware客户在升级到最新版本的vSphere 7时可以申请抢先体验。

另外,VMware宣布对其vSAN虚拟化存储进行与AI相关的更新,包括面向机器学习和云原生应用程序的S3兼容对象存储。与 Nvidia GPU 互连一样,vSAN 7 更新支持远程直接内存访问。除了提高性能外,RDMA 还旨在提高资源利用率。存储升级现在也可用。

转载请联系本公众号获得授权

往期推荐

🔗

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-07-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 计算机视觉战队 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档