首页
学习
活动
专区
圈层
工具
发布

#gpu

装机量超2000万、全球主流GPU与AI框架“开箱即用”!OpenCloudOS成AI时代优先选项

深度学习与Python

在大模型训练的高速迭代背景下,算力需求约每六个月翻一番,远超基础设施建设和摩尔定律的增速,同时数据中心能耗急剧攀升。

700

在Elasticsearch中使用NVIDIA cuVS实现高达12倍速度提升的向量索引:GPU加速

点火三周

今年早些时候,Elastic宣布与NVIDIA合作,为Elasticsearch引入GPU加速,集成NVIDIA cuVS[1]。有关详细信息,可以参考NVID...

1000

AI时代底层技术链:GPU、云原生与大模型的协同进化全解析

音视频牛哥

GPU 像一个训练有素的万人方阵: 并行爆炸强 → 执行海量简单位运算(矩阵加乘)

20610

298| AI工厂GPU寿命:折旧迷思与价值重估

数据存储前沿技术

在AI技术飞速发展的今天,图形处理单元(GPU)已成为驱动AI工厂的核心引擎。然而,关于GPU的实际使用寿命及其折旧周期的讨论,正引发业界广泛关注。一种普遍的看...

14110

360环视实时性评估:GPU加速性能与AI拓展潜力-基于米尔RK3576

用户10591265

本次360环视系统原型基于米尔电子MYD-LR3576开发板进行构建与评估。该开发板所搭载的瑞芯微RK3576芯片,集成了4核Cortex-A72、4核Cort...

12010

还在拼命加 GPU?AI 应用规模化的下半场,拼的是这五大软件“新基建”

深度学习与Python

过去十年,我们通过中间件、数据库与容器技术,奠定了云原生应用基础设施(Application Infra)的基石。我们利用消息队列、实时计算与分布式存储,铺设了...

12410

如何为 GPU 提供充足存储:AI 训练中的存储性能与扩展性

深度学习与Python

在 AI 训练中,业界往往将关注点集中在计算资源上,但如果存储性能不足,GPU 无法被充分利用,计算效率将会大幅受限。因此,存储系统的性能对于提升整体训练效率至...

11710

MAC使用MPS进行GPU深度模型训练(MPS替代CUDA)

老周聊架构

随着深度学习的广泛应用,硬件加速成为了模型训练的重要因素。GPU凭借其强大的并行计算能力,已经成为深度学习训练的首选设备。然而,在不同的操作系统上,由于硬件厂商...

31810

GPUSTACK Docker 容器化部署指南

轩辕镜像

GPUSTACK 是一款专注于 GPU 集群管理的中间件,旨在简化大语言模型(LLMs)及其他 GPU 密集型应用的部署与运行流程。通过统一的集群管理接口,GP...

33810

通用具身智能要来了!卡内基梅隆&Meta发布效率之王MetaVLA:训练步数降3倍,GPU时间少76%

AI生成未来

文章链接:https://arxiv.org/pdf/2510.05580 项目链接:https://stellar-neuron.github.io/met...

12210

65_GPU选择:A100 vs RTX系列

安全风信子

在2025年的今天,大语言模型(LLM)已经成为人工智能领域的核心技术之一。从GPT-5到Llama 4,从专业领域应用到消费级产品,LLM正在以前所未有的速度...

42010

42_大语言模型的计算需求:从GPU到TPU

安全风信子

随着2025年大语言模型技术的持续突破和规模化应用,计算资源已成为推动AI发展的关键驱动力。从最初的CPU计算,到GPU加速,再到专用AI加速器的崛起,大语言模...

45810

GPU集群扩展:Ray Serve与Celery的技术选型与应用场景分析

deephub

当你需要处理大规模并行任务,特别是涉及GPU集群的场景时,Ray Serve和Celery是两个主要选择。但它们的设计理念完全不同:

8510

vGPU显存任意切终于来了,Nvidia vGPU支持混合大小模式

SuperDream

曾经在VDI类的Nvidia vGPU场景,每个GPU核心只能采用1种固定切分模式,例如Nvidia A40只有一个GA102的核心,就只能切分一种模式,48G...

28010

面向AI的新一代存储GPU Direct Distributed File System来了

皮振伟

从2017年开始,我陆续在这里分享了一些关于内核/虚拟化、存储虚拟化、KV 数据库和操作系统基础组件相关的文章,也收获了不少读者的好评。如果这些内容能在大家的工...

16810

【教程】nvidia-smi dmon获取GPU相关的完整信息

小锋学长生活大爆炸

👉 每秒采样 GPU 活跃度、SM 活跃度、PCIe Tx/Rx,直接保存到 CSV。

28500

首都在线董事长曲宁:AI推理时代,云计算如何走出GPU碎片化困局? | 数据猿专访

数据猿

随着人工智能技术的飞速发展,云计算行业正经历一场深刻的转型,从传统的通用计算迈向智能化、场景化的智算时代。在这场变革中,众多云服务商积极拥抱机遇,构建面向未来的...

19310

Nat. Methods | GPU 加速的 MMseqs2 同源搜索

DrugOne

随着蛋白质数据库规模的快速增长,对更快、更敏感的同源性搜索工具的需求愈发迫切。研究人员开发了 GPU 加速版 MMseqs2 (MMseqs2-GPU),在单一...

18810

告别重复编译!CUDA 13.0统一Arm/服务器工具链,边缘开发效率提升300%

GPUS Lady

随着NVIDIA Blackwell GPU架构赋能的Jetson Thor SoC发布,CUDA 13.0通过一系列创新优化,重新定义了嵌入式与边缘AI的开发...

47310
领券