首页
学习
活动
专区
圈层
工具
发布

#gpu

AI训练,为什么需要GPU? ——数算岛AI计算平台(GPU池化软件) - 一站式 AI人工智能训练推理平台

文慧的科技江湖

要回答这个问题,首先需要了解当前人工智能(AI,Artificial Intelligence)的主要技术。

1800

GPU异构计算中心的案例一 —— 开源 | 数算岛AI计算平台(GPU池化软件) - 一站式 AI人工智能训练推理平台

文慧的科技江湖

2100

如何利用GPU分布式计算进行深度学习训练?——数算岛AI计算平台(GPU池化软件) - 一站式 AI人工智能训练推理平台

文慧的科技江湖

利用GPU分布式计算进行深度学习训练是一种有效提升模型训练速度和处理更大规模数据集的方法。在现代深度学习领域,数据集的大小和模型的复杂性都呈现出指数级增长,这使...

2300

开源 | 企业级开源人工智能训练推理平台 - GPU池化平台 - GPU算力平台 - GPU调度平台 - AI人工智能操作系统

文慧的科技江湖

🔥 Github 主仓库(优先更新)https://github.com/roinli/SSD-GPU-POOL | Gitee 镜像仓库

2400

GPU 虚拟化与多档算力:应用云渲染并发规格 S/M/L/L2/XL 怎么选

克劳德2048

摘要 同一款 UE 应用,跑在不同 GPU 规格上成本可能差三倍,用户体验也可能差一个维度。腾讯云应用云渲染(CAR)通过极致的 GPU 虚拟化,把一块昂贵的物...

1500

当 Java 遇上 GPU,性能测试要补新课了

FunTester

过去十几年,性能测试工程师对 Java 系统的理解,有一个几乎不需要怀疑的前提:算力在 CPU 上。不管你测的是 Web 接口、异步链路还是数据处理任务,最终都...

2600

算力集群故障自愈体系搭建,租赁服务器宕机自动切换方案

用户12512581

2026 年智算运维行业统计数据显示,批量租赁 GPU 集群故障分为硬件宕机、网络链路中断、进程僵死、存储读写异常四类。无自愈架构的传统租赁集群,单台 8 卡服...

2600

多机租赁算力容器提速:镜像分层缓存、内网分发、批量自动化部署落地

用户12512581

2026 年 Q2 商用算力运维行业统计数据显示,企业批量租赁 10 台以上 GPU 节点时,传统公网拉取容器镜像模式存在明显性能短板:单节点拉取大体积训练镜像...

1100

腾讯云应用云渲染 vs 自建 GPU 集群:成本、运维与扩展性的全面对比

hollyx

摘要 自建 GPU 集群门槛高、扩缩容慢,腾讯云应用云渲染(CAR)以 PaaS 形态按并发付费,端到端延迟 60-80ms,2000+ 边缘节点就近接入,1 ...

2500

Lada v0.11.0最新版更新 本地一键启动包教程:AI去马赛克神器实测 支持 Nvidia显卡和Intel Arc GPU

代码简单说

之前在网上刷视频的时候,经常会遇到一个特别让人崩溃的问题——关键画面总被打上厚厚的马赛克。 想认真看内容,却只能看到一堆像素块,体验直接拉满折磨值。

6810

电脑屏幕右上角突然显示FPS N/A、GPU、CPU、延迟信息的解决办法

代码简单说

关键词:NVIDIA Overlay、电脑右上角FPS显示、GPU使用率显示、NVIDIA性能监控关闭、ALT+R关闭FPS、显卡性能叠加层

5610

算力租赁资源超配原理与风险,平台超配比例安全阈值分析

用户12512581

算力租赁超配(资源超售 / Overcommit)指算力服务商依托 GPU 虚拟化、分时复用技术,对外分配的虚拟算力总量超过物理硬件额定资源上限,核心目标解决行...

6610

腾讯云渲染 CRTR 技术架构全揭秘:从 GPU 编解码到多端 SDK 的一次深度拆解

克劳德2048

摘要 腾讯云CRTR采用云端GPU渲染+音视频串流架构,涵盖应用管理、并发调度、GPU编解码、边缘节点传输、多端SDK五大核心模块,为企业提供完整的实时云渲染P...

9110

3D应用跑不动手机发烫_云端GPU帮终端卸下重担

hollyx

摘要 3D 应用导致手机发烫、耗电快?腾讯云渲染将图形计算搬到云端 GPU,终端只做显示,大幅降低设备负担。 3D 应用跑不动、手机发烫、电池掉电快?云端 GP...

7100

基于3DMark基准测试的GPU虚拟化与云端渲染算力损耗量化评估及硬件选型指南

PC电脑医生

随着云渲染、云游戏、三维云工作站以及深度学习混合工作流在企业级数据中心的大规模部署,GPU 虚拟化(GPU Virtualization,vGPU) 和 GPU...

13410

小鸟壁纸系统调优指南:解决动态壁纸显存与GPU性能瓶颈

PC电脑医生

在复杂的系统开发和高强度编译过程中,最大化压榨硬件性能(尤其是显卡显存和 CPU 核心线程)是每位系统级工程师追求的目标。在进行高负载运算(如大文件编译、大型 ...

11810

硬核实战:2.15 倍推理提速!揭秘 LLM 小批量解码的隐形致命坑

山野大叔

在LLM部署中,小批量连续解码(Batch Decode) 是线上服务、对话场景最主流的形态。长期以来,业内有一个普遍看法:

8010

看懂NVIDIA GPU的SM后缀:sm_90、sm90a、sm_100f核心差异解析

GPUS Lady

熟悉CUDA开发的开发者都知道,编译GPU程序时离不开sm_XX架构参数。长久以来,大家默认sm版本只是对应一代GPU架构的简单标签:sm_75对应Turing...

16610

一文讲透 GPUDirect RDMA:它到底解决了什么问题?AWS 上哪些 GPU 实例能用?

悠悠12138

这两年搞大模型训练、分布式推理、HPC 计算,绕不开几个词:GPU、NVLink、NCCL、EFA、RDMA、GPUDirect RDMA。

25810
领券