首页
学习
活动
专区
圈层
工具
发布

#gpu

超级计算力量:一文看懂GPU并行计算CUDA

Lion 莱恩呀

CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。CUDA™是一种由NVIDIA推出的通...

28400

致敬园丁,腾讯云HAI献礼教师节!GPU算力券5折起

腾讯云计算产品团队

腾讯云 | 产品团队 (已认证)

大型语言模型(LLM)部署、AI作画、数据科学项目需要强大的GPU算力支持,但动辄上万的硬件投入和维护成本让人望而却步。现在,腾讯云高性能应用服务HAI为您提供...

11410

gpu线上测试(毒蘑菇测试)

用户10974407

起初,我在搜索引擎里输入 “GPU 性能测试工具”,结果跳出的全是需要下载安装的软件。有的工具安装包动辄好几百兆,还附带一堆捆绑插件,一不小心就会把电脑弄得乌烟...

50910

服务器核心组件:CPU 与 GPU 的核心区别、应用场景、协同工作

云惑雨问

在服务器硬件里,CPU和GPU就像两位各司其职的“核心工匠”:一个擅长处理复杂精密的“细活”,一个精通批量高效的“粗活”。很多人知道它们都是“计算引擎”,却分不...

21510

开发 Operator 调度 GPU 实例资源池

没有故事的陈师傅

作者:乔克 公众号:运维开发故事 博客:https://jokerbai.com

13510

光量子计算与经典HPC的融合:ORCA Computing与Nvidia展示多GPU/QPU协同下的经典-量子混合算法实践

光芯

新计算技术的规模化普及需满足两大前提:一是融入多技术、多学科交织的异构工作流,二是实现全生命周期“价值>成本”平衡(需覆盖数据中心改造、运维开销、人...

23910

48块GPU训练对标千亿参数SOTA!达摩院等发布基于LLM的自回归视频生成模型Lumos-1

AI生成未来

文章链接:https://arxiv.org/pdf/2507.08801 项目链接:https://github.com/alibaba-damo-acad...

17810

100天跟着CP学PostgreSQL+AI,第20天 : 分布式训练架构:PostgreSQL 如何支持多 GPU 协同

用户8465142

作者介绍:崔鹏,计算机学博士,专注 AI 与大数据管理领域研究,拥有十五年数据库、操作系统及存储领域实战经验,兼具 ORACLE OCM、MySQL OCP 等...

13710

为什么光会写 SQL 还不够?数据库优化的进化之路

用户11680974

在一次企业数据报表会上,王工盯着屏幕上的 SQL 查询结果皱起了眉头:原本几秒就能生成的销售报表,现在居然要几十秒。团队第一反应是,“加索引就好了。”然而,当数...

16910

【教程】后台监听GPU使用情况并自动记录和画图

小锋学长生活大爆炸

本脚本用于自动监控多卡 GPU 的使用状态,当某张 GPU 连续活跃超过设定秒数时开始记录该卡的使用情况,并在其连续空闲超过设定时间后自动停止记录,并生成图像报...

23910

MXFP4量化:如何在80GB GPU上运行1200亿参数的GPT-OSS模型

deephub

大型语言模型(Large Language Models, LLMs)如GPT-OSS、GPT-4、LLaMA和Mixtral的快速发展显著提升了人工智能的能力...

30010

JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程

deephub

NumPy作为Python数值计算领域的基础框架,凭借其强大的N维数组结构和丰富的函数生态系统,成为科学家、工程师和数据分析师的核心工具。然而,随着计算需求的快...

12110

构建高性能LLM推理服务的完整方案:单GPU处理172个查询/秒、10万并发仅需15美元/小时

deephub

在构建智能代理、检索增强生成(RAG)系统或大语言模型应用时,核心组件往往是通过API访问的大语言模型(LLM)。专业的服务提供商通过模型优化技术实现高效且可扩...

28510

CUDA重大更新:原生Python可直接编写高性能GPU程序

deephub

NVIDIA 在2025年GTC大会上宣布了一项具有里程碑意义的技术更新:CUDA并行计算平台正式支持原生Python编程。这一突破性进展将消除Python开发...

17610

CPU、GPU、NPU、TPU、DPU的简单了解

小驰行动派

这是一个以计算和存储为核心的架构, CPU 作为处理器单元,负责完成各种算术和逻辑计算。而内存(运存)和硬盘(外部存储),负责存储数据,与 CPU 交互。

56210

第七章:CPU与GPU计算引擎实现

javpower

计算引擎是向量搜索系统性能的关键,通过CPU和GPU的协同工作,可以显著提升系统的计算效率。

12710

周鸿祎 感慨国产 GPU 追赶速度令人惊叹:NVIDIA 做了 30 年,华为才几年

码农编程进阶笔记

日前,360集团创始人、董事长周鸿祎发视频解读称,黄仁勋携H20芯片重返中国,背后藏着中美AI竞争信号。

10910

当你的GPU意识到你看过这份文档后,就知道自己又少了一个摸鱼的机会

Hammerspace

主持人David Nicholson与Hammerspace全球市场高级副总裁Molly Presley以采访对话的形式,共同探讨了Hammerspace如何释...

12510
领券