首页
学习
活动
专区
圈层
工具
发布

#cuda

NVIDIA CUDA 13.2 发布:性能跃升与生态完善的双重突破

GPUS Lady

2026 年 3 月 5 日,NVIDIA 正式推出 CUDA Toolkit 13.2 版本,作为全球领先的并行计算平台与编程模型,此次更新在核心架构优化、计...

26410

CUDA 13.2:增强Tile支持与Python新特性

用户11764306

cuda.core 0.6 引入了用于 GPU 监控和管理的 NVML 绑定(cuda.bindings.nvml),以及用于胖二进制文件操作的新 nvFatb...

22200

多进程CUDA初始化的问题 Cannot re-initialize CUDA in forked subprocess

Michael阿明

上面这个例子会报错,主进程触发了 CUDA 初始化,fork 出来的子进程中创建 tensor 的时候报错了

11210

使用NVIDIA CUDA Tile编写高性能矩阵乘法

用户11764306

本文是帮助开发者学习NVIDIA CUDA Tile编程以构建高性能GPU核函数系列文章的一部分,以矩阵乘法作为核心示例。

20310

Jim Keller:英伟达“CUDA护城河”将终结?

芯智讯

12月9日消息,英伟达近日正式发布了“NVIDIA CUDA Toolkit 13.1”,其中“CUDA Tile”是最核心的更新,这是英伟达基于 Tile 的...

18410

为更好与英伟达CUDA竞争,华为CANN全面开源

芯智讯

8月5日,在北京召开的昇腾计算产业发展峰会上,华为轮值董事长徐直军宣布,华为CANN Mind系列应用套件及工具链全面开源,支持用户自主的深度挖潜和自定义开发,...

19110

英伟达N1X细节曝光:20核CPU、6144个CUDA计算单元

芯智讯

7月27日消息,人工智能芯片大厂英伟达(NVIDIA)与联发科合作的首款 Windows on Arm PC处理器N1X的更多细节信息被曝光,其集成的GPU配备...

22110

英伟达官宣:CUDA将全面支持RISC-V架构!

芯智讯

2025年7月17日,2025年RISC-V中国峰会正式在中国上海张江召开。人工智能芯片大厂英伟达(NVIDIA)副总裁 Frans Sijstermanns做...

15310

Window11 使用WSL2 Ubuntu RTX 5070 GPU 踩过的坑

用户9732312

首先打开控制面板——按下键盘【Win徽标键 + R键】,在“运行”窗口中输入“control”并回车

50710

CUDA is the incumbent,but is it any good?-Democratizing AI Part4

用户9732312

判断CUDA的“优劣”远非表面看起来那么简单。我们讨论的是其原始性能?功能特性?还是它在AI开发领域中的广泛影响?CUDA的“好坏”取决于提问者的身份与需求。本...

14310

Democratizing AI Compute, Part 3: How did CUDA succeed?

用户9732312

如果我们希望作为一个生态系统取得进步,就需要理解CUDA是如何变得如此强大的。理论上存在替代方案——AMD的ROCm、Intel的oneAPI、基于SYCL的框...

13810

Democratizing AI Compute, Part 2: What exactly is “CUDA”?

用户9732312

It seems like everyone has started talking about CUDA in the last year: It’s the...

11410

38:WSL2 CUDA不可用问题:全面分析与解决方案

安全风信子

作者: HOS(安全风信子) 日期: 2024-10-19 主要来源平台: GitHub 摘要: 本文深入分析WSL2环境中CUDA不可用的常见原因与解决...

43310

36:【2026】flash-attention/vLLM安装失败完整解决方案 - CUDA架构/版本适配

安全风信子

作者: HOS(安全风信子) 日期: 2026-02-16 主要来源平台: GitHub 摘要: 本文深入分析2026年flash-attention和v...

70410

29:【flash-attention / vLLM】安装失败(CUDA架构/版本不符)

安全风信子

作者: HOS(安全风信子) 日期: 2026-01-01 主要来源平台: GitHub 摘要: 本文详细分析2026年flash-attention和v...

32310

26:【CUDA Tile / Blackwell】新架构报错 no kernel image / compute capability不匹配

安全风信子

作者: HOS(安全风信子) 日期: 2026-01-01 主要来源平台: GitHub 摘要: 本文详细分析2026年NVIDIA最新的CUDA Til...

16010

CUB单次调用API:简化GPU并行算法开发

用户11764306

C++模板库CUB是实现高性能GPU基础算法(如扫描、排序、归约等)的首选工具。然而,其传统的“两阶段”API需要先估算临时内存大小,再显式分配内存并执行内核,...

11010

Sirius:GPU加速DuckDB,刷新ClickBench纪录

用户11764306

Sirius是一个GPU原生的SQL引擎,旨在为DuckDB提供即插即用的加速功能,未来也将支持其他数据系统。

11210

聚焦算法:深入解析NVIDIA CUDA Tile硬件抽象技术

用户11764306

随着自2006年NVIDIA CUDA平台发明以来最大的一次进步,CUDA 13.1推出了NVIDIA CUDA Tile。这项激动人心的创新引入了一个用于基于...

12210

老黄大出血!OpenAI背刺英伟达,微软自研芯连夜拆掉CUDA护城河?

新智元

老黄的噩梦成真了!2026年1月26日,微软数据中心(爱荷华)一声巨响,黄仁勋的后背瞬间凉透。

17610
领券