首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

MLSys提前看 | 机器学习的分布式优化方法

随着机器学习算法和模型的不断发展,传统的软硬件平台、部署环境等无法支撑机器学习的应用,这也成为了目前机器学习方法落地及大规模推广应用的主要困难之一。目前,有关于 MLSys 的研究方向包括硬件领域、软件领域和对机器学习算法的改进三个方面,以 MLSys 2020 为例,本届大会的议题包括:Distributed and parallel learning algorithms(5 篇论文)、Efficient model training(8 篇论文)、Efficient inference and model serving(8 篇论文)、Model/Data Quality and Privacy(4 篇论文)、ML programming models and abstractions & ML applied to systems(5 篇论文)以及 Quantization of deep neural networks(4 篇论文)。整个会议一共录用 34 篇论文。

04

GPU是怎么勾搭NVMe的

很久很久以前,CPU和内存是分离的,内存控制器位于北桥。CPU每次取数据都要经过北桥中转,CPU嫌太慢,于是,把内存控制器直接集成到了自己内部,而北桥则只保留PCIE控制器。再后来,嫌PCIE控制器也离得太远了,就也把它收归麾下,北桥成了光杆司令,于是退出了历史舞台。现在的主板上只有CPU和I/O桥在一唱一和。突然不知哪天,杀出来了个GPU,之前人们也未曾想过GPU除了渲染图像还能做更多事情,甚至被用来挖矿。GPU也要访问内存,但是现在访问内存要从CPU走一圈,GPU不干了,明明是我在计算,CPU只是控制,为啥我要不远万里从CPU那取数据。于是,GPU和NVMe盘开始勾搭上了。欲知详情,往下看。

04

(下)基于算力加速的量子模拟问题

在异构并行计算的大潮中,显卡巨头NVIDIA(英伟达)的研发团队宣布NVIDIA进军量子计算领域为量子开发者构建开发工具。NVIDIA的愿景是开发出一种混合计算模型,其中量子计算机和经典计算机可以协同工作,分别处理各自最擅长的问题。在经典-量子混合计算研究中有一个极具潜力的发展方向——经典计算机可以调用一个相对较小的量子“协处理器”做一些关键计算,其作用类似于图形处理单元GPU。研究人员期望将QPU当作一类强大的加速器,使经典和量子系统连接成混合量子计算机。混合量子计算机首先需要在GPU和QPU之间建立快速、低延迟的连接,GPU负责电路优化、校正和纠错一类传统工作,以缩短GPU执行时间。其次,量子计算行业需要一个统一且高效易用的编程模型和一个编译器工具。英伟达对提高带宽、降低延迟的设计处理等为QPU的研发提供了思路和启发,这方面最近的革新包括:第四代NVLINK和第三代NVSWITCH、InfiniBand、自研Grace CPU等。

02
领券