NVIDIA® Quadro RTX™ 8000 使用 NVIDIA Turing™ 架构及 NVIDIA RTX™ 平台,为专业工作流程带来计算机绘图领域十余年来最重大的进步。设计师和艺术家现在可以利用硬件加速光线追踪,深度学习,和高级着色的强大功能,大幅提高生产力,并以前所未有的速度创作出色的内容。
Quadro RTX 8000具有72个用于即时光线追踪的RT核心和用于AI增强工作流程的576个Tensor核心,可实现超过130 TFLOPS的深度学习效能。 Quadro RTX 8000采用48 GB GDDR6内存,可通过 NVIDIA NVLink 技术扩展至96 GB,可适用于大容量内存需求的高负载工作,例如创造最复杂的模型,建构大量架构数据集,可视化大量数据科学工作负载,使用实时8K电影内容,加快高分辨率之最终渲染速度。 VirtualLink® 提供与下一代高分辨率VR 头戴式显示器的连接,使您可以在最引人注目的虚拟环境中查看您的工作。
性能特点
Turing 结合了新的硬件光线追踪引擎,是业界第一个支持即时光线追踪的绘图处理器。 单张 Quadro RTX 8000 可以产生复杂的专业模型,包含精确的物理阴影,反射,折射,让使用者可立即查看。Quadro RTX 8000 系统与利用 NVIDIA OptiX, Microsoft DXR 和 Vulcan 光线追踪等 API 的应用程序共同运作,将为真正交互式设计工作流程提供动力,并为空前等级的生产力提供立即回馈。
Turing GPU 为了深度学习矩阵运算而设计,为神经网络训练和推理功能的核心,包括加强的Tensor核心,除了 INT8 和两个新的 INT4 和 INT1 (二进制) 精度模式以外,还可加速 FP16 / FP32 矩阵运算。独立的浮点和整数数据路径,利用运算和地址计算的混合方式,可让工作负载更有效率地执行。
网格着色提供基于运算的几何管线,以加速几何复杂模型和场景的处理和剔除,效能提升可达 2 倍。动态调整着色对 GPU 运算力分配方式提供更细微的控制 (意即更多周期用在场景中细节较多的区域,较少周期用在细节较少的区域),可在相同的画面质量下提高效能,或节省一半的时间产生着色像素并提供相近的画面质量。材质空间着色特别适用于 VR 体验,可以用不同速率处理着色和几何样本,执行起来更有效率。
Turing 架构建立在 SM 大幅强化的 Volta GPU 上,能源效率比上一代的 Pascal 高 50%,在相同的功耗范围内大幅提高效能。
Quadro RTX 8000 配备业界最高 48GB 最先进的 GDDR6 内存,吞吐量比前一代的 GDDR5x 技术提高 55%,极为适合应付专门处理大型数据集并对延迟敏感的专业应用程序。
符合关键性任务应用程序对数据完整性的严格需求,为工作站提供无可比拟的计算精确度和可靠性。
H.264 编码码率/质量改进以调节效能降低码率 (例如,在同样效能等级约为 6%,在降低效能时约为 11%)。编码的比特流及动态向量的绘图内存输出,以加速端对端的 GPU 工作流程的后制处理。4x4 粒度的光流以改进影像画格内插/外推,对象追踪,动作分割,动作识别等。I-画格只针对 H.264 和 HEVC 译码,可以只用 I-画格进行推理,以加速影像监控等用途。VP9 10/12 位译码,支持 VP9 HBD 内容解碼。
像素等级抢占提供更细微的控制,对时间相关的工作支持更佳,例如 VR 动态追踪。
指令等级抢占提供对计算工作更精细的控制,以避免长时间执行的应用程序独占系统资源或超时。
用 NVLink 连接两张 Quadro RTX 8000 将有效可用内存加倍,并可利用高达 100GB/s (双向总带宽) 的 GPU 对 GPU 数据传输率将应用程序效能扩张。
利用多个 GPU 动态扩展绘图效能,加强影像质量,扩大显示空间,并组装一套完全虚拟化的系统。
影像质量
使用高达 64X FSAA (SLI 模式下 128倍) 大幅降低视觉混迭伪像或「锯齿」以获得优秀的影像质量和极为逼真的场景。
材质来自并成像到 32K x 32K 表面以支持需要最高分辨率和质量的图像处理应用程序。
显示特性
VirtualLink 基于开放式业界标准,可将现有 VR 头盔的分辨率加倍,以支持下一代头戴式显示器更身历其境的体验。VirtualLink 将显示,USB,电源等多条扁平电缆整合为单一连接线,降低设定的复杂程度。
支持最多四个 5K 屏幕 @ 60Hz,或每卡两个 8K 显示器。Quadro RTX 8000 支持 HDR 色彩,包括 4K @ 120Hz 10/12b HEVC 译码以及高达 4K @ 60Hz 10b HEVC 编码。 每个 DisplayPort 连接头可驱动 4096x2160 @ 120 Hz 的超高分辨率及 30-bit 色彩。
在单一大型显示器或多显示器环境下让终端用户对桌面体验取得前所未有的的控制,以提高生产力。
将桌面和应用程序从单一工作站扩展到最多 4 个 GPU 和 16 个显示器,同时提供完整的效能和影像质量。
在单一系统的 8 个 GPU 中同步最多 32 个显示器的显示和画面输出 (透过两张 Sync II 适配卡连接),减少建立高阶影像可视化环境所需的机器数量。
每个框页锁连接器都设计有自动锁定保持机制,以确保与框页锁定扁平电缆的连接,提供强大的连接性和最高的生产力。
为专业应用程序提供流畅与身历其境的 3D 立体体验。
在最大 32K 桌面大小的高分辨率显示器上获得更多 Mosaic 拓扑选择。
稳定控制三维效果,经由专属连接直接将 3D 立体硬件同步到 Quadro 显卡。
软件支持
深度学习框架例如 Caffe2, MXNet, CNTK, TensorFlow 等可以大幅加快训练时间并提高多节点训练效能。GPU 加速函式库如 cuDNN, cuBLAS, 和 TensorRT 为深度学习推理和高速计算 (HPC) 应用程序提供更高的效能。
原生执行标准程序语言如 C/C++ 和 Fortran,以及 API 如 OpenCL,OpenACC 和 Direct Compute,以加速光线追踪,影片和图像处理,以及流体力学计算等技术。
单一无缝的 49 位虚拟地址空间可让数据在 CPU 和 GPU 完全分配的内存内透明的移动。
GPUDirect for Video 经由避免不必要的系统内存数据复制和 CPU 负担来加速 GPU 和影像 I/O 装置间的沟通。
M将系统正常运作时间最大化,无缝管理大规模部署并远程控制图形和显示设置,以实现高效率运作。