雷锋网消息,英伟达CEO黄仁勋(Jensen Huang)在今日的SIGGRAPH 2018上正式发布了此前已被曝光的新一代GPU架构——Turing(图灵)。同时,一系列基于图灵架构的GPU包括Quadro RTX 8000、Quadro RTX 6000、Quadro RTX 5000以及Quadro RTX Server、CUDA10也共同亮相。
黄仁勋表示:“图灵架构是自2006年CUDA GPU发明以来最大的飞跃,Quadro RTX系列也是全球首批支持即时光线追踪(Real Time Ray Tracing)的GPU。”
图灵(Turing)架构
黄仁勋将图灵架构描述为英伟达十多年来在计算机图形领域最重要的创新。这是一个很明确的标准,图灵架构是英伟达的第八代GPU架构,使全球首款光线追踪GPU成为可能,也是超过一万个工程师的努力成果。图灵架构承载了RT核心(RT Core)以及全新张量核心(Tensor Core)。
RT核心专门用于实时光线追踪的处理器,能对光线和声音在3D环境中的传播进行加速计算,据称它的实时光线追踪能力提升到了Pascal架构的25倍。张量核心是为深度学习训练和推断加速的处理器,支持每秒500万亿次张量运算。这些新功能包括DLAA(深度学习抗锯齿),以及去噪、分辨率缩放和视频调速。这些特性是NVIDIA NGX 软件开发套件的一部分,这种全新深度学习技术堆栈可助力开发者通过预先训练的网络,轻松地在应用中集成加速且增强的图形、照片成像和视频处理。
英伟达承若图灵架构GPU模拟物理世界的能力将比Pascal架构提升6倍。
需要补充的是,RTX光线追踪技术(Ray-Tracing)是英伟达在3月发布新技术,这项新技术能够计算光线反射、折射、散射等路线,渲染出逼真的画面,可为游戏开发者提供电影级画质的实时渲染。更具体的来说,就是在真实世界中,我们看到的3D物体被光源照亮,且光子可以在到达观看者的眼睛以前从一个物体反弹到另一个物体。光线追踪技术则反过来,通过从观者眼睛(观景式照相机)反向追踪光线捕捉这些效果,通过追踪2D视表面上每个像素的光线的路径,并应用到场景的3D模型中。
实时光线追踪技术过去只在影视作品的CG制作中出现,一般是用几天时间,渲染出几帧动画,这个动画的阴影、金属和水面的折射以及反射等都很逼真。
全球首批即时光线追踪GPU——Quadro RTX
黄仁勋在SIGGRAPH 2018上同时带来了全球首批支持即时光线追踪的GPU——Quadro RTX系列。Quadro是英伟达的专业级显卡,主要面向设计、特效、科学可视化等视觉计算任务。
基于图灵架构的GPU采用了流式多处理器(SM)架构,该架构新增了与浮点数据路径并行执行的整数执行单元,以及带宽为早前架构两倍的全新统一缓存架构。结合可变速率着色等全新图形技术,图灵流式多处理器架构实现了前所未有的单核性能水平。
新发布的Quadro RTX包括三款产品,分别是Quadro RTX 8000、Quadro RTX 6000、Quadro RTX 5000,具有16T单精度浮点性能,每秒10G GigaRays/sec(GigaRays/sec,用来描述光线追踪性能),每秒500T OPs深度学习,支持NVLink,每秒100GB,支持每秒500万亿张量的操作。
核心面积增至754平方毫米,最大显存48GB GDDR6,集成186亿晶体管,显存频率14GHz,可实现硬件加速的AI、光线追踪和仿真。
现场,黄仁勋还展示了几帧用Quadro RTX渲染《复仇者联盟3》里蜘蛛侠跳起吐丝的画面。
Quadro RTX系列新品的特性包括:
RT Core可实现对象和环境的实时光线追踪,并做到物理上精确的阴影、反射和折射以及全局光照;
Tensor Core可加速深度神经网络训练和推理;
图灵流式多处理器(Turing Streaming Multiprocessor)架构拥有4608个CUDA core,可提供高达16 teraflops的计算性能,并行运算每秒16万亿次整数运算,以加速模拟真实世界的物理模拟;
先进的可编程着色技术可提高复杂视效和图形密集型工作体验;
首次采用超快速的三星16Gb GDDR6内存,支持更复杂的设计、海量建筑数据集、8K电影内容等;
NVIDIA NVLink可通过高速链路联通两个GPU,将内存容量扩展至96 GB,并可通过高达100GB / s的数据传输提供更高性能;
提供对USB Type-C和VirtualLink的硬件支持;
增强型技术可提高VR应用性能,包括可变速率着色(Variable Rate Shading)、多视角渲染(Multi-View Rendering)和VRWorks Audio。
据雷锋网了解,三款新GPU预计今年第四季度发售,开发人员可以通过新的NVIDIA RTX(TM)访问Quadro RTX,并提供一系列创意应用程序和工具,包括用于光线跟踪,AI,光栅化和模拟的API。价格方面,Quadro RTX 8000配备48GB内存,售价10000美元;Quadro RTX 6000配24GB内存,售价6300美元;Quadro RTX 5000配16GB内,2300美元ESP。
Quadro RTX服务器
在展示基于RTX的Porsche demo后,黄仁勋还发布了Quadro RTX服务器,它将Quadro RTX GPU与明年第一季度将推出新的Quadro Infinity软件相结合,提供强大而灵活的架构,满足创意专业人士的需求。Quadro Infinity将允许多个用户通过虚拟工作站访问单个GPU,从而显着提高数据中心的密度。
据悉,Quadro RTX服务器预装了领先的内容创建和渲染软件,提供功能强大且易于部署的渲染解决方案,可从小型安装扩展到最大的数据中心,仅占CPU成本的四分之一渲染农场。
CUDA10
CUDA是构建英伟达GPU加速的软件,与之前的版本相比相比,CUDA10具有的新特性包括:
支持图灵架构;
新增性能优化库,在16-GPU系统中实现强大的FFT性能扩展;
nvJPEG:用于混合JPEG处理的新库,单个和批量图像解码速度是原来2倍;
CUDA / Graphics Interop:CUDA和图形API之间的新互操作性;
新的开发人员工具:用于跟踪,分析和调试CUDA应用程序的新Nsight产品系列工具。
在软件层面,英伟达还宣布开放MDL。
当然,黄仁勋最后还表示从Adobe(针对Dimension CC)到皮克斯、Siemens、Black Magic、Weta Digital、Epic Games和Autodesk等公司已经签约支持新的图灵架构。雷锋网认为这将让产品设计师、游戏设计师、建筑师们的光线计算开始变得简单。
相关文章: