雷峰网(公众号:雷峰网)消息,9月20日的GTC活动上,英伟达CEO黄仁勋在演讲中发布了万众瞩目的英伟达新一代游戏显卡 RTX40系列。
本次英伟达共发布了三款显卡,分别是RTX 40系旗舰显卡RTX 4090与定位高端的RTX 4080 16GB、RTX 4080 12GB。
RTX 40系列显卡采用了新一代RTX架构,计算能力再次实现跨越式发展。而光追技术的全新升级与DLSS3的加入,也为游戏玩家带来了全新的升级体验。
RTX 4090显卡将在10月12日上市,而RTX 4080显卡则将在11月上市。
加量也加价,40系显卡性能、价格双「越级」
RTX4090采用了全新的第三代RTX架构,并使用台积电4N工艺制造。
新一代RTX以世界上第一位计算机程序员Ada Lovelace的名字命名,黄仁勋在演讲中表示,得益于英伟达与台积电的紧密合作,专为GPU制造优化的4N工艺让Ada Lovelace架构能够集成760亿个晶体管和超过18000个CUDA核心,较上一代Ampere架构多70%,能耗比相较Ampere则提升一倍。
图 新一代Ada架构
采用了Ada架构的40系显卡在性能表现上远远超过前辈30系显卡。
旗舰定位的RTX 4090集成了760亿个晶体管、16384个CUDA核心,并拥有24GB显存。
英伟达表示,在强大硬件指标的加持下,RTX 4090显卡即使在4K分辨率下,依然可以获得超过100FPS的流畅游戏体验。
能效方面,RTX 4090功率为450W,与RTX 3090Ti保持一致,但英伟达称在同样功率下,4090的游戏表现较RTX 3090Ti提升一倍。
定位低一档的RTX 4080则有16GB与12GB两个显存版本,16GB版本集成了9728个DUDA核心。英伟达称RTX 4080 16GB的游戏性能两倍于RTX 3080,并超过了上一代旗舰RTX 3090 Ti。
而12GB版本的RTX 4080则集成了7680个CUDA核心,理论性能也超越了上一代旗舰RTX 3090 Ti。
全新架构还搭载了Opacity Micromap引擎,将光线追踪的Alpha-Test集合性能提升2倍。全新的Micro-Mesh引擎则能够在不带来更多的BVH构建和存储资源消耗的前提下提升图形的丰富度。
最后,全新Tensor Core新增了Hooper FP8 Transformer Engine可以提供1.4 petaFLOPS张量处理性能。在性能获得巨大升级的同时,这一代英伟达游戏显卡的价格也再创新高。
RTX 4090建议零售价为12999人民币起,相比上一代RTX 3090 11999元的其售价涨价1000元。
图 RTX 40系列显卡售价
而RTX 4080价格则上探到了9499元,相较上一代RTX 3080 5499元的起售价可谓完成“消费升级”。即使结合英伟达本代显卡将没有RTX 4080Ti的传闻,RTX 4080 16GB的其售价也比上一代同定位的RTX 3080 Ti的9499元略有提价。
更低配置的RTX 4080 12GB的其售价也高达7199元,与上一代同定位的RTX 3070Ti的4499元售价也涨势凶猛。
光追再升级,游戏中AI“偷天换日”
本次RTX 40系列显卡最重要的升级之一就是对光线追踪技术的升级。
RTX系列显卡最初问世就以光线追踪为特色功能,本次40系的更新更是“牙膏挤爆”,正如英伟达CEO黄仁勋所说:“英伟达重新定义了图形。”
新的Ada Lovelace架构具有高达90TFLOPs的着色器能力,吞吐量超过上一代产品两倍。除此之外,Ada架构的SM多单元流处理器还使用了着色器重排序技术(SER),可实现对任务的实时重新调度。黄仁勋强调这项技术对GPU来说是革命性的,原理上与CPU的乱序执行技术类似。
对于这项技术,黄仁勋在演讲中解释道,光线追踪的工作负载需要不同的线程处理,不同着色器之间很难合并工作,SER技术则能够即时安排着色器负载,从而提高执行效率,更好地利用GPU资源,打造更好的光线追踪效果。
图 SER技术工作原理
这项技术能够让英伟达显卡光线追踪性能提升2-3倍,整体游戏性能提升25%。
在提升计算能力之外,英伟达还通过多种方式提升终端游戏体验。在演讲中,黄仁勋表示,和加速计算一样,计算机图形的也是一项全栈挑战。要实现突破还需要在架构、设计和算法上创新。
此前在RTX显卡上始终扮演着重要角色的DLSS技术本次也迎来了重大更新。
在RTX显卡上,DLSS技术一直是光线追踪技术的重要“搭档”:光线追踪模拟出更真实、更贴近现实效果的游戏场景,DLSS技术则利用AI算法降低模拟这样的真实物理环境所需要的计算量,保证用户流畅的游戏体验。
这次,第三代DLSS技术同RTX 40系显卡一同登场,并带来了开创性的光学多帧生成功能。
与之前最大的不同在于,第三代DLSS技术生成的不再是像素,而是全面的画面帧。
基于Ada Lovelace架构的新光流加速器,第三代DLSS技术可以分析两帧连续的游戏图像,并向神经网络输入像素级的从帧到帧的运动方向和速度信息,此后神经网络模型将据此计算出中间帧。
这样的中间帧由神经网络计算生成,不再涉及图形渲染,完全独立于游戏。这能够大大减轻游戏中即时演算的运算量。
通俗的讲,游戏中的画面是由GPU这个“画家“通过算力的”画笔“创造的,DLSS3技术能在两张画作之间插入了一张AI生成的”照片“,从而彻底解放GPU”画家“的双手。
英伟达表示第三代DLSS技术相较于单纯渲染的方式可以将游戏性能提高4倍。
黄仁勋表示,DLSS 3能够为Ada GPU带来远高于CPU可计算的帧率,从而让一些对CPU要求较高的游戏也从中受益。
在现场,英伟达展示了两款对CPU要求较高的游戏,在开启DLSS3后,《赛博朋克2077》与《微软模拟飞行》的帧率增加都超过一倍,达到90帧以上。
图 开启DLSS3前后,《微软模拟飞行》帧率变化
《传送门》连接过往与将来,英伟达冲向元宇宙
游戏,是RTX 40系列发布时一个重要话题。
在发布40系显卡的同时,本次英伟达还颇有复古精神的带来了经典游戏《传送门》重制版。
这款被称为《传送门RTX》的游戏,实际上是英伟达基于其元宇宙创作平台onmiverse创建的一个mod。
图 使用光追技术的《传送门》重制版
英伟达巧妙地用《传送门》,连接起了过去和未来。
正如这一经典游戏的玩法:开启传送门,走向另一端。
在英伟达看来,传送门的另一端无疑是属于元宇宙的世界。
黄仁勋表示,mod是一种受众庞大的游戏文化,各种游戏mod每年下载量已经突破数十亿次。在10款最热门的竞技游戏中,有9款都能见到mod的身影。
英伟达为游戏mod设计者打造了一款名为RTX Remix的Ominverse应用。
基于该工具,游戏开发者可以为各种经典游戏制作mod添加RTX光追效果。
基于该工具,mod制作者需要将游戏导入USD中,然后使用modding工具来创建光线追踪mod,并导出至RTX渲染器。该工具还使用AI技术,以提升mod材质的质感。
英伟达在几年前就已经创建了名为Onmiverse的元宇宙创意平台,让元宇宙开发者可以通过这个3D平台互相连接并共同协作。
无论是RTX 40系列显卡更强的GPU算力,还是更真实的光追效果,都无疑将会为元宇宙的生态贡献更强的力量。
在老黄演讲的开头,是一段RacerX演示的demo。RacerX是基于Omniverse构建的全交互式仿真演示,其中所有的基于现实物理规律,所有光照、反射和折射则采用光线追踪技术。
这也许昭示着英伟达眼中的未来:在更加强大的显卡性能与AI能力加持下的更加真实的游戏体验和元宇宙场景。