在2022秋季GTC大会上,NVIDIA正式对外发布了最新一代的桌面显卡 — — GeForce RTX 40系列。
这是一款采用了NVIDIA全新Ada Lovelace架构核心的显卡,并且黄CEO还为我们介绍了Ada Lovelace架构众多全新的特性。
包括:TSMC 4N定制工艺、DLSS 3、流式多处理器、第三代RT Cores、第四代Tensor Cores、着色器执行重排序(SER)、Ada光流加速器,以及双NVIDIA编码器(NVENC)等,还真有点牙膏挤爆的感觉。
其中首批推出的显卡包括了GeForce RTX 4090、GeForce RTX 4080(16GB/12GB)版本。
而NVIDIA将限量推出RTX 4090和RTX 4080(16GB)FE版。RTX 4090将于10月12日上市,建议零售价12999元起;RTX 4080(16GB/12GB)将于11月上市,建议零售价分别为9499元起和7199元起。
从性能和零售报价来看,此款三款显卡的定价似乎都有点合理,毕竟性能提升基本是同级上代显卡的二倍,功耗也保留在同级水平上,那持平的零售报价也是比较理想了。
除了NVIDIA的FE版本外,国内的华硕、七彩虹、耕升、影驰、技嘉、映众、微星和索泰等顶级显卡供应商将会推出GeForce RTX 4090和4080 GPU标频版和超频版。
AIC非公版也出炉了,现在就来看看手上能提供给大家的资料吧。由于NDA是10月12号,目前我们手上的资料并不算太多,或者是我们目前能告诉大家的资料是相当有限的,所以直接拿现成的影驰显卡规格表来说说。
首发的GeForce RTX 4090、GeForce RTX 4080(16GB/12GB)三款显卡均采用了最新的TSMC 4N定制工艺技术,架构是刚才我们已经说到过的Ada Lovelace架构(简写“ADA”)。
GeForce RTX 4090是目前规格最高的,核心代号为AD102-300,具有760亿个晶体管、16384个CUDA核心和24 GB高速美光GDDR6X显存,8K HDR游戏完全不是事。
GeForce RTX 4080 16GB采用了另外一款核心,核心代号为AD103-300,拥有9728个CUDA核心和16 GB高速美光GDDR6X显存,显存位宽也缩减到了256Bit,但显存频率是三者中最高的。
GeForce RTX 4080 12GB规格更低一些,核心代号为AD104-400,拥有7680个CUDA核心和12GB 美光 GDDR6X显存,显存位宽仅为192Bit。
按照NVIDIA官方给出的资料来看,目前的AD102-300核心规格并非全满血版本(有一定的削减),类似于上代RTX 3090与RTX 3090Ti的关系。
同时RTX 40系列与30系列显卡将会同场竞技一段时间,啥时候才推出新的东西,按照之前上代RTX 30系列显卡的节奏来看,预估得是三个月后了。
从规格来看,往下其实也难办,GeForce RTX 4080显存显存位宽都到192Bit了,那我们猜想一下,或者 可能 未来的GeForce RTX 4060注定是AD106+128Bit???废话有点多了,我们再来看一下Ada Lovelace架构新特性。
Ada Lovelace架构
Ada Lovelace架构的命名还真有点意思了,根据百度百科出来的资料,Ada Lovelace 人称“数字女王”,编写了历史上首款电脑程序,是被世界公认的第一位计算机程序员。不知道这样的命名是否意味着NVIDIA想凭借GeForce RTX 40系列显卡的出现重新定义显卡。
制程方向NVIDIA一直都是相当激进的,采用了TSMC台积电定制4N工艺技术,AD102核心就能塞下760亿个晶体管,官方说有超过18000个CUDA核心,意味着RTX 4090采用的AD102核心并非满血版本。
但即使是这样,Ada Lovelace架构核心仍未上一代的Ampere架构多出了约70%的晶体管数量,同时实现了高达2倍的性能功耗比。只能说Ada Lovelace架构+TSMC 4N组合是真的猛,不过450W TDP对于显卡散热还真压力不少。
首先是流式多处理器,GTC2022老黄为我们介绍的是90 TFLOPS,但NVIDIA官方新闻稿介绍的是RTX 4090具有高达83 TFLOPS的着色器能力,那这样来看满核心的AD102会是90 TFLOPS的峰值计算能力;
相比RTX 3090 Ti显卡的满规格GA102核心40 TFLOPS,还真的提升了两倍有多。
其次是第三代RT Cores与两个重要硬件单元:Opacity Micromap引擎与全新的Micro-Mesh引擎,可以为我们提供2倍的光线与三角形求交性能。
说人话就是GeForce RTX 40系列显卡将会有着更为强劲的光线追踪能力,即使环境与物体的渲染几何更为复杂也有能实现物理准确的图形计算。
第三个提升是第四代Tensor Cores,FP8张量处理性能性能提升到了1.32 Petaflops,比上一代强出了5倍。
更强劲的算力意味着显卡的深度学习能力越强,AI算力也会提升越大,包括在使用NVIDIA Omniverse与NVIDIA Broadcast,能帮助我们实现更高效的运算。
第四个着色器执行重排序(SER),看图就很容易理解出SER的作用(调度器),按照NVIDIA官方的讲法:“通过即时重新安排着色器负载来提高执行效率,从而更好地利用GPU资源。
作为与CPU的乱序执行一样的重大创新,SER为光线追踪带来最高可达3倍的性能提升,整体游戏性能提升可高达25%。”意味着SER能提前梳理好运算任务,SM单元再根据需求完成任务。
可以看到每一代的RTX显卡都有显著的技术提升,尤其是GeForce RTX 40系列显卡作为第三代RTX显卡能够提供更强劲光线追踪性能的同时,还实现了更快速、高效的实时运算。
而前面说了一堆,其实都是为了引出NVIDIA最新一代的用于游戏和创作应用的 Deep Learning Super Sampling深度学习超级采样技术DLSS 3,上一代的DLSS 2技术就已经相当的强劲,但是Ada Lovelace架构配合下的DLSS 3将会是神经网络图形技术的下一次革命。
DLSS 3也可以通过允许GPU生成全新帧来克服受CPU限制的游戏,利用人工智能驱动的技术可以生成全新帧,从而大幅提高游戏性能。
并且这一技术早就已经在全球最热门的游戏引擎包括Unity Engine和虚幻引擎中使用并得到了众多全球领先的游戏开发者的支持。
除此之外,我们还能使用NVIDIA Omniverse中的NVIDIA RTX Remix,对经典游戏添加RTX效果。
当我们捕捉游戏素材到一些游戏素材后,我们可以通过RTX Remix软件配合GeForce RTX 40系列显卡的强大运算能力,利用AI辅助工具集包含的深度学习模型来提升纹理和素材的分辨率;
也可以使用一个AI模型把材质转换成具有精确物理属性的材质,例如增加光效等,这样我们就可以把一款旧游戏变得更加的RTX。
*PS更新
我们从NVIDIA官网上可以看到了初部RTX 4090显卡的性能,当GeForce RTX 40 系列显卡和 NVIDIA Reflex搭配上后,直接达到1440p分辨率360 FPS的体验,这着实是性能有点强劲了。
同时还有4 款 1440p 分辨率的新型 G-SYNC 电竞显示器将要发布,包括采用mini-LED技术的AOC AG274QGM – AGON PRO Mini LED、MSI MEG 271Q Mini LED 和 ViewSonic XG272G-2K Mini LED三款显示器刷新率均为300Hz。
而最猛的是ASUS ROG Swift 360 Hz PG27AQN ,刷新率直接来到了360Hz。
兼容 NVIDIA Reflex 的鼠标也迎来了三款新品:联想拯救者 M600s 无线游戏鼠标、联想拯救者 M600s Qi 无线游戏鼠标以及 ROCCAT Kone XP Air 游戏鼠标。
Reflex 游戏鼠标有何作用?当你的电脑使用上RTX 40或者是RTX 30系列显卡,配备 Reflex 的 G-SYNC 显示器以及NVIDIA Reflex 游戏,这时你的鼠标就能全面实现端对端的超低迟延,从而提升游戏性能。
GeForce RTX 40 系列显卡还有一个全新的升级,那就是双编码器,支持开放式视频编码格式 AV1。包括剪映专业版、DaVinci Resolve、以及 Adobe Premiere Pro 较为流行的 Voukoder 插件均支持 AV1,且均可通过编码预设使用双编码器,这样我们等待视频导出的时间缩短将近一半。
不单是视频制作软件,AV1格式也将会是主播、游戏直播UP主们的新宠儿,在保证画面最高质量的情况下,AV1 编码器可将效率提高 40%,同时显卡的占用也更低。
包括OBS Studio一一代软件中也会增加AV1格式的支持。另外我们还能通过 GeForce Experience 和 OBS Studio 录制高达 8K60 的内容,这样我们做游戏录制也会变得更为轻松。
当然2022秋季GTC大会其实还有许多的亮点,包括Omniverse的应用与案例、Thor处理器、NVIDIA DRIVER平台、Jetson Orin Nano微弄机器人计算机等,这些大家感兴趣的可以到NVIDIA官方上看重播。
至于GeForce RTX 40系列显卡的性能表现如何,等到10月12号解禁后,我们就可以知道了。
责任编辑:振亭
标签: RTX 4090 RTX 4070 Ti