从我们拿到第一张Ampere架构的非公显卡(忘了哪家的RTX 3080了)开始,就首先感受到的这一代显卡相比上一代显卡最大的变化之一是体积明显增大很多,甚至有显卡已经做到超过三槽的厚度,着实巨无霸的存在,当然这也让其兼容性备受考验。
这样的显卡市场环境对于ITX主机爱好者来说是非常不友好的,受限于ITX机箱的尺寸,其大多都无法容纳较大尺寸的显卡,一张长度与ITX主板边长差不多的小显卡才是他们的心中所许,而微星RTX 3060 AERO ITX OC就是这么一张尺寸小巧的Ampere架构显卡。
RTX 3060 GPU技术回顾采用GA106-300核心RTX 3060 采用了GA106-300-A1核心,核心面积276mm2,生产工艺依然是三星为NVIDIA定制的8nm工艺。
它拥有三组GPC,前两组GPC内有5组TPC,最后的一组GPC则是砍掉了一组TPC,也就是两个SM单元,每个SM单元拥有的CUDA核心是128个。所以GA106-300的CUDA数量就是(3*5*2-2)*128=3584个。
基于新一代Ampere架构的RTX 3060显卡相比RTX 2060 SUPER显卡还多了这一代安培显卡的一些通用特性。
NVIDIA Ampere架构简介RTX 30系显卡上的SM单元相比RTX 20系的,最大变化是加倍了针对传统计算的FP32单元、引入第二代RT Core以及第三代Tensor Core。
大家都知道在Turing架构中,NVIDIA整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算。不过现代游戏应用中最为常见的还是FP32,因此为了提高计算效率NVIDIA在NVIDIA Ampere 架构上引入了可同时支持INT32或FP32两种数据类型的新ALU。也就是说,现在有两条不同的数据路径,一条能够同时处理整数或者单精度浮点,另一条则单纯处理处理单精度浮点计算。
负责进行实时光线追踪运算的专用硬件单元RT Core在NVIDIA Ampere 架构上也更新到了第二代,最主要是增加了动态模糊的加速运算支持。NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率,官方表示最高可达8倍于上代的速度。另外在基础的BVH计算上,第二代RT Core也可以比第一代快2倍。
Tensor Core这个负责运行AI计算的硬件单元在NVIDIA Ampere 架构上也升级到了第三代。其实之前发布的A100计算卡上已经用上了新的第三代Tensor Core,它能够提供比第二代Tensor Core高出4倍的效能,不过游戏卡上面的Tensor Core进行了一定的精简,其FP16 FMA计算的吞吐量只有GA100核心中的Tensor Core的一半。
而第三代Tensor Core带来的更强劲AI运算有些什么用呢? 答案就是DLSS。随着RTX 30系显卡一同发布的,还有DLSS的更新版 - DLSS 8K。顾名思义,DLSS 8K就是通过深度学习技术将画面分辨率拉伸至8K的新版DLSS,具体来说就是把1440P的画面拉伸至4320P,像素数量跨越了整整9倍。
将不同类型的计算交给不同的单元去处理是从NVIDIA Volta架构就开始采纳的一种理念,当时引入的Tensor Core分流了很多AI相关的运算,而在其后引入的RT Core又将实时光线追踪相关的计算给分流了。但在Turing架构GPU上做不到全部运算都能够并行执行,到了Ampere架构上,NVIDIA提升了GPU内部各种单元之间的并行性,现在传统计算单元、RT Core和Tensor Core这三大单元可以同时工作,在原本基础上继续缩短帧渲染时间。
再之后就是HDMI 2.1这个备受期待的新输出端口了。在HDMI 2.1之下,显卡可以用单线材做到8K60Hz或者4K120Hz的输出。对于想用大尺寸电视打游戏的玩家来说是一个不错的福音。
最后当然就是NVIDIA新推出的RTX IO了。这项技术是NVIDIA借助微软此前推出的DirectStorage API来实现的,将会作为插件的形式与后者整合,可以让显卡绕开cpu直接读取SSD数据,从而降低CPU的占用率。
NVIDIA Reflex伴随RTX 30系显卡一同发布的,有一个对于电竞游戏,或者更仔细地说对于电竞选手来说很重要的新东西,那就是NVIDIA Reflex。那么这个NVIDIA Reflex到底是什么东西呢?其实它是分为两部分的,一部分是硬件,一部分是软件。
硬件部分是一个与我们这次使用的LDAT很相似的东西,叫Reflex Latency Analyzer,它其实可以视作为LDAT的一个进阶版本,是直接预安装在显示器里的,可以用来测量玩家从点击鼠标直到画面出现变化之间的时间差,也就是整套系统的所有延迟。
而软件部分则是NVIDIA Reflex SDK。这个NVIDIA Reflex SDK的作用是降低以及测量渲染延迟的,开发者可以直接整合到游戏内。而在开启其低延迟模式后,可以让CPU与显卡同步,大幅度减少渲染序列,从而降低渲染延迟。
微星RTX 3060 AERO ITX 12G OC显卡规格微星RTX 3060 AERO ITX 12G OC的规格可以参考下表:
显卡外观
微星RTX 3060 AERO ITX 12G OC的长度仅为17.2cm,与ITX主板大小相当,且厚度是双槽设计,意味着即使最小的ITX机箱也能将其容纳其中。受限于尺寸微星RTX 3060 AERO ITX 12G OC仅配备了单风扇,但是为了增加散热效果,这个风扇的规格是很大的,直径达到了98mm,风量相比90mm的风扇要大很多。
该卡配备了背板,可以很好的防止PCB变形,并且降低了显卡受外力损坏的可能性,背板材质不是金属的,微星在背板上进行了些许镂刻设计,这样在机箱的风流下可以有助于带走PCB背面的热量,辅助散热。
接口方面,微星RTX 3060 AERO ITX 12G OC显卡具有一个HDMI2.1接口,三个DP1.4接口,是现在的常规配置,采用了单8pin供电接口,配合PCIE插槽最多可以提供225W的供电,足够该卡稳定运行。
显卡拆解:2根热管,5+2相供电
微星RTX 3060 AERO ITX 12G OC配备了2根热管,这个规模与很多其他品牌的大尺寸RTX 3060显卡一样,但是不及自家的魔龙系列。热管均进行了镀镍处理,既能保证美观又可以防止年久使用发生氧化,细节还是很到位的。
PCB上这次比较留意的是GPU的核心代号,据称英伟达将要用全新的GA106-302芯片取代旧的GA106-300芯片来限制RTX 3060的挖矿性能,预计使用新版GA106-302芯片的GeForce RTX 3060显卡将会在5月份上市,本次拆解的这款微星RTX 3060 AERO ITX 12G OC还是旧的GA106-300芯片,但是仍然不排除后续的该款显卡出货搭载新的GA106-302芯片。
然后就是GPU周围的显存芯片了,仍然是6颗三星的GDDR6显存,型号为K4ZAF325BM-HC16,单颗2GB容量,位宽32bit,6颗一共组成12GB的容量、192bit位宽,显存数据速率为15Gbps。
供电方面,微星RTX 3060 AERO ITX 12G OC采用了一共7相供电,其中核心供电有5相,显存供电2相,核心供电的Mosfet是Alpha & Omega Semiconductor生产的,不过上面仍然只有批次编号,无法得知更详细的信息,而在背面可以看到一颗PWM主控芯片,是常见的uP9512R。
测试部分
从GPU-Z可以看到,在默认的BIOS下,微星RTX 3060 AERO ITX 12G OC显卡的基础频率为1320MHz,Boost频率为1792MHz,而英伟达对于RTX 3060 GPU的公版方案的Boost频率为1777MHz,所以说该卡是出厂预超频了15MHz的。
此外,显存等效数据速率为15Gbps,作为一张ITX显卡,为了保证良好的散热微星并没有为RTX 3060 AERO ITX 12G OC的风扇配备待机停转的功能,通过GPU-Z的传感器监测页面可以看到待机状态下,风扇转速约为1246RPM左右。
此外,微星RTX 3060 AERO ITX 12G OC的温度上限具有可调节区间,默认的温度上限是83摄氏度,可下调至65摄氏度或者上调到90摄氏度。功耗上限无法向上解锁,默认是170W,最大也是这个数,不过可以向下锁定功耗上限以满足特殊系统的需求,最低可以将功耗上限锁定在100W。
测试平台
这次测试搭配的CPU采用了近一年多来应该是主流市场最为热门的Intel Core i5-10400F处理器,主板是微星MAG Z590 Torpedo,内存为两条芝奇皇家戟 DDR4-3600 16GB组成的32GB双通道配置,电源是ROG的1200W雷神电源,其他配置如上,不再详述。
其中主板BIOS设置方面,除了开启XMP让内存运行在3600MHz频率上之外,还有就是将Resize BAR支持设置为“自动”,即开启Resizable BAR功能,这个可以在GPU-Z的界面上看到。
基准性能测试我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3DMark显卡单项的得分。
基准测试方面微星RTX 3060 AERO ITX 12G OC显卡与其他RTX 3060显卡是差不多的,并没有因为身材小而性能缩水。
游戏性能测试游戏测试分为两个部分,分别是不开实时光线追踪效果下的1080p分辨率游戏测试和开启实时光线追踪效果的1080p分辨率游戏性能测试。
1080p游戏测试测试均将它们开到预设最高画质(《地铁:离去》是开启Ultra画质),分辨率设为1080p,此外默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,同时关闭动态分辨率等影响实际画质和帧数的选项,除以上所述之外其他选项均为默认设置,测试结果如下:
光线追踪或支持DLSS技术游戏测试此部分还选择了几款已经上市的支持实时光线追踪或者DLSS技术的游戏以及开放的benchmark测试demo。全部游戏都将画质开到最高(《地铁:离去》是开启Ultra画质),并且将实时光线追踪效果开到“高”(如果支持的话),DLSS均打开,支持DLSS 2.0的都将DLSS选择为质量模式。
微星RTX 3060 AERO ITX 12G OC显卡的游戏表现非常不错,与前面的理论测试一样,并没有因为身材小而性能缩水,表现出了在1080p分辨率下非常强劲的游戏性能。面对典型的对显卡要求比较高的3A大作比如《刺客信条:英灵殿》、《看门狗:军团》和《地铁:离去》在不开启光线追踪的情况下都能以超过60帧的流畅度运行。而对于国民级的电竞游戏《英雄联盟》则可以达到190帧,意味着可以很好的利用240Hz高刷新率屏幕,获得硬件上的低延迟优势。
开启光线追踪效果的话,借助于DLSS技术,《看门狗:军团》和《地铁:离去》也都能获得将近60帧的流畅度,并且这里开的是DLSS质量模式,如果想要更好的帧数还可以将DLSS开为平衡模式或者性能模式。对于最新的《先驱者 (Outriders)》这款游戏,借助DLSS技术,微星RTX 3060 AERO ITX 12G OC也能让其有将近100帧的流畅度。
温度测试:满载75摄氏度我们的显卡散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5℃左右)下进行测试,本次测试时环境温度约为25.8℃。待机温度是开机以后记录10分钟,满载温度则是在3DMark Time Spy压力测试过程中记录下,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线。
由于没有采用待机风扇停转的方案,微星RTX 3060 AERO ITX 12G OC在开机后温度还会持续走低,此时风扇以30%最大转速在运行,转速约为1246RPM左右,噪音的话,我是没听出来的,尽管是裸机平台。
满载的话最高温度到过75.5摄氏度,单风扇的小显卡温度表现肯定还是不如双风扇乃至三风扇的显卡那么的低温的,不过这个温度仍然非常不错,距离默认的温度上限83摄氏度也有段距离了,不用担心,噪音的话,有些许,但是不影响体验,而且我这是裸机平台,装机的话,风道合理的情况下噪音表现还会更好点。
功耗测试:平均172W通过我们手中的PCAT套件,可以分别精确地测量显卡PCI-E、外接电源接口瓦特数,显卡最大功耗在3DMark Time Spy压力测试中获得,待机功耗则是在进入系统后记录。
经过测试,微星RTX 3060 AERO ITX 12G OC的待机功耗平均为12W,满载功耗平均为172W,测试过程中的满载功耗峰值出现过183W,整体波动不算大,搭配电源的话,建议550W的电源起步。
总结:小身材有大能量微星RTX 3060 AERO ITX 12G OC显卡尺寸仅为172*125*43mm,最长的边也就和ITX主板长度相当,同时保持了标准的双槽设计,是为ITX主机爱好者量身打造的一款显卡产品。
对于小尺寸显卡大家最关注的就是散热问题,而微星RTX 3060 AERO ITX 12G OC在这方面的表现交出了令人满意的答卷——满载仅75.5摄氏度,距离默认的温度上限83摄氏度还有较大距离,可以完整发挥自身RTX 3060 GPU的所有性能。
散热和供电的用料方面,虽然不及自家的魔龙系列那么豪华,但是也与很多其他品牌的大尺寸显卡保持了一致的水准,算是主流水准的用料了,而微星RTX 3060 AERO ITX 12G OC却能将尺寸缩到这么小,所以相比还是有明显的竞争优势。
无论如何,对于ITX主机玩家,微星RTX 3060 AERO ITX 12G OC都是现在市面上非常难得的一张小尺寸显卡,通过它可以组建一套尺寸小巧但是能享受到新一代Ampere架构GPU游戏性能的小尺寸主机,在1080p分辨率下畅玩新一代的光追游戏。
标签: 评测