摘要:刚刚发布的RTX 4070 Ti显卡无疑是吸引了很多玩家的目光,毕竟它是由原来作为次旗舰之一的RTX 4080 12GB进行价格和定位调整后的产品,实际表现还是很令人期待的。我们这次首发拿到的是七彩虹的iGame RTX 4070 Ti U...
刚刚发布的RTX 4070 Ti显卡无疑是吸引了很多玩家的目光,毕竟它是由原来作为次旗舰之一的RTX 4080 12GB进行价格和定位调整后的产品,实际表现还是很令人期待的。我们这次首发拿到的是七彩虹的iGame RTX 4070 Ti Ultra W OC,一起看看这款新卡的实力如何。
01/ RTX 4070 Ti核心架构解析
新一代Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器),从而带来了三大创新特性:全景光线追踪、着色器执行重排序(SER)和DLSS 3。
Ada Lovelace架构与AD104核心
GeForce RTX 4070 Ti显卡采用的是AD 104显示核心,该核心基于TSMC 4N工艺和Ada Lovelace架构进行制造,其芯片面积为295平方毫米,晶体管密度为358亿。不仅如此,4N工艺在相同功耗下,GPU核心频率也有超过50%的提升。
Ada Lovelace核心基本延续了上一代定下的GPC-TPC-SM层级架构,其中GeForce RTX 4070 Ti 12GB显卡采用了完整GPC规格的AD104-400核心,总共拥有5组GPC共60组SM,相比上代采用GA104核心(48组SM)的GeForce RTX 3070 Ti 8GB扩大了25%。
与此同时,Ada Lovelace架构核心还大幅度提升了其L2缓存,GeForce RTX 4070 Ti 12GB拥有48MB的L2缓存,较GeForce RTX 3070 Ti 12GB的4MB增加了整整11倍。在现阶段显存带宽提升有限的情况下,通过升级更大容量的L2缓存,可以提升数据命中表现,带来性能方面的升级。
着色器执行重排序(SER)
Ada Lovelace架构核心在SM单元上引入了Shader Execution Reordering(SER 着色器执行重排序)技术来更好的对于着色器的工作进行调度排序,在使用上可以根据不同的负载需求来执行渲染,可对负载较为统一的画面进行渲染,降低工作开销。
应用了着色器执行重排序(SER)之后,《赛博朋克2077》在全景光线追踪模式下可以提高44%的性能,《传送门》RTX版可以提高29%的性能,《Racer RTX》可以提高20%的性能。
第三代RT Core与全景光线追踪
全新的第三代RT Core可以提供2倍的光线与三角形求交性能,并且加入了两个全新的重要硬件单元——Opacity Micro-Map引擎和Displaced Micro-Mesh引擎。
Opacity Micro-Map引擎将光线追踪的Alpha-Test几何性能提升2倍;而全新的Displaced Micro-Mesh引擎可动态生成微网格,以产生额外的几何图形。Displaced Micro-Mesh引擎可在提升几何图形丰富度的同时,不以传统复杂几何图形处理的性能和存储成本为代价。
得益于一系列硬件性能改进,NVIDIA在Ada Lovelace架构中引入了全景光线追踪,通过追踪场景中每个像素的光照信息,实现像素级的阴影、反射和水面折射,提供如照片般逼真的画面细节。同时让画面的表面、纹理拥有基于物理效果的细节,确保光追的效果能够以自然、逼真的方式交互,增强画质和沉浸感。
比如在即将发布的《赛博朋克:2077》“Overdrive”画质模式下,游戏画面的每个像素会执行约635次光线追踪计算;作为对比,首次引入实时光线追踪技术的《战地5》对每个像素执行约39次光线追踪计算,是初代光追的16.2倍。
第四代Tensor Core与DLSS 3
第四代Tensor核心新增Hopper FP8 Transformer Engine,可提供1400 TFLOPS的张量处理性能,大幅提升深度学习性能。
在第四代Tensor核心、着色器执行重排序(SER)和Optical Flow Accelerator光流加速器的加持下,GeForce RTX 40系显卡带来了新一代DLSS 3技术,它集全新的帧生成技术、DLSS 2超分辨率技术和NVIDIA Reflex技术于一体,可全方位提升游戏流畅度、延迟以及画质。
DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程,而通过这一个流程的循环,可在提升帧数的同时节省资源开销,进一步带来更好游戏体验。
而在DLSS 3的帧生成技术上,由于可能带来延迟的增加,因此DLSS 3在使用上也将通过整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟。而根据NVIDIA官方的说法,DLSS 3通过整合NVIDIA Reflex以及一系列的技术,可以使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。
RTX 4070 Ti参数规格如下:
02/ 外观展示
作为比较少见的浅色系显卡,iGame GeForce RTX 4070 Ti Ultra W OC还融入了全新的波普(POP)视觉艺术风格。波普起源于50年代的英国,作为一种经典的流行文化风格被延续至今,其大胆的色彩运用及随性的线条,打造出了独特的艺术风格。
新卡在延续30系Ultra上人气颇高的白色外甲的同时,正面还加入了更具活力感的大块渐变设计, 随着光线变化会呈现出不同的色彩效果,iGame Logo及圆形波点的底纹带来了更丰富的视觉表现力。
显卡正面安装了3个环形的100mm风扇,风扇叶片环环相连,显得坚固可靠,风扇内部采用耐用度更强的双滚珠轴承设计。
显卡侧面有一块面积不小的RGB灯模组,它采用多锐角形成漫画的特效,灯光透过上面的波点元素照射而出,展现与众不同的波普灯效。
虹镀面板也会随着光线变化而出现不同的效果,展现非同寻常的视觉观感。
金属背板同样运用了许多波普元素,粉色的Ultra字母既与侧板色彩相呼应,又与异形的散热镂空相匹配,倍显新潮个性。
电源接口同样是新一代RTX 40系显卡上目前为止所用的12VHPWR接口,附带1转2*8pin的供电线缆。
显卡挡板部分提供了一个HDMI 2.1接口和3个DP1.4a接口,最多支持四屏显示。同时配备了一键超频按钮,开启后GPU核心加速频率可以达到2745MHz。
03/ 基准性能与散热测试
本次iGame GeForce RTX 4070 Ti Ultra W OC显卡测试采用目前主流级的13代酷睿i5-13600K搭配DDR5-6400平台进行。
在默认模式下,iGame GeForce RTX 4070 Ti Ultra W OC的频率、功耗设定与公版一致,基础频率2310MHz、加速频率2610MHz,TGP上限285W。
按下一键超频按钮后,显卡将切换至超频版BIOS,此时BOOST频率提升至2745MHz,功耗上限也可手动解锁至330W。后面的测试都将基于超频版BIOS进行。
从测试结果来看,iGame GeForce RTX 4070 Ti Ultra W OC取得了非常出色的成绩,在Fire Strike Extreme场景中得分高达26700,Fire Strike Ultra模式下也有13411分。在专门针对DX12环境的TimeSpy测试中得分22483,4K分辨率下的TimeSpy Extreme场景也高达10898分。代表光追性能的Port Royal测试中获得14049分。总体表现介于RTX 3090和RTX 3090 Ti之间。
除了传统性能升级外,RTX 40系显卡的另一重大提升在于DLSS 3的帧率表现可以看到在DLSS 3的基准测试中,RTX 4070 Ti仅在质量模式下的帧率已经从63.95帧提升到126.78帧,获得了近乎翻倍的性能提升。
使用Furmark对iGame GeForce RTX 4070 Ti Ultra W OC进行烤机测试,测试是室温为23度。运行30分钟之后,显卡的功耗稳定在285W,烤机时GPU频率为2865MHz,核心温度稳定在62度附近,温度控制不错,此时的风扇转速也只有1667RPM。
04/ 游戏测试
首先我们选取五款热门电竞游戏,运行全高画质2K分辨率测试。可以看到,iGame GeForce RTX 4070 Ti Ultra W OC在所有测试项目中的平均帧率都远高于144帧,完全能够满足发烧级电竞玩家的跑满2K 144Hz的需求。
在以下几款经典的大型游戏中,iGame GeForce RTX 4070 Ti Ultra W OC显卡在2K分辨率下都能跑到过百帧,在4K分辨率下也能稳定跑在60帧以上。
接下来看看支持DLSS 3的游戏表现。从下面5款游戏中可以看到,iGame GeForce RTX 4070 Ti Ultra W OC在开启DLSS 3之后帧率分别获得了约2-5倍不等的帧率提升,让不少3A大作都达到了2K 144级别的流畅度,相比于DLSS 2的表现更加惊人;同时在更高的帧率和Reflex技术的加持下,游戏画面延迟甚至比原生分辨率还要更低。
纵向对比上一代显卡,在已经适配DLSS 3的游戏中,iGame GeForce RTX 4070 Ti Ultra W OC至多可以跑到RTX 3090 Ti两倍的帧率。
同时,我们测试到的iGame GeForce RTX 4070 Ti Ultra W OC实际运行2K游戏的功耗大约在220W-250W范围内,其实远远低于官方标定的285W TGP,更是比RTX 3090 Ti的450W低了近一半,可见这一代的能效提升相当之大。
05/ 生产力测试
除了游戏以外,如今从游戏主播、内容创作者,到视频编辑、3D 建模和渲染等生产力工作,也没有一样离得开 GPU 的性能支持。
在渲染能力方面,我们先围绕 Blender Benchmark 进行,在 Moster、Junkshop、Classroom 三个场景中,iGame GeForce RTX 4070 Ti Ultra W OC相对 GeForce RTX 3090 Ti 至多提升了26% 的性能,仅在Junkshop中小幅落后10%。
在SPECviewperf 13集成的8款工业软件测试中,iGame GeForce RTX 4070 Ti Ultra W OC在7个项目中都小幅领先于RTX 3090 Ti。
视频内容创作方面,在使用达芬奇渲染同一段4K H.265视频的任务中,iGame GeForce RTX 4070 Ti Ultra W OC也比RTX 3090 Ti快了20%以上。
同时,GeForce RTX 40系列显卡还首次加入了 AV1 双编码器。AV1 编码是由英特尔、微软、亚马逊、谷歌、网飞等网络巨头组成的开放多媒体联盟 AOMedia 所推出的免费编码格式,在国内已经获得了哔哩哔哩、爱奇艺支持。它的特点是能在相同文件体积下拥有更高清的画质,或者相同清晰度的画质下拥有更小的体积。
AV1(左)和AVC(右)画质对比
GeForce RTX 40系列显卡是目前市面上较少可以支持硬件AV1渲染加速的GPU,实测渲染导出同一段AV1视频,其效率对比纯CPU软件编码效率高了4倍左右。
与此同时,对游戏主播而言,GeForce RTX系列显卡支持的Broadcast工具还可以一键实现人像跟踪、视频去噪、噪音和回声消除、消除/虚化背景等实用功能。
06/ 总结
在2K 144Hz电竞显示器颇为流行的当下,RTX 4070 Ti显卡能够充分满足玩家对于这一显示规格的游戏需求。特别是在全新DLSS 3技术的加持下,RTX 4070 Ti甚至获得了超越上一代卡皇RTX 3090 Ti的出色表现,且功耗几乎只有一半,能耗比非常出众。同时,它在视频渲染、3D、AI等生产力项目中,也能带来相当明显的效率提升,同样不逊于上一代的旗舰级显卡。
作为首批非公版产品,七彩虹iGame GeForce RTX 4070 Ti Ultra W OC不仅有着更强的散热系统,一键超频模式下释放出更强大的性能,同时素雅之下不失活力个性的波普艺术设计也是市面上的独一档,想要尽早体验RTX40系显卡的玩家可以多多关注。