当我们还在焦虑GeForce RTX 5090 D 32GB可能也要用不上的时候,GeForce RTX 5090 D v2的悄然上市给旗舰级显卡的选择带来了新的参考,不过代价是32GB显存变成了24GB。被缩减了显存GeForce RTX 5090 D v2还能不能被称为旗舰级显卡的问题不仅被摆上了台面,与之对应的是显卡的实际售价其实与头部的RTX 5090 D和RTX 5090有更多的距离。
眼前的索泰GeForce RTX 5090 D v2 24GB SOLID OC就是好例子,它的官方定价相比超频定位的RTX 5090 D差价大概在3000元左右,而如果是对比实际能购入的RTX 5090第三方平台价格,差价甚至可以再买下一块RTX 5070。

仔细一盘算,同样旗舰定位的GeForce RTX 5090 D v2似乎有了性价比,那么事实是否真的如此?现在就让我们奉上索泰GeForce RTX 5090 D v2 24GB SOLID OC评测。

代号:GB202-240-K1-A1
在短时间内对核心部分进行修改并顺利流片是不太可能的,因此GeForce RTX 5090 D v2的GPU核心依然为GB202,代号GB202-240-K1-A1,与GeForce RTX 5090 D与GeForce RTX 5090系出同源,基于Blackwell 2.0架构,因为GB100系列和Blackwell 1.0是针对AI超算、数据中心和服务器设计,2.0版本则是针对消费端、游戏技术进行硬件层面的调整。

无论索泰GeForce RTX 5090 D v2 24GB SOLID OC的GB202-240-K1-A1 GPU,还是GeForce RTX 5090 Founders Edition的GB202-300-A1,本质上都并非GB202的完全体。一般出于产品定位、制造良率、后续升级等多方面考虑,方便可以在短时间内根据市场需求推出更具有竞争力的产品。
完整的GB202很有必要提一提。Blackwell架构延续了此前Ampere和Ada Lovelace架构理念,在一个GPU中包含若干个GPC(Graphics Processing Clusters,图形处理集群),每个GPC下面再包含若干个TPC(Texture Processing Clusters,纹理处理集群),每个TPC下包含若干个SM(Streaming Multiprocessors,流式多处理器),同时再搭配显存控制器等周边电路。

另外每个SM内部的升级也代表着当前微架构升级的关键,也是完成大规模并行任务的关键,比如CUDA Core,第五代Tensor Core,第四代RT Core都包含其中。
完整的GB202 GPU包括12个GPC(Graphics Processing Clusters,图形处理集群),96个TPC(Texture Processing Clusters,纹理处理集群),192个SM(Streaming Multiprocessors,流式多处理器),以及1个512-bit内存接口,配备有16个32-bit内存控制器,用于对显存进行控制。
值得注意,GB202 GPU还包含了384个FP64核心,即每SM包含两个,FP64 TFLOP速率是FP32 TFLOP速率的1/64,对于消费端而言使用频率不高,但可以保证FP64代码可以被正确的执行。对应的,Tensor Core也包含了少量的FP64 Tensor来确保程序的正确执行。
GPC是所有Blackwell GB20x GPU最主要运算单位,每个关键图形处理单元都会摆放在GPC中,每个GPC包括一个专用的光栅引擎(Raster Engine),2组ROP集群(Raster Operations,光栅操作),每个光栅操作分区包括8个独立的ROP单元,8个TPC,每个TPC包含1个PolyMorph引擎和2个SM。

其中PolyMorph引擎主要用于处理图形和计算任务中的几何变换和曲面细分,在处理复杂几何图形的时候,可以获得更高效的多任务能力。
SM是NVIDIA GPU架构中的核心部件,也是GPU可以完成大规模并行任务的关键,比如CUDA Core,Tensor Core,RT Core都包含其中。完整的GB202包括192个SM,每个SM包括128个CUDA Core,1个第四代RT Core,4个第五代Tensor Core,4个纹理单元(Texture Units),1个512KB寄存器文件,128KB L1共享缓存,这些缓存可以根据图形和计算工作负载需求进行重新配置。

Blackwell架构下,INT32整数运算相比Ada Lovelace是翻倍的。原因是INT32和FP32核心进行了完全统一,这也体现了Blackwell SM针对神经网络着色器设计和优化。当然,这也意味着在同一个时钟周期内,只能进行FP32或者INT32其中一个操作。

完整的GB202 GPU还包含了128MB L2缓存,GeForce RTX 5090 D则包含96MB L2缓存,所有的应用在大容量高速缓存中都能受益,特别是光线追踪和路径追踪这样的复杂操作。
因此,完整的GB202 GPU包括:
- 24576 个CUDA Core
- 192个第四代 RT Core
- 768个第五代Tensor Core
- 768个纹理单元(Texture Units)
- 索泰GeForce RTX 5090 D v2 24GB SOLID OC的GB202-240-K1-A1上,通过对部分硬件的调整,比较关键的变化如下:
- 21760 个CUDA Core
- 170个第四代 RT Core
- 680个第五代Tensor Core
- 680个纹理单元(Texture Units)
- 在这个基础上,GDDR7显存颗粒的减少,让显存容量、带宽都与之对应的减少:
- GeForce RTX 5090 / RTX 5090 D:32 GB GDDR7
- GeForce RTX 5090 D v2:24 GB GDDR7(砍掉 8 GB)
- GeForce RTX 5090 / RTX 5090 D:512-bit,1792 GB/s
- GeForce RTX 5090 D v2:384-bit,1344 GB/s(带宽减少25%)
因此得出如下对比参数表格作为参考:

通过对比可以看到,GeForce RTX 5090 D v2基础光栅性能仍然非常能打,比如纹理单元(Texture Units)由GeForce RTX 4090的512个增加到了680个。纹理单元负责处理纹理映射操作,包括从纹理中获取纹理元素(Texels),应用纹理过滤以及纹理坐标处理等等。其中纹理元素(Texels)代表纹理信息、颜色、图案,这些信息被应用于3D表面,定义了物体表面纹理外观。
SOLID OC装甲
索泰GeForce RTX 50 SOLID系列放在一众旗舰级非公版显卡中相当能打,长时间霸占旗舰级显卡散热的第一梯队。事实上GeForce RTX 5090 D到GeForce RTX 5090 D v2在散热、供电布局上差别不大,GeForce RTX 5090 D上那一套优秀的散热模组完全无缝转移到了索泰GeForce RTX 5090 D v2 24GB SOLID OC上。

因此索泰GeForce RTX 5090 D v2 24GB SOLID OC延续了SOLID系列的极简工业风格,通过银灰配色搭配纵横栅让整张显卡显得大气十足,同时通过显卡边缘的暗金点缀让显卡气场拉满。

SOLID系列没有做过多的RGB灯效设计,所有RGB效果都放在尾部的Zotac Gaming和Logo的1600万色RGB内,整张显卡再无其他RGB点缀,对于追求低调的游戏玩家而言非常理想。

与此同时,GeForce RTX 5090 D v2 24GB SOLID OC提供了独立的5V ARGB同步接口,方便与整机RGB实现光效同步。

在散热模组中,索泰GeForce RTX 5090 D v2 24GB SOLID OC使用了一套面积更大VC均热板,对比上一代增加了34%的覆盖面积,一次性覆盖了GPU和GDDR7显存的所有位置,并且显存位置还独立提供了导热垫,确保散热效率。
文章来自互联网,只做分享使用。发布者:,转转请注明出处:https://www.dingdanghao.com/article/997497.html
