顶级玩家的最佳选择! 索泰GeForce RTX 5090 D v2 24GB SOLID OC显卡评测 - 叮当号

当我们还在焦虑GeForce RTX 5090 D 32GB可能也要用不上的时候，GeForce RTX 5090 D v2的悄然上市给旗舰级显卡的选择带来了新的参考，不过代价是32GB显存变成了24GB。被缩减了显存GeForce RTX 5090 D v2还能不能被称为旗舰级显卡的问题不仅被摆上了台面，与之对应的是显卡的实际售价其实与头部的RTX 5090 D和RTX 5090有更多的距离。

眼前的索泰GeForce RTX 5090 D v2 24GB SOLID OC就是好例子，它的官方定价相比超频定位的RTX 5090 D差价大概在3000元左右，而如果是对比实际能购入的RTX 5090第三方平台价格，差价甚至可以再买下一块RTX 5070。

仔细一盘算，同样旗舰定位的GeForce RTX 5090 D v2似乎有了性价比，那么事实是否真的如此？现在就让我们奉上索泰GeForce RTX 5090 D v2 24GB SOLID OC评测。

代号：GB202-240-K1-A1

在短时间内对核心部分进行修改并顺利流片是不太可能的，因此GeForce RTX 5090 D v2的GPU核心依然为GB202，代号GB202-240-K1-A1，与GeForce RTX 5090 D与GeForce RTX 5090系出同源，基于Blackwell 2.0架构，因为GB100系列和Blackwell 1.0是针对AI超算、数据中心和服务器设计，2.0版本则是针对消费端、游戏技术进行硬件层面的调整。

无论索泰GeForce RTX 5090 D v2 24GB SOLID OC的GB202-240-K1-A1 GPU，还是GeForce RTX 5090 Founders Edition的GB202-300-A1，本质上都并非GB202的完全体。一般出于产品定位、制造良率、后续升级等多方面考虑，方便可以在短时间内根据市场需求推出更具有竞争力的产品。

完整的GB202很有必要提一提。Blackwell架构延续了此前Ampere和Ada Lovelace架构理念，在一个GPU中包含若干个GPC（Graphics Processing Clusters，图形处理集群），每个GPC下面再包含若干个TPC（Texture Processing Clusters，纹理处理集群），每个TPC下包含若干个SM（Streaming Multiprocessors，流式多处理器），同时再搭配显存控制器等周边电路。

另外每个SM内部的升级也代表着当前微架构升级的关键，也是完成大规模并行任务的关键，比如CUDA Core，第五代Tensor Core，第四代RT Core都包含其中。

完整的GB202 GPU包括12个GPC（Graphics Processing Clusters，图形处理集群），96个TPC（Texture Processing Clusters，纹理处理集群），192个SM（Streaming Multiprocessors，流式多处理器），以及1个512-bit内存接口，配备有16个32-bit内存控制器，用于对显存进行控制。

值得注意，GB202 GPU还包含了384个FP64核心，即每SM包含两个，FP64 TFLOP速率是FP32 TFLOP速率的1/64，对于消费端而言使用频率不高，但可以保证FP64代码可以被正确的执行。对应的，Tensor Core也包含了少量的FP64 Tensor来确保程序的正确执行。

GPC是所有Blackwell GB20x GPU最主要运算单位，每个关键图形处理单元都会摆放在GPC中，每个GPC包括一个专用的光栅引擎（Raster Engine），2组ROP集群（Raster Operations，光栅操作），每个光栅操作分区包括8个独立的ROP单元，8个TPC，每个TPC包含1个PolyMorph引擎和2个SM。

其中PolyMorph引擎主要用于处理图形和计算任务中的几何变换和曲面细分，在处理复杂几何图形的时候，可以获得更高效的多任务能力。

SM是NVIDIA GPU架构中的核心部件，也是GPU可以完成大规模并行任务的关键，比如CUDA Core，Tensor Core，RT Core都包含其中。完整的GB202包括192个SM，每个SM包括128个CUDA Core，1个第四代RT Core，4个第五代Tensor Core，4个纹理单元（Texture Units），1个512KB寄存器文件，128KB L1共享缓存，这些缓存可以根据图形和计算工作负载需求进行重新配置。

Blackwell架构下，INT32整数运算相比Ada Lovelace是翻倍的。原因是INT32和FP32核心进行了完全统一，这也体现了Blackwell SM针对神经网络着色器设计和优化。当然，这也意味着在同一个时钟周期内，只能进行FP32或者INT32其中一个操作。

完整的GB202 GPU还包含了128MB L2缓存，GeForce RTX 5090 D则包含96MB L2缓存，所有的应用在大容量高速缓存中都能受益，特别是光线追踪和路径追踪这样的复杂操作。

因此，完整的GB202 GPU包括：

24576 个CUDA Core
192个第四代 RT Core
768个第五代Tensor Core
768个纹理单元（Texture Units）
索泰GeForce RTX 5090 D v2 24GB SOLID OC的GB202-240-K1-A1上，通过对部分硬件的调整，比较关键的变化如下：
21760 个CUDA Core
170个第四代 RT Core
680个第五代Tensor Core
680个纹理单元（Texture Units）
在这个基础上，GDDR7显存颗粒的减少，让显存容量、带宽都与之对应的减少：
GeForce RTX 5090 / RTX 5090 D：32 GB GDDR7
GeForce RTX 5090 D v2：24 GB GDDR7（砍掉 8 GB）
GeForce RTX 5090 / RTX 5090 D：512-bit，1792 GB/s
GeForce RTX 5090 D v2：384-bit，1344 GB/s（带宽减少25%）

因此得出如下对比参数表格作为参考：

通过对比可以看到，GeForce RTX 5090 D v2基础光栅性能仍然非常能打，比如纹理单元（Texture Units）由GeForce RTX 4090的512个增加到了680个。纹理单元负责处理纹理映射操作，包括从纹理中获取纹理元素（Texels），应用纹理过滤以及纹理坐标处理等等。其中纹理元素（Texels）代表纹理信息、颜色、图案，这些信息被应用于3D表面，定义了物体表面纹理外观。

SOLID OC装甲

索泰GeForce RTX 50 SOLID系列放在一众旗舰级非公版显卡中相当能打，长时间霸占旗舰级显卡散热的第一梯队。事实上GeForce RTX 5090 D到GeForce RTX 5090 D v2在散热、供电布局上差别不大，GeForce RTX 5090 D上那一套优秀的散热模组完全无缝转移到了索泰GeForce RTX 5090 D v2 24GB SOLID OC上。

因此索泰GeForce RTX 5090 D v2 24GB SOLID OC延续了SOLID系列的极简工业风格，通过银灰配色搭配纵横栅让整张显卡显得大气十足，同时通过显卡边缘的暗金点缀让显卡气场拉满。

SOLID系列没有做过多的RGB灯效设计，所有RGB效果都放在尾部的Zotac Gaming和Logo的1600万色RGB内，整张显卡再无其他RGB点缀，对于追求低调的游戏玩家而言非常理想。

与此同时，GeForce RTX 5090 D v2 24GB SOLID OC提供了独立的5V ARGB同步接口，方便与整机RGB实现光效同步。

在散热模组中，索泰GeForce RTX 5090 D v2 24GB SOLID OC使用了一套面积更大VC均热板，对比上一代增加了34%的覆盖面积，一次性覆盖了GPU和GDDR7显存的所有位置，并且显存位置还独立提供了导热垫，确保散热效率。

代号：GB202-240-K1-A1

SOLID OC装甲

相关文章

微信