处理中...

首页 > 资料大全 > 解决方案 >

挖源头:澄清一下GPU芯片删减方案的概念 (1)

挖源头:澄清一下GPU芯片删减方案的概念 (1)
来源:elecfans 时间:2014-09-05

自从NVIDIA在2012年初期发布了28纳米制造工艺的全新开普勒架构以后,直到今天2014年9月这个麦克斯韦马上即将接替开普勒架构的时候。开普勒架构作为一款让桌面显卡首次进入高功耗比时代的里程碑架构,已经有接近3年的寿命了,开普勒不仅仅用它惊人的工作效率给玩家带来了极强的游戏性能,而本身开普勒架构更大的意义在于它一改了原本40纳米工艺显卡的高发热量形象。首次让玩家享受到高性能,低功耗,追求游戏体验。这都是NVIDIA过去无法为玩家带来的,它也充分印证了NVIDIA在图形处理器架构上面不断前进的脚步。

说到了开普勒的芯片的产品部分,必须要提的就那几个大家基本都知道的芯片型号,其中必然包括GK110,GK104,GK106,GK107这四个熟悉的不能再熟悉的名字了。因为这四个产品是任何一个游戏玩家和专业工作者为常用的产品,也是因为它们支撑了整个开普勒市场。无论从移动产品还是桌面产品,从低端到高端,GK107支撑了大部分移动产品和低端桌面产品,而GK106在早期主要支撑中低端产品,GK104早期支撑了高端产品,而后期又可以转型成为移动产品和中端桌面产品,GK110虽然上市非常晚,但却完整的支撑了旗舰产品的性能。毫不客气的说,这四个芯片就是开普勒架构的代表。

如果从芯片角度说,我们可以说四个芯片就可以支撑一个市场,但如果从显卡角度说,这话明显就说不通了,大家不妨想一想,NVIDIA或许可以靠着4个芯片就可以支撑一个GPU市场。但显卡的市场可不是区区4个显卡就可以支撑的起来的。要知道从低端到高端,产品线可以说是丰富又复杂,从低端入门,甜品中端到高端发烧旗舰,如此之多的产品谁也无法分配4个芯片到这么多种类的显卡上面,此时就有了芯片重复利用这一说法。也就有了芯片“删减”之战略,俗话讲就是“阉割”二字,当然为了让文章更加专业一些,笔者这里一定要用“删减”二字。

由此我们就可以清楚从商家和制造商的产品定位和市场角度着手进行分析,所谓删减芯片规格的终目的很明显是以商业性为目的的市场分配而已,目的就是分配不同规格的某个型号芯片到多个产品来丰富产线。所以这就意味着一个芯片可能会被删减多次,通常是1-2次删减。     

而删减芯片规格的目的也并非是为了节约成本或者坑害消费者。这一点很多玩家和DIY爱好者误解的非常深。实际上为了丰富产品线,拉开多个产品之间性能差距。合理的删减芯片规模就是方案,同时也是非常节约成本的方案。也正是因为如此的删减和阉割,很多产品的性价比才会有所提高。玩家才能买到那些称心如意的产品,要知道通常情况下完整芯片的显卡售价都不便宜。

既然说到产品线和分配问题,笔者就带领读者一同来回顾一下NVIDIA GeForce 600系列以及700系列全部产品。就拿大部分游戏玩家使用的多的产品而言GeForce GTX660/GTX650Ti/GTX650Ti boost分别采用GK106芯片,而GeForce GTX660Ti/GTX670/GTX680/GTX690/GTX760/GTX770则采用GK104芯片,GeForce GTX780/GTXTITAN/GTX780Ti/GTXTITAN BLACK则采用GK110芯片。

我们不妨列个表明细一下:

GK106:GTX660/GTX650Ti/GTX650Ti boost

GK104:GeForce GTX660Ti/GTX670/GTX680/GTX690/GTX760/GTX770

GK110:GeForce GTX780/GTXTITAN/GTX780Ti/GTXTITAN BLACK

根据上面列表所述,我们大致是可以评估一下NVIDIA的商业策略,而甜品级中低端产品主要是GK106负责,高性能中高端产品主要是GK104负责,发烧级旗舰产品主要是GK110负责。

说到删减规格部分,通常NVIDIA删减芯片规格主要可以归类为两种“删减前端性能”和“删减后端性能”,所谓前端部分主要是显卡流处理器数量以及纹理单元TMUs数量,主要影响显卡处理能力和工作效率主要部分,直接影响显卡能生成多少FPS以及生成FPS的周期和所花时间。通常情况下后端部分代表显卡的显存位宽以及光栅单元ROPs数量,主要影响部分高端光线运算以及抗锯齿柔滑平滑处理等,是主要强化高分辨率游戏并提高细节质量的辅助部分。 (这里特别说明显存容量严格意义上讲并非显卡主要属性,也并非芯片内部规格。显存颗粒焊接于PCB,所以不属于核心部分。)

所以根据以上不同的删减方式,我们不难看出部分显卡的显存位宽从256bit降低到192bit,而ROPs也随着从24个降低到16个,而另外一部分产品则是删减了一组或者几组SMX的流处理器。所以不同显卡采用了不同的删减方式,如何删减取舍是NVIDIA需要衡量的重要部分。一个合理删减的显卡通常可以在节约成本降低价格的同时尽量减少性能的损失,而删减不太合理的产品可能会性能过高,而成本也没有明显降低。要么就是性能被缩减的过分了导致价格虚高不合理。

可见合理的删减一个芯片是多么的重要,不同的删减方式直接就可以影响一个显卡的性能!所以有句话讲“芯片架构做的好,更要切的好”。

接下来笔者便带领读者们一起观摩并分析一下,NVIDIA是如何删减这些芯片的。

说到GK104这款开普勒中可说有顶梁柱地位的芯片,游戏玩家和DIY爱好者们不约而同的想到了诸如GeForce GTX680 GeForce GTX770 以及GTX690,甚至是某些移动产品GTX680M以及GTX780M, GTX880M等,这些产品都是完整GK104性能的代表,同时兼备功耗比和超频能力结合与一身的GK104芯片不仅体积小,成本低,良品率高。既可以高频率支撑桌面市场,又可以降低频率进入移动市场,真可以说可进可退,攻守兼备,大丈夫能伸能屈,各种能够表示高自由度和高灵活性,类似的词汇你都可以用来形容它,完全不觉得过分。

然而很多人也忽视了GK104的优点,那就是它具备不同等级的删减版本直接让NVIDIA的中端市场变得充实了,可以说是GK104撑起了NVIDIA的中端产品线,甚至更夸张的说,它也是NVIDIA利润主要来源之一。这都归功于GK104自由度高的优势,可以进行多种不同程度的删减,从而一个核心同时应用于多个产品,而本身成本低,良品率又占据优势的GK104轻松可以支撑大半个市场,而即使在今天GK110作为旗舰产品逐渐代替GK104高端产品中的位置,GK104仍旧具备难以撼动的地位。或许它会一直持续到NVIDIA发布GM204后才会真正被彻底代替。

而要说到NVIDIA对于个GK104这个芯片删减规模中为经典的两个例子,绝对是GeForce GTX760与GTX660Ti这两个不同删减方案的代表作品。

GeForce GTX660Ti-偏向于后端部分删减的方案  

说到GTX660Ti,相信很多游戏玩家和显卡发烧友都非常熟悉,因为GTX660Ti几乎是开普勒架构中争议的产品之一,一度流传的GTX660Ti仅有192bit对应1500MB显存的说法直到今天仍旧存在。而这里要分析是作为一个GK104删减后的经典案例,GTX660Ti是如何删减规模的呢?


GK104早期的两款中高端产品

这里我们拿出一个规格对比图片可以一目了然的看到,GTX660Ti对比GTX670的变化在于显存位宽缩减到了192bit,这样导致同样6000MHz显存频率下,GTX660Ti的显存带宽则远低于GTX670,而这样一点肯定会被很多不太懂显卡的消费者看到,因为更多的不懂显卡的人喜欢以显存位宽判断性能。

而另外一点住的注意的就是:GTX660Ti的流处理器数量和GTX670完全一样,均为1344个,可见它们的SMX数量是完全相同的,才会有相同的流处理器数量,同时也意味着有相同的纹理单元数量。而且两款产品的频率也没有任何区别。可见同等频率下,GTX660Ti拥有大约等同于GTX670的核心处理能力,同时对于高和抗锯齿等后期处理部分GTX660Ti则较为虚弱,而面对高分辨率和高的游戏,GTX660Ti显然会和GTX670拉开较大差距。这便是删减后端部分明显的影响。这也就是为什么GTX660Ti在某些低压力较小的单机游戏里面反而表现出仅次于GTX670的成绩。主要原因还是因为显存带宽以及光栅单元数量不足造成的。其中因为显存位宽的减少到192bit,光栅单元也从32个降低到了24个。

这或许才是GTX660Ti高分辨率成绩较差的主要原因,显然这和网络上流传的GTX660Ti只能利用1500MB显存的说法不同。影响成绩的关键还是后端部分。

ICkey(云汉芯城)是一家一站式电子元器件采购网, 提供Digikey、Mouser(贸泽)、Element14(e络盟)、Wpi(大联大)、Future(富昌)、Avnet(安富利)、Arrow(艾睿)、Chip1stop、OnlinecomponentsMaster等主流供货商的芯片采购服务,在IC采购, 元器件交易和IC交易业务领域中排名的在线采购平台。

热门推荐

更多 >
ESP32-S3 2022-03-16
RG200U 2022-03-16
USR-C322 2022-03-16

资料浏览排行榜

更多 >
商品名称 大小 浏览量
1 EPCS128SI16N 0.94MB 22194次
2 1N4001 0.19MB 18108次
3 DAC1220E 0.95MB 16433次
4 EP1C6Q240I7N 2.47MB 15977次
5 GRM32RR71H105... 0.10MB 14168次
6 DR127-3R3-R 0.72MB 11843次
7 DMG2305UX-7 0.40MB 9413次
8 DS1337U+ 0.28MB 9193次
9 DMP2008UFG-7 0.24MB 9191次
10 DX4R105JJCR18... 0.26MB 9105次