对极致性能的追求可谓是显卡界的主旋律,就像运动员刷新世界纪录一样,每一次的显卡性能纪录刷新都能让玩家和从业者内心澎湃。随着pascal显卡家族的诞生,业界的最强神话在短短一年不到的时间里一次又一次地被打破,我还记得去年5月老黄手举gtx1080大声宣布:“anewkingborned!”;我也记得去年7月,老黄在斯坦福大学的ai会议上公布nvidiatitanx时骄傲的笑容;就在本月,最强游戏显卡的纪录再次刷新,新卡皇在本月初正式降临!
2017年3月1日,nvidia发布了玩家们期待已久的geforcegtx1080ti显卡,老黄在gdc2017大会上明确声称,该卡的性能强于nvidiatitanx,是“ultimategeforce”,翻译过来就是最强最极致的geforce显卡。在gtx1080ti未发布之前,很多人以为该卡会在nvidiatitanx的基础上再削减一部分流处理器来区分定位,但意外的是,gtx1080ti同样拥有3584个cuda处理器,核心上一刀未动,可谓是开创了x80ti和titan间关系的先河。
gp102-350核心和二代g5x显存
毕竟gtx1080ti还是要比titanxlow一些的,因此nvidia破天荒地阉割掉了1gb显存以区分定位,与之对应的,显存位宽减少了32-bit、rops单元少了8个、l2少了256kb。可能是吉吉我资历尚浅,我从来没见过这种“阉割”方式,11gb的显存也算是活久见了,不得不让人怀疑gtx1080ti是不是老黄临时赶工,把titanx少焊一颗显存便当成gtx1080ti卖了。机智的老黄显然会猜到我们这么想,所以老黄在会上说,gtx1080ti只是性能上强于titanx?乃们太天真了!
“就问你怕不怕?”(设计台词)
当然,老黄原话肯定不是这么说的,不过想表达的意思确实是gtx1080ti对比titanx是全方位的提升,那么此话怎讲?老黄在会上称,gtx1080ti使用了第二代g5x显存,经过优化后频率从10ghz上升至11ghz;供电部分也得到了强化,采用全新7相双fet设计,这使得整卡性能和超频潜力要远大于titanx;散热方面,gtx1080ti搭载了全新设计的真空腔均热板,照比之前散热面积扩大了一倍,同gtx1080比同温下噪音降低2.5db,同噪音下温度降低5℃。
geforcegtx1080tifounderdition
如此多的改进表明了nvidia的诚意,那些观望许久的高端玩家们已经准备好入手这款新旗舰,不过与此同时,那些已经购买了gtx1080和nvidiatitanx的玩家们则表达出了强烈的不满。新旗舰的发布自然会导致老旗舰的降价,老黄宣布gtx1080下调100美元,在国内的反应便是非公版gtx1080的售价普遍下调了1000元人民币,那些年初购买gtx1080的玩家们简直上吊的心都有了。nvidiatitanx作为信仰级显卡,售价高达9499元,性能做工等各方面却都落后于gtx1080ti,这让购买了titanx的资深n饭们深深地体会到了什么叫“信仰被无情地践踏”。
geforcegtx1080ti显卡开箱视频
尽管amdryzen是现在pc界最受关注的对象,但gtx1080ti的发布抢了ryzen不少风头,可见玩家们对这款新旗舰是非常感兴趣的。相信正在看这篇文章的你一定非常想知道测试的结果,所以我就先给大家透个底:gtx1080ti的综合性能的确超越了titanx,但并不是每一项测试都胜过后者。此外,吉吉我会在本文结尾向大家详细阐释nvidia让gtx1080ti胜过nvidiatitanx的意义以及本人根据小道消息的一些猜想。那么gtx1080ti究竟超越gtx1080和nvidiatitanx多少,又是哪些测试不敌前任游戏卡王?就让我们一起揭晓答案吧!
attention!为了感谢各位读者长期以来的厚爱,吉吉我将会抽取评论区的三位幸运读者,分别送出nvidia纪念鼠标垫一个、nvidia平板支架一个和nvidia多功能双肩电脑包一个,望大家踊跃参与评论,说出你对nvidia新旗舰的看法。
具体规则为:截至文章发布24小时为止,在第180楼、380楼和580楼回复的网友获奖,每个id仅能获奖一次,禁止连续回复三次以上,一经发现将取消该id获奖资格,奖品顺延至下一符合要求的楼层。
gp102-350核心解析
geforcegtx1080ti采用全新16nm制程的pascal架构,核心代号为gp102,具体型号为gp102-350-记忆深处的淡淡清香k1-a1,而nvidiatitanx的核心代号为gp102-400-a1。gp102核心面积约为471平方毫米,得益于16nm的制程优势,核心内集成了12亿晶体管,是gtx980ti晶体管数量的1.5倍,核心面积却仅为gtxtitanx的78.4%。
注:表中售价均为官方首发限价
基于pascal架构的gp102-400芯片运算资源总量为3584个alu,于gp102-400相同;gp102-350的tmus数量为224个,后端的rops数量为88个,5个带宽为64bit的双通道显存和1个带宽为32bit的单通道内存控制器组成了总量为352bit的显存控制单元,大小为11gb。同nvidiatitanx相比,其各项不可再生资源参数基本相同,不过显存位宽下降32-bit,显存带宽从505gb/s下降至484gb/s,rops单元数量也下降了8个。
gp102-350架构图
我们可以看到,gtx1080ti的默认核心频率为1480mhz,boost频率为1582mhz,比nvidiatitanx的频率要高出60mhz左右,其中显存频率提升较大,由于g5x显存升级换代,等效频率提高了足足1ghz,因此单精度浮点运算性能比后者还要高出0.5tflops。gtx1080ti的默认pixelfillrate能力达到了142.2gpiexls/s,默认texturefillrate能力为331.5gtexels/s,照比nvidiatitanx均有所降低。最后需要说明的是,在tdp相同的情况下,gtx1080ti拥有11.5tflops的超高单精度浮点运算能力,照比gtx980ti提升了80%,能耗比惊人,为目前单精度浮点运算性能最高的单芯游戏显卡。
新老“x80ti”显卡详细参数对比
pascal架构gp104-350芯片由以下主要的部分组成:
1、基于tsmc的16nmfinfetplus工艺,相比28nmhpm提升了65%的性能或者减少了70%的能耗,同时晶体管密度翻倍。
2、6单元的宏观并行结构,30组sms单元被分为6个gpc,每个gpc包含5组sms,但砍掉了2组sms单元,因此总量为28个,相对应地,纹理单元缩减为224个。
3、28组全新设计的,包含了几何引擎、光栅化引擎以及线程仲裁管理机制的sms单元。每个sms单元包含一组负责处理几何任务需求的polymorphengine,同时均下辖5组更基本的sm单元,每个sms单元包含8个负责处理材质以及特种运算任务如卷积、快速傅里叶变换等的texturearray,四组并行的二级线程管理机制以及对应的shared+unifiedcache等缓冲体系。
4、gp102-350拥有11个32位显存控制器,总计352位,每个32位显存控制器包含8个rops单元和256kb二级缓存,共计88个rops单元和2816kb二级缓存。
5、改进型的4.0版本polymorphengine,包含了为vr设计的thesimultaneousmulti-projectionengine,在极端情况下,smp引擎可以减少32倍vr所需的几何渲染工作量。
新一代gddr5x显存
为了进一步提高性能,geforcegtx1080ti配备了以11gbps运行的新一代gddr5x显存,这是目前显存所能达到的单端io信号传输的最快速度。nvidia与显存供应商倾力协作,改进显存的数据通道,使用先进的均衡技术减少物理接口的不利影响,并使抖动和噪声达到最小,实现更高的数据传输速率。
上图为显存工作时的数据眼图,左侧的图像显示了以11gbps运行的原始gddr5x显存,右侧为新一代gddr5x@11gbps显存,我们可以看到,左图采样数据的中心与转换中的数据混淆在一起,因此无法可靠地捕获数据,而右图显示新的gddr5x显存具有显着改进的数据眼,结合pascal强大的io设计,使显存io速度达到了一个新高度。
图块缓存技术(tiledcaching)
nvidia最新的gpu采用了旨在放大原始内存带宽并为gpu核心提供更高有效内存带宽的技术,该技术被称为区块缓存。传统的渲染架构分为两种,高端桌面级gpu使用的是立即式渲染器,如左图所示;绝大多数移动级gpu使用的是图块式渲染架构,如右图所示:
传统渲染架构
在立即式渲染架构中,输入命令列表中的每个命令按序执行并完成,例如当输入三角形时,在开始下一个三角形的绘制之前先绘制之前的整个三角形。此架构的优势包括只读取一次输入的几何数据,并且能够在复杂输入时节约资源。缺点是在具有高透明度的区域中,相同的像素被多次读取和写入,增加了存储器带宽的消耗。
图块式渲染器的工作原理是屏幕被分成许多单独的区块,并且进行两次渲染,第一次处理几何数据并确定每个三角形覆盖哪些区块,并将该信息写入dram;第二次为每个区块再添加几何列表,每次一个区块,在移动到下一个区块之前渲染完成之前的区块。这样做的好处是所有渲染都在芯片内发生,最终只有颜色信息被写入dram。
图块缓存技术
与立即扫福式渲染相比,图块式渲染有两个明显的限制:首先,对于合并通道的需求增加了数据延迟和复杂性;第二,保存和读取合并通道信息所需的显存带宽是与渲染场景中几何形状的量成正比,如果每像素带宽节省超过合并带宽量,则图块渲染是相对节省带宽的。对may的过去式于那些相对简单,几何复杂度低的场景,例如移动端游戏是可行的,但对于具有丰富几何形状的桌面级游戏,图块式渲染对带宽的需求可能要比立即式渲染更高。
图块式渲染与立即式渲染对比
从maxwell架构开始,nvidia便一直都在使用不同于以上两种传统渲染方式的渲染技术,其名为“图块渲染”,这种技术在pascal架构中演变得更加成熟。这种渲染技术的基本理论是“化整为零”,将整个屏幕划分为一个个16*16或者32*32的小区域,然后以每一个小区块为基础对整个画面进行光栅化处理。maxwell和pascalgpu可以动态地评估每个帧所需的图块大小,根据场景的复杂度随时调整。
图块缓存的优势
“化整为零”的好处是gpu需要处理的单位画面数据变少,也就是说待渲染数据可以被暂时存储在gpu的l2高速缓存当中。这意味着gpu不必在更大、更慢的显存池中大海捞针,从而减少了显存系统的负载,增加可用于其他任务的可用显存,同时加速渲染速度和渲染质量。此外,这种图块化的渲染方式也很符合gpu的并行运算逻辑,gpu可以根据可用资源同时处理许多独立的图块,在多路显卡系统中的优势更加明显。
从上面的解释中我们不难看出,图块渲染的核心就在于l2缓存,更大的l2缓存将能够提供更多的渲染画面数据存储,于是我们看到由kepler升级至maxwell时,l2缓存被增加了8倍,从256kb大幅攀升至2mb,而从maxwell升级至pascal时,gp102核心l2容量达到了3mb,再次大幅提升。
显卡拆解赏析
从外形上可以看出,除了其散热器外壳、显卡名称和散热鳍片颜色互相对调以外,其他地方gtx1080ti和nvidiatitanx是相同的。
显卡正面外观
gtx1080tifounderdition采用公版标配的涡轮散热器,涡轮将热空气经i/o区散热孔中吹出,涡轮扇的最大转速被限制在55%,也就是2300转左右,这点跟titanx的涡轮扇相同。
显卡背板
拆分式背板
老黄称gtx980ti没有背板是为了让多卡sli有更好的散热,这点显然不会被玩家所认可,所以gtx1080ti上搭载了全新设计的背板,在组建sli平台时,可以卸掉一半背板来增加气流量,以此来增强散热效果。
散热器外壳部分
拆掉散热器外壳
真空腔均热板散热模块
gtx1080ti搭载了全新设计的真空腔均热板,照比gtx1080的真空腔均热板,散热面积扩大了一倍,同gtx1080比同温下噪音降低2.5db,同噪音下温度降低5℃。
显卡中框和涡轮扇
gtx1080ti的全金属中框既可以加固显卡,又可以起到一定的辅助散热作用,在中框上贴有导热垫,辅助显存等高发热部位散热。显卡搭载的涡轮扇十分静音,即使在高负载情况下,风噪声也不是很明显。
显卡pcb设计
与nvidiatitanx相比,gtx1080ti多了很多mos管,基本上不存在空焊位,从做工上的确可以看出nvidia在新旗舰的设计上十分用心。此外,由于gtx1080ti的显存容量为11gb,所以有正面一处显存空焊位。
显卡供电设计
nvidiat解放军叔叔itanx的供电设计采用了7+1+1相双fet供电设计,相比之前gtx1080的5+1强了不少,也比titanx的7+1+1相单fet供电更加豪华。就料件的品质来说,高品质贴片电感、钽电容等高档元器件是没什么值得挑剔的,旗舰范十足。
本文发布于:2023-04-02 11:05:26,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/6ebbba0b241190227e1ca0d16512925a.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:NVIDIA GeForce GTX 1080 Ti显卡首发深度图解评测+拆解.doc
本文 PDF 下载地址:NVIDIA GeForce GTX 1080 Ti显卡首发深度图解评测+拆解.pdf
留言与评论(共有 0 条评论) |