十载寒窗英特尔至强处理器历代记2011-04-11佚名IT168
摘要:回顾至强处理器发展的历程,面向双路的产品从最初的至强5000系列到5400系列到最新的至强E7,算
下来Intel在双路及四路以上服务器处理器中已经整整更新了10代产品。
2011年4月6日,Intel在北京发布了采用全新命名的至强E7系列,回顾至强处理器发展的历程,面向双路的产
品从最初的至强5000系列到5400系列,到Nehalem架构的至强5500、Westmere架构的至强5600;而四路及多路处
理器方面,最初的至强7100、六核心的Dunnington至强7400、上一代的Westmere至强7500再到最新的至强E7,
算下来Intel在双路及四路以上服务器处理器中已经整整更新了10代产品。
这些产品见证了至强这个品牌一步步走向辉煌,同时这些产品也帮助数以万计的企业获得成功。今天,我们就来
回顾一下最近几年Intel至强的10代产品,为了那些曾经忘却的纪念。
一代、Dempy核心至强5000系列
英特尔公司的“Bensley”平台包括代号为“Dempy”的双核XeonDP处理器和代号为“Blackford”的Intel5000系列
芯片组,另外还有一系列的新技术,比如I/OAT技术、FBD内存技术、更新的安全特性等等。
型号5
5063
(MV)
5020
sSpecSL968SL969SL96ASL96BSL96CSL96DSL96ESL96F
主频3.73GHz3.46GHz3.2GHz3.2GHz3.0GHz2.83GHz2.66GHz2.5GHz
CPUIDstring0F640F640F640F640F640F640F640F64
封装类型771pin771pin771pin771pin771pin771pin771pin771pin
核心电压1.25-1.401.25-1.401.25-1.401.25-1.401.25-1.401.25-1.401.25-1.401.25-1.40
总线速度1066MHz1066MHz1066MHz1066MHz667MHz667MHz667MHz667MHz
Thermal
Guideline
130W130W130W95W95W95W95W95W
CoresteppingC1C1C1C1C1C1C1C1
ThermalSpec78℃78℃78℃68℃68℃68℃68℃68℃
L2CacheSize4MB4MB4MB4MB4MB4MB4MB4MB
L2Cache
Speed
3.73GHz3.46GHz3.2GHz3.2GHz3.0GHz2.83GHz2.66GHz2.5GHz
Manufacturing
Technology
65nm65nm65nm65nm65nm65nm65nm65nm
Bus/Core
Ratio
71615
英特尔当时一共发布了8款基于“Dempy”核心的处理器:Xeon5080、Xeon5070、Xeon5060、Xeon5063、Xeon
5050、Xeon5040、Xeon5030和Xeon5020。这些处理器依然采用了NetBurest微架构,它们将会是最后一个采用该
微架构的Xeon系列产品。在Xeon5000系列处理器中整合了两个完整的NetBurst微架构处理器,并且对于NetBurst
微架构进行了进一步的优化——主要涉及到超管线技术(HyperPipelinedTechnology)和执行追踪缓存(Execution
TraceCache)。每个处理器拥有独立的2MB二级缓存,其前端总线为1066MHz或者667MHz,可以提供8.5GB/s或
者5.3GB/s的传输带宽。
Xeon5000系列处理器采用了65nm制程,这对于有效的抑制Xeon处理器的发热量具有至关重要的作用。采用
90nm制程的Irwindale核心的单核Xeon处理器TDP在130瓦左右,而Xeon5000系列双核处理器TDP也只有135
瓦甚至更低。Xeon5000系列处理器不再采用Socket604封装,改用了FC-LGA6LGA771封装,可进一步改进处理器
的电气性能,更利于功率传导。
这个系列的处理器依然支持超线程技术(Hyper-ThreadingTechnology),这样每个核心可以处理2个线程,每颗
双核心处理器可以并行处理4个线程,双路配置的处理器则能可以同时处理8个线程。另外,这个系列的处理器支持
EIST、EM64T、VT、XDbit等技术,对于TM1功能也提供了支持。
二代、Woodcrest核心至强5100
基于Woodcrest核心的至强5100
英特尔目前已经发布了7款基于Woodcrest核心的Xeon5100处理器,它们是Xeon5160、Xeon5150、Xeon5148、
Xeon5140、Xeon5130、Xeon5120和Xeon5110。
Xeon5100系列处理器的主频变化很大,他们没有延续上一代产品的主频,已经发布的处理器中主频最低是
1.6GHz,而最高的也只有3.0GHz。Xeon5000系列处理器的最低主频为2.5GHz,最高则达到了3.73GHz。处理器主
频的大幅度下降帮助Xeon5100处理器明显的降低了功耗,在7款处理器中只有5160的TDP为80瓦,
5150/5140/5130/5120/5110等五款处理器TDP为65瓦,Xeon5148的TDP只有40瓦。
Xeon5100系列处理器(Xeon5160/5150/5148/5140/5130)增加了对于1333MHz前端总线的支持,该总线实际运
行频率为333MHz,可以4倍于其频率的速率传输数据,因此理论上每秒可传输10.66GB的数据。而部分低端的处
理器(Xeon5120/5110)则支持1066MHz前端总线,此时其系统时钟频率为266MHz,带宽为8.5GB/s。之前的Xeon
5000系列处理器中则有4款产品采用了1066MHz前端总线,还有4款产品采用了667MHz前端总线。前端总线的技
术并没有明显地的改变,依然利用了分离传输(split-transaction)、延迟应答协议(deferredreplyprotocol)和地址和
数据的源同步传输(Source-SynchronousTransfer,SST)等技术。
从英特尔公布的文档来看,Xeon5100系列处理器还进一步改进了热量和功率管理能力,它除了支持原有的TM1
和EIST技术之外,还增加了对于TM2的支持——它主要增加了调节处理器电压的作用。另外,双核英特尔Xeon5100
系列处理器也支持EDBit(ExecuteDisableBit)功能和英特尔虚拟化技术(IntelVT)。不过超线程技术并没有应用
在Xeon5100系列处理器上。
三代、代号Clovertown至强5300系列
Quad-coreXeon5300系列处理器是定位于双路服务器/工作站应用的处理器,代号为Clovertown,它将两个双核
核心整合在一个处理器基板上,率先向市场上推出了四核双路处理器。
英特尔首先发布了5款处理器X5355、E5345、E5335、E5320和E5310,随后又陆续发布了L5335、X5365等处
理器。这些处理器均采用了65纳米制程和LGA6封装(LGA771),配置了8MBL2缓存(每颗处理器4MBL2缓存),
主频分别为最高达到了3.0GHz。型号最后一位是“5”的FSB频率为1333MHz,传输带宽可达10.6GB/s,型号最后一
位是“0”的FSB频率为1066MHz,传输带宽可达8.5GB/s。
四核Xeon5300系列的TDP提升到了一个新的水平,X5355/X5365处理器TDP为120瓦,E系列的四款均为80
瓦,L系列为50瓦。双核Xeon5100系列处理器中,Xeon5160的TDP为80瓦,Xeon5148LV的TDP为40瓦,其
余的均为65瓦。从英特尔公布的这些TDP数据来看,虽然四核处理器是两颗双核处理器的“简单整合”,但是其功率
应该并非两个双核处理器的功率之和。
上图显示的是Xeon5320处理器的基本信息:IntelXeon5320处理器,主频为1.86GHz,前端总线频率为1066MHz,
每个核心配置有32KBL1数据缓存,32KBL1代码缓存,每个DIE则整合有4MBL2缓存(也就是两个核心共享4MB
L2缓存),整个处理器总共具有8MBL2缓存。总的来说,Xeon5100所有的特性,Xeon5300全都具有,最大的改
变无非是核心的数量从2个增加到了4个。但是,毫无疑问的是四核处理器的出现使得计算资源的密度大幅度提升,
而功耗基本保持不变,这对于寸土寸金的IDC而言绝对是有重大意义的。
四代、代号Harpertown至强5400系列
Intel严格的按照其“Tick-Tock”战略,在2007年的11月份推出了基于45nm制程的四核处理器,代号Harpertown。
相对于上一代65nmClovertown核心的产品,Harpertown进一步优化了微架构,添加了功能并且升级了主要规格。
XeonE5430处理器,2.66GHz,12M缓存,1333MHzFSB,具有适中的性能、功耗及价格
从65nm到45nm的转变,不仅仅是当前芯片设计在体积上的缩小。此类处理器中还增加了许多新的特性,如全
新的英特尔SIMD流指令扩展4(SSE4),可通过47条全新指令加快包括视频编码在内的工作负载的处理速度,从
而支持高清晰度画质和照片处理,以及重要的HPC和企业应用。
较高端的X5460处理器,后来Intel还发布了频率更高的X5482处理器和上一代Clovertown相比,Harpertown
处理器将2x4MB的L2缓存提升到了2x6MBL2缓存,每两个核心共享6MB缓存。Harpertown处理器将不再使用
旧的1066MHzFSB,而开始支持更高的1333MHz/1600MHzFSB。由于采用了45nmHigh-k制程技术,四核Harpertown
的功耗依然保持同现有的双核大致相当的水平,TDP为80瓦、120瓦和150瓦,并且频率规格也有所提高,最高端
的XeonX5492处理器可以达到3.4GHz,而上一代XeonX5365只有3.00GHz。
五代、Nehalem核心至强5500系列
对于Intel的Tick-Tock战略已经是老生常谈了;从另一方面讲,这标明了Tick-Tock战略的成功之处,一个简单、
明晰、有序和易于理解的发展计划,对合作厂商、用户和投资者都是极为有利的。TIck-Tock战略简而言之就是Intel
处理器在奇数年进行制程转换(Tick),例如2005年的65nm和2007年的45nm,而在偶数年进行处理器的架构更
新(Tock),Nehalem架构发布的2008年轮换到了Tock,也就是处理器的架构更新。
Nehalem作为Intel用以取代Penryn微架构的新一代处理器架构,和Penryn相比,Nehalem的微架构并非是全新
的,不过,架构上则是一个很大的飞跃:Nehalem采用了直联架构。除此之外,Nehalem还具有一个鲜明的设计理念,
就是采用了可扩展的模块化设计,它将处理器划分为两个部分:Core核心和Uncore非核心(或者叫“核外”),所有
产品线的Nehalem处理器,其Core核心部分都是一样的,只是Uncore部分可能不同,以满足Intel对其提出的动态
可扩展的要求。Nehalem满足了这个要求,它的内核具有可扩展的高可伸缩架构。
由于共处在一个Tick-Tock上,因此Nehalem和Penryn都同样属于45nm工艺,从65nm工艺转变到45nm工艺
带来的巨大能耗降低已经无法再次重现,因此Nehalem就不再注重于能耗的降低,而是注重于性能的提升,这样的
设计理念,带来了处理器架构的巨大变化,这些变化均面向性能的提高,也即是说,我们可以期望Nehalem具有着
强大的性能。
六代、Westmere核心至强5600系列
双路六核服务器版本和双核客户版本Westmere处理器配置
Westmere处理器家族是Nehalem处理器家族的下一代,Nehalem基于45nm制程,Westmere则基于32nm制程,它
们都使用了high-κmetal-gate(高K金属栅极)工艺,在微架构上,Westmere就是Nehalem的增强版本。
IntelHigh-kMetalGate晶体管,这两个技术都是为了增强晶体管的场效应和降低其漏电,除了工艺之外,Westmere
最大的特点就是最高集成了6个处理器核心,包括12MBL3缓存,共多达11.7亿晶体管,四核心的Nehalem包括8MB
L3缓存则有7.31亿晶体管,而这两者具有接近的核心面积(Westmere的还要小一点)。
双核和六核Westmere晶圆图和Nehalem一样,Westmere也实现了PowerGates技术,和Nehalem不同的是,
Westmere的PowerGates不仅仅限于关闭处理器核心,它还扩展到了可以关闭L3缓存以及Uncore上的全局队列
(Westmere晶圆上正中央下方的部分)。在所有核心都被PowerGate之后,L3缓存将会被部分刷新并且Uncore部
分的供电将会线形地降低,L3/Uncore的漏电楼将得到降低。在最限制的情况下,L3缓存和全局队列将会全部刷新并
PowerGated关闭,只有一块附属于L3的SRAM会用来保持所有核心的关键状态。
和Nehalem一样,Westmere也使用了Long-Le晶体管(LongChannel长沟道晶体管)技术,Nehalem-EX和
Dunnington也有使用,只是“分量”有些不同。Westmere有60%的核心部分使用了长沟道晶体管,Uncore部分则同时
使用了超低漏电晶体管和长沟道晶体管。Nehalem则是58%的核心部分使用了长沟道晶体管。
最后,Westmere的漏电功耗大约是总功耗的23%。Nehalem上这个数值是16%。
什么是长沟道晶体管技术呢?
样表:沟道长度(横坐标)与漏电流(纵坐标)的关系,请自行理解(越低的延迟,越高的漏电电流)
在IC设计当中通常需要根据不同的情况使用不同沟道长度的晶体管,非时序关键(non-timing-critical)的线路可以使
用性能略差的长沟道MOSFET晶体管以减少亚阈值漏电。亚阈值漏电:subthresholdleakage,MOSFET的subthreshold
亚阈值特性被广泛利用在低电压线路上。
七代、基于Tulsa核心的至强7100系列
型号制程缓存主频前端总线TDPSMP双核心超线程
7150N65nm
16MBL3
2x1MBL2
3.50GHz667MHz150WMP支持支持
7140M65nm
16MBL3
2x1MBL2
3.40GHz800MHz150WMP支持支持
7140N65nm
16MBL3
2x1MBL2
3.33GHz667MHz150WMP支持支持
7130M65nm
8MBL3
2x1MBL2
3.20GHz800MHz150WMP支持支持
7130N65nm
8MBL3
2x1MBL2
3.10GHz667MHz150WMP支持支持
7120M65nm
4MBL3
3GHz800MHz95WMP支持支持
2x1MBL2
7120N65nm
4MBL3
2x1MBL2
3GHz667MHz95WMP支持支持
7110M65nm
4MBL3
2x1MBL2
2.60GHz800MHz95WMP支持支持
7110N65nm
4MBL3
2x1MBL2
2.50GHz667MHz95WMP支持支持
704190nm2x2MB3GHz800MHzN/AMP支持支持
704090nm2x2MB3GHz667MHzN/AMP支持支持
703090nm2x1MB2.8GHz800MHzN/AMP支持支持
702090nm2x1MB2.66GHz667MHzN/AMP支持支持
采用Paville核心的XeonMP处理器属于Xeon7000系列,而采用Tulsa核心的XeonMP处理器属于Xeon7100
系列。Xeon7100系列处理器主频范围在2.5GHz到3.5GHz之间,前端总线分为667MHz和800MHz两种,型号后缀
为N的前端总线为667MHz,型号后缀为M的前端总线为800MHz。Xeon7000利用处理器主频和前端总线频率来区
隔不同型号的产品(Xeon5000/5100系列处理器也是如此),而Xeon7100则不仅利用主频、前端总线还利用L3缓
存来区隔不同型号的产品。
从我们所掌握的资料来看,Tulsa和Paville在处理器微架构上并没有明显的区别。因此Tulsa处理器如果要具有
比Paxville更吸引人的性能,除了提升频率之外,就是在缓存上做文章了。
每个Xeon7100处理器均包含两个完整的核心,每核心均配置了1MBL2缓存,这仅是Xeon7030/7040处理器
L2缓存容量的一半。不过,Xeon7100的两个核心可以共享“新增”的L3缓存,比如7110和7120均配置了4MBL3
缓存,7130配置了8MBL3缓存,而7140和7150都配置了16MBL3缓存,因此缩减了L2缓存容量并不一定会牺
牲处理器整体性能。特别需要说明的是,7140和7150的L3缓存容量达到了16MB,仅次于Intel于今年发布的双核
Itanium29000处理器24MBL3缓存的容量。但是增加L3缓存并非创新,从XeonMP的历史来看,这样的“改变”仅
仅是一次回归而已。
65纳米制程的应用使得Tulsa处理器得以集成更大容量的缓存。不过即便如此,Tulsa核心面积依然达到了424
平方毫米,而之前的单核Potomac核心面积为354平方毫米,Paville的核心面积也只有299平方毫米。如果处理器复
杂程度变化不大,从90纳米制程升级到65纳米制程则意味着同样尺寸的晶圆可以切出更多的芯片,从而大幅度降低
成本,但是Tulsa集成度远远高于前两代产品,因此其成本不会因此有明显降低。
同样,因为集成度的提高(Xeon7100处理器内包含13亿个晶体管),Tulsa的功耗的绝对值也维持着较高的水平。
Xeon7110/7120的TDP为95W,而7130、7140和7150则均达到了150W。考虑到Xeon7100系列处理器主频更高,
而且整合了L3缓存,其相对于Paxville处理器在能耗控制上还是取得了很大的进步的。
Intel提供的资料显示,采用Tulsa核心的Xeon7100系列处理器在ERP、SCM、CRM等商业应用中性能有60%
以上的提升,更可以将交易处理速度提升70%以上(TPC-C测试,Tulsa320000TPM,Paxville188000TPM,Potomac
115000TPM),部分电子商务应用软件中其性能提升1倍以上。同时,Intel还宣称Xeon7100系列处理器的每瓦特性
能是上一代产品的2.8倍。
大容量L3缓存除了可为处理器提供速度数据缓存之外,还可供Tulsa处理器内部的两个核心交换L2缓存数据之用,
而无需经过FSB和北桥,这将大大提升缓存命中率,改善延迟效能。
八代、代号Tigerton至强7300系列
Tigerton分为四核和双核两个版本
随Caneland平台一起发布的有两个系列的处理器:Xeon7300四核处理器和Xeon7200双核处理器,代号分别为
Tigerton-QC和Tigerton-DC。从上图可以看出,这两个系列的处理器均是将两个DIE封装在一起,每个DIE均有4MB
L2缓存。其中Tigerton-DC的设计非常有意思,它没有采用单个DIE双核的设计——英特尔称这种设计可以在现有
条件下让双核处理器具有更大容量的缓存,适于某些高性能计算和财务服务等有较大缓存需求的应用。
处理器型号主频L2缓存FSBTDP按需配电(DBS)封装
X73502.93GHz8MB1066MT/s130瓦是FC-mPGA6
L73451.86GHz8MB1066MT/s50瓦否FC-mPGA6
E73402.40GHz8MB1066MT/s80瓦是FC-mPGA6
E73302.40GHz6MB1066MT/s80瓦是FC-mPGA6
E73202.13GHz4MB1066MT/s80瓦是FC-mPGA6
E73101.6GHz4MB1066MT/s80瓦否FC-mPGA6
E72202.93GHz8MB1066MT/s80瓦是FC-mPGA6
E72102.40GHz8MB1066MT/s80瓦是FC-mPGA6
Xeon7300系列处理器包括6款产品,其中4款E系列主频在1.6GHz-2.4GHz之间,4-8MBL2缓存,1066MT/s,
TDP均为80瓦,适用于机架式/刀片式服务器;L系列只有一款L7345,主频为1.86GHz,8MBL2缓存,TDP为50
瓦,适用于高密度机架式/刀片式服务器;X系列的也只有一款X7350,主频高达2.93GHz,TDP也达到了130瓦,
适用于高性能应用。
Xeon7200/7300扩容了二级缓存去掉了三级缓存,因此我们估计Tigerton的复杂程度并不会明显的增加,所以功耗的
降低主要来自频率的降低和65nm制程的进一步改进。Xeon7200/7300处理器支持TM1、TM2功能,利用英特尔智
能功率控制技术可单独控制每个核心的功率状态。
系列
名称
代号型号主频范围L2缓存L3缓存FSBTDP范围DC/QC制程
Xeon
7000
Paxville
7041、7040、
7030、7020
2.66-3.0GHz
2x(1-2)
MB
0667-800MT/s-DC90nm
Xeon
7100
Tulsa7110N/M-7150N2.5-3.5GHz2x1MB4-16MB667-800MT/s95-150瓦DC65nm
Xeon
7200
Tigerton-DCE7210、E72202.4-2.93GHz
2x(2-4)
MB
01066MT/s
50-80-130
瓦
DC65nm
Xeon
7300
Tigerton-QC
E/L/X三个系
列,共6款
1.6-2.93GHz2x4MB01066MT/s80瓦QC65nm
Tulsa相对于Paxville在微架构上并没有改进,最大的改变是开始采用65nm制程,为了进一步的提升性能,只有
在主频和L3缓存上打主意。弃用Netburst微架构,采用高效能的Core微架构(内置WDEE,宽位动态执行引擎)
并且升级到四核是Xeon7200/7300系列处理器相对于之前的Xeon7000/7100系列处理器最大的不同。此外,Xeon
7200/7300还扩容了二级缓存(从2x1MB升级到了2x4MB,支持智能缓存和智能内存访问),去掉了三级缓存(也
不排除今后为了提升性能再增加),同时前端总线升级为1066MT/s,按照英特尔XeonDP路线图来看,今后XeonMP
处理器的FSB升级到1333MT/s甚至1600MT/s也是可能的。
代号Tigerton,基于Core微架构的Xeon7300处理器
所有的Xeon7200/7300都支持EM64T、EIST、EDbit、VT等技术,提供丰富的功能来满足多种应用的需求。
九代、
Dunnington采用其后来者Nehalem一样的45nmCMOS工艺,采用了金属栅极High-K电介质晶体管以及9层铜
互联技术,总晶体管数量则为1.9Billion——19亿,已经和Nehalem-EX的23亿很接近了,新增加的核心和大容量的
L3都需要占据很多的晶体管。Dunnington的核心面积为503.2mm。
六核心45nmPenrynDunnington——XeonX7460的结构图,和其他Penryn不同,是一整块“原生”的核心
来源:ISSCC2009Over1MillionTPC-Cwitha45nm6-CoreXeonCPU
对于一款处理器来说,除了外部平台的架构之外,处理器内部架构和处理器微架构都是对性能有很大影响的主要因素。
如图所示的Dunnington属于最高规格的一款,型号是X7460(曙光I840-H就采用了这款处理器),架构上具有6个
Penryn核心,每个核心带有64KBL1缓存(32KBL1-I,2KBL1-D),每两个处理核心共享3MB的L2缓存(果然
还是带有“粘”的性质),三对处理器内核就总共带了9MB容量的L2,每个核心通过一条128Bytes的缓存线联结L2。
Intel宣称不同的一对核心之间的L2是具有其他互通界面的(被命名为AdvancedTransferCacheArchitecture),不过
语焉不详。其他的四核45nmPenryn也具有这个高级缓存传输架构。X7460的核心频率为2.66GHz,不算太高。
Dunnington里面最高主频就是2.93GHz。
7400系列处理器的规格,注意7400系列处理器里面也有4核心的型号
7400系列处理器的缓存架构细节
重点来了,除了上面这些传统的架构之外,Dunnington特别的地方是多了一个Uncore结构,这个结构包括了容
量达到了16MB的L3缓存,所有的处理核心经过L2联结到中央系统逻辑,如下图所示,标明为Uncore的中央电路
联结着所有的核心以及16MBL3缓存,并通过一个传统的FSB总线与处理器外部通信,由于所有处理内核是通过新
的总线与Uncore联结,而与以往的“粘结产品”使用FSB互联不同,大部分的交通都发生在内部,从而可以大为节约
处理器的FSB带宽。XeonX7460的FSB频率为1066MHz,提供8.5GB/s的带宽,现在的XeonMP都支持MIB(Multiple
IndependentBus,多重独立总线,XeonDP的DIB的进阶版本),每一个处理器都通过独立的FSB与MCH联结,因
此效率上还可以。
"Uncore"是六核心45nmPenryn至强Dunnington的重要部分
十代、
代号为Nehalem-EX的服务器处理器是x86架构中第一个具有8个核心的产品,Nehalem-EX拥有8个CPU核心,
配置了24MB的L3。我们知道Intel的x86服务器产品线通常分为两个层次:2个Socket以及2个Socket以上,如
Nehalem-EP就是用于2个及以下Socket,Nehalem-EX就是用于4个或4个以上Socket。台式机产品线的Nehalem处
理器:Corei7(Bloomfield)在2008年11月发布,Nehalem-EP则预计在2009年3月中发布,Nehlam-EX若无意外
则会是在下半年的晚些时候。由于竞争对手AMD的6核心OpertonIstanbul就目前来看也就和Nehalem-EP打个不分
上下,因此提前推出的“意外”应该很难发生。
Intel45nm/32nm处理器
此次Nehalem-EX是由位于California加利福尼亚州SantaClara研发中心推出的。一般认为该研发中心担任Itanium
处理器的研发工作。顺便提一下,PentiumPro、Pentium4处理器都是出自Hillsboro研发中心,HTT超线程技术也是,
因此Nehalem和PentiumPro这么相像、Nehalem上搭载Pentium4上的超线程改良版也就顺理成章、容易理解了——
现在大家清楚为什么Pentium4、Nehalem有超线程而Cornoe没有超线程了吧?
来源:ISSCC2009A45nm8-CoreEnterpriXeon®Processor
上图是Intel在ISSCC09"A45nm8-CoreEnterpriXeon®Processor"论文当中给出的Nehalem-EX核心分布图,
基本构成是处理器核心分布在四个角落,所有核心共享的L3缓存则居于内核中部,在内核正中央则具有两个Hub集
线器和一个Router路由器来负责所有核心的数据共享,管理内存、QPI以及L3缓存之间的数据流向。Nehalem-EX
在核心正上面具有4个QPI——QuickPathInterconnect总线,核心正下方则是两个内存界面,总共有4个DDR3内存
通道。下图是另一个形式的核心分布图,带有一些猜测性质:
众所周知,Nehalem-EX的生产工艺和其他Nehalem都一样,都是45nmCMOS工艺,采用了金属栅极High-K电
介质晶体管以及9层铜互联技术,总晶体管数量则为2.3Billion——23亿,是4核心Bloomfield的三倍以上,和Tukwila
Itanium处理器一样,然而Tukwila不断跳票,因此Nehalem-EX有幸成为现在Intel晶体管数量最多的处理器。此外,
虽然晶体管数量剧增,Nehalem-EX的面积却只提升了约2.4倍左右。除了核心数量是Bloomfield的两倍之外,额外
加入的晶体管被用在了更多数量的L3上,QPI/IMC以及中央系统逻辑(Hub和Router)的变化不算太大。
廉价方案入门级N、A专业显卡对比评测2011-05-10佚名IT168
第1页:NV/AMD低端专业显卡谁更出色?
据国内权威
第1页:NV/AMD低端专业显卡谁更出色?第2页:QuadroFX580专业显卡拆解
第3页:测试平台基本信息介绍第4页:主板芯片组详细规格
第5页:QuadroFX580显卡测试信息第6页:CineBench性能测试
第7页:SPECapcfor3dsMax9第8页:SPECViewperf9.0
第9页:SPECviewperf10第10页:SPECapcforMaya2009
第11页:SPECviewperf11第12页:总结
机构的调查,大部分中小型CG工作室都没有专业的制图设备,甚至有些小型工作室并没有专业的工作站或者图形卡。
事实上,工作站的价格的确不菲,但是专业的绘图卡价格已经没有原来那样的居高不下。而对于低端显卡,许多人会
质疑其效能的有效性。今天,我们就来对比一下目前行业内的两款入门级产品,看看它们的性能究竟能否满足大众的
需求(51CTO推荐阅读:搭配多核至强专业显卡V4800测试(多图))。
QuadroFX580外观(和GeForce9500GT很相似)
QuadroFX580提供了一个DVI接口和两个DisplayPort接口,这一点和QuadroFX3800相同
扎实的供电系统
QuadroFX580与上一代QuadroFX570等产品比较
今天我们介绍的主力产品是来自NVIDIA的QuadroFX580。它是上一代QuadroFX570的升级版,在性能上提供了很
大的改变。首先,QuadroFX580具备了32个流处理器,而QuadroFX570只有16个;其次,QuadroFX580的显存
带宽为25.6GB/s,而QuadroFX570只有12.8GB/s。第三,QuadroFX580搭配了512MBGDDR3显存,而QuadroFX570
也只有256MBDDR2。相同的是,两者的显存位宽都只有128bit。
第2页:QuadroFX580专业显卡拆解
小心翼翼的拆下了散热器
QuadroFX580显卡背面
G96-875-C1核心,大面积使用在GeForce9500GT上
HYB18H1G321AF显存,组成512MB128bit规格
第3页:测试平台基本信息介绍
在进行测试之前,我们先来看一下本次为这块QuadroFX580显卡所搭配的平台详细规格:
测试平台配置一览
处理器子系统
处理器型号双路IntelXeonX5570
处理器架构Intel45nmWestmere
代号Nehalem-EP
核心/线程数量4/8
主频2.93GHz
处理器指令集
MMX,SSE,SSE2,SSE3,SSSE3,
SSE4.1,SSE4.2,EM64T,VT
外部总线
2xQPI
3200MHz
6.40GT/s
单向12.8GB/s(每QPI)
双向25.6GB/s(每QPI)
L1CodeCache4×32KB8路集合关联
L1DataCache4×32KB4路集合关联
L2Cache4×256KB8路集合关联
L3Cache8MB16路集合关联
主板
主板型号泰安S7010
芯片组Intel5520
北桥芯片特性
2xQPI
VT-dGen2
内存控制器每CPU集成三通道R-ECCDDR31333
配置内存类型4GBR-ECCDDR31333SDRAMx6
存储子系统
磁盘控制器IntelICH10RSATAAHCIController
磁盘控制器规格
6xSAS3Gb/s
AHCIw/NCQ
RAID0/1
磁盘控制器驱动IntelMatrixStorageManager8.8.0.1009
硬盘
Seagate
Barracuda7200.12
ST3250318AS
硬盘规格
7200RPM
250GB
SATA3Gb/s
NCQ
16MBCache
图形子系统
显卡型号NVIDIAQuadroFX580
显卡规格
PCIExpressx16Gen2
32StreamProcessor@450MHz
512MBGDDR3RAM@64-bit800MHz
显卡驱动ForceWare267.66
网络连通性
网卡Intel82576EBDualPortGigabitNetworkController
网卡驱动IntelPROSet13.5
软件环境
操作系统WindowsXPProfessionalx64EditionSP2
我们本次测试使用的是泰安S7010平台,搭配了双路至强X5570处理器,这是上一代Nehalem-EP处理器中的高端型
号。同时我们配备了6条共24GBDDR3内存用以系统辅助,磁盘方面使用的是7200.12系列SATA硬盘。
第4页:主板芯片组详细规格
下面我们再来使用EVEREST软件,查看平台详细的设置信息。
16线程,可以看到16个处理器核心
三通道内存
主板使用了Intel5520处理器
处理器自带的内存控制器
第5页:QuadroFX580显卡测试信息
CPU-Z和GPU-Z所显示的处理器和QuadroFX580显卡的相关信息。
双路至强X5570处理器,主频为2.93GHz
8MB三级缓存
泰安S7010主板
三通道DDR3内存,总容量24GB
12条内存插槽
测试中,我们使用了最新的QuadroForceWare267.66驱动,通过最新的GPU-Z0.5.0软件查看QuadroFX580的相关
信息。我们看到,它的核心使用了65nm工艺,频率为450MHz;显存容量为512MBGDDR3,频率为800MHz。和
我们之前介绍的Quadro10代产品一样,QuadroFX580也不支持SLI技术。
第6页:CineBench性能测试】
CineBench是基于Cinem4D工业三维设计软件引擎的测试软件,用来测试对象在进行三维设计时的性能,它可以同
时测试处理器子系统、子系统以及显示子系统,我们的平台偏向于多一些,因此就只有前两个的成绩具有意义。和大
多数工业设计软件一样,CineBench可以完善地支持多核/多处理器,它的显示子系统测试基于OpenGL。
CineBench测试成绩分为两部分,其中包括了处理器性能和显卡性能。处理器测试中,X5570表现出了强悍的性能。
而在显卡测试中,我们的FX580成绩为7235CB-GFX,对于入门级显卡来说这个成绩已经非常不错了。
CineBenchR11.5的计算方式与上一代的R10有着明显的不同,这里的OpenGL测试成绩为12.09fps。
第7页:SPECapcfor3dsMax9
SPECapcfor3dsMax9是基于典型用户的使用情况设定的负载,在测试过程中会涉及到wireframemodeling、shading、
texturing、lighting、blending、inverkinematics、objectcreationandmanipulation、editing、scenecreation、particletracing、
animation和rendering。3dsMax9提供了32位/64位两种版本,我们使用的是32位版本。
我们在3dsMax9软件测试中,我们使用的分辨率是1920*1080,这是目前主流应用的分辨率。我们看到在对比成绩
中,Software项目中两款显卡的成绩非常接近,而在OpenGL项目中FX580略微领先一些,而在Direct3D测试中则
是V3800领先,两者似乎是并驾齐驱。
第8页:SPECViewperf9.0
SPECViewperf9.0是专业级、符合工业标准的OpenGL图形显示卡效能测试分析软件,其测试项目有六项:3dsmax、
DRV、DX、Light、ProE、Ugs,包括软件执行效能仿真(3dsmax、ProE)、以及动画公园场景仿真(Light)。等等,可以
产出相关的分析数据。
SPECViewperf9软件推出时间较长,从结果来两款显卡也是互有胜负。整体来说,FX580领先的项目较多,但是V3800
在特定的应用当中优势也非常明显。
第9页:SPECviewperf10
SPECviewperf10是一款测试专业显卡在多个CAD/DCC应用程序中的OpenGL性能的软件,包括3dsmax、CATIA、
EnSight、Maya、Pro/ENGINEER、SolidWorks等。最新推出的SPECviewperf10可以告知你在多少倍抗锯齿下性能表
现会低于无抗锯齿情况下的10%,并提供截图比较。
FX580测试成绩
V3800测试成绩
SPECviewperf10测试中,首先说明一个问题,FX580在最新的驱动下已经可以实现16X全屏抗锯齿;而在AMD的
产品中还仅停留在8X。测试项目下,在没有开启抗锯齿的时候两款现在在个别项目中还具备比较的能力,FX580在
许多项目中都有所领先;不过随着抗锯齿倍数的增加,V3800的性能明显突出出来,FX580在开启抗锯齿之后的成绩
下滑很明显,这应该与显卡硬件的流处理器数量及显存等规格有关。
FX580显卡测试成绩
V3800测试成绩
多线程测试中,单线程下显卡的成绩和没有抗锯齿下表现出的结果是差不多的,两款显卡的成绩基本接近。但是4
线程下,V3800表现出了明显的优势,这是因为较高的硬件规格提供了更大的负载承受力。
第10页:SPECapcforMaya2009
AutodeskMaya2009中有很多的改进,它可以帮助你更有生产力,包括Maya的Asts(资产),预选高亮(Pre-Selection
highlighting),热图显示(HeatMapDisplay),属性传递(TransferAttribute)以及强大用户界面更新。此外,您还
可以发现Maya2009中显著的性能改善,在许多领域,包括支持多线程的工作和算法,而且它相比之前版本的速度更
快,加速模拟和渲染的表现,甚至可以支持更多巨大的场景。
Maya项目是AMD的看家本领,也是它的强项所在。从测试的结果我们可以看到,V3800在对比中处于明显的领先
优势,从GFX显卡成绩到总成绩。应该说,虽然同为定位低端的产品,但由于硬件规格的原因,V3800在实际表现
上要更为出色。
第11页:SPECviewperf11
6月底,SPEC组织旗下的图形性能测试项目组(SPECgpc)正式推出了Specviewperf11工作站用专业图形综合测试
软件,新版本的主要变化是采用了新的图形测试界面,以及增加了用于测试的新款专业级3D应用程度片段。
SPECviewperf11采用的新GUI图形界面令首次使用这款软件的新人也能很容易上手运行测试,读取测试成绩以及获
取帮助信息等,此外,Windows和Linux操作系统下均使用同样的测试脚本,保证了不同平台下测试结果的可比性。
新版SPECviewperf11中包含有8个不同的测试环节,每个环节都能模拟一款CAD/CAM软件,某些测试场景中甚至
包含有超过6000万个顶点数据,能够充分测试出参测系统的整体性能与显卡的OpenGL性能。
FX580显卡1920*1080分辨率下的测试
V3800显卡1920*1080分辨率下的测试
FX580显卡1600*1200分辨率下的测试
V3800显卡1600*1200分辨率下的测试
我们本次使用的是最新的SPECviewperf11软件,这款软件对于硬件的要求较以往版本更为苛刻。但是从最终的结果
来看,与之前SPECviewperf10的成绩趋势基本相同,还是硬件规格在这里起了比较大的作用。
第12页:总结
本次我们对比了QuadroFX580和FireProV3800两款入门级显卡的性能,为专业作图的用户提供了廉价的解决方案。
淘宝网价格展示
我们对比一下两款产品的价格。从售价来说,两者属于同一档次的产品,都是千元左右的价位。而从我们刚刚对比的
性能来看,虽然多数项目中两者的成绩基本持平,但是在SPECviewperf几款软件提供的数据显示,随着显卡负载压
力的增大,比如多线程或者多倍抗锯齿的情况下,V3800凭借着更高的性能规格要比FX580的表现更为出色,这种
情况在AMD占据优势的Maya平台上体现得更为明显。
很多时候,小型的工作室都无力负担价格高昂的专业卡,而对于入门的专业卡性能又存在疑虑。今天我们的测试已经
给出了一个较好的答案,从性能来说入门级专业卡不仅仅可以实现比游戏卡更好的效果,而且在运行速度上也更为快
速。对比NVIDIA和AMD的入门级专业卡,AMD在性能上有着一定的领先优势,性价比更为出色。
回首英特尔至强处理器十二年发展历程2010年04月22日23:34分作者:eNet来源:eNet
第1页:P6微架构时代
说起X86服务器,相信你一定会想到英特尔及其针对服务器、工作站的处理器平台:至强(Xeon),毕竟X86服务器
芯片这块市场十之八九的份额都在英特尔的手中。而且,更重要的是,在一定程度上,至强代表了X86服务器的技
术核心。
众所周知,英特尔的CPU先后经历了8086、80286、80386、80486以及此后的奔腾系列、赛扬系列和至强系列,奔
腾系列又包括奔腾1、2、3、4,其中,具有里程碑性质的是8086、80486和奔腾。1993年,英特尔公司推出“奔腾”Pentium
芯片,被称为586或P5,含有310万个晶体管,速度达60MHz。1995年11月,英特尔推出“新奔腾”PentiumPRO,
这是自从1979年以来的芯片家族的第六代,代号为P6,有550万个晶体管,第一批芯片运行速度为150-200MHz。
这种“新奔腾”就是至强的前身,目标直接定位于商业用高性能计算机、服务器等企业级计算领域。
翻开至强处理器12年的发展历史,我们看到,这款处理器已经发生了巨大的变化:经过了P6(奔腾III)、Netburst(奔
腾4)、酷睿、Nehalem等几代微架构的变迁,制造工艺从最早的250纳米提升了现在的45纳米,CPU内核数量从
单核发展到了6核,主频从400MHz提升到3.8GHz,前端总线带宽从100MHz发展到了1.6GHz,并最终转换到了全
新的QPI直联架构,指令集和诸如超线程、智能节能、虚拟化等功能不断推陈出新……
至强的商标虽然经历了几代x86和x86-64处理器,但仍然保留了下来,旧型号是将至强放到对应的处理器名字的末
尾,如奔腾II至强,奔腾III至强,但2001转换到奔腾4架构上之后,新型号则一率直接叫至强,这似乎也意味着
基于至强的PC服务器正一步步脱离PC的色彩,更加强大,也更加独立。比较而言,至强CPU除了多重处理能力、
在同一主板上支持多颗处理器外,比对应的桌面级CPU拥有更多的缓存。
笔者按照处理器微架构的不同,将至强这12年的历史分成了四个阶段,分别加以阐述。
1998-2000年P6微架构时代
包括250纳米的奔腾II至强Drake、奔腾III至强Tanner以及180纳米工艺的奔腾III至强Cascades,共20多款处理
器,插座接口是Slot2,指令集只有MMX和SSE。
P6时代,CPU主频几乎完全代表了产品高低档的不同——型号中的数字与主频是一致的,不过,主频都很低,直到
2000年的8月22日才出现了1GHz的“奔腾III至强1000”;前端总线带宽也很低,只有100MT/s或133MT/s。
也许最让今天人们感慨的是,P6处理器的功耗低得惊人,最高也不过46.7瓦特,最低的一款只有23瓦特。比较来看,
从250纳米到180纳米制造工艺的进步对于P6主频提升和功耗降低都是非常明显的:250纳米时代,主频在
400-550MHz之间徘徊,而到了180纳米的奔腾III至强Cascades,主频已经跃升至1GHz,功耗则下降了10瓦特左
右,跟今天八九十瓦、甚至100多瓦的CPU相比,只有20-30瓦特的Cascades真的是相当“凉快”!
第2页:NetBusrt微架构时代
2001-2006年NetBusrt微架构时代
这是至强历史上持续时间跨度最长的一代架构了,甚至到2007年一季度还发布了一款基于Netburst架构的产品,包
括的处理器型号非常多:180纳米的至强Foster,130纳米的至强Prestonia和Gallatin,90纳米的至强Nocona、Irwindale、
Paxville、Cranford、Potomac,以及65纳米的Dempy和Tulsa,一共有70多款处理器,CPU插座有LGA771、Socket
603。
这时至强已经开始逐渐摆脱PC的影响,型号前面也不在加上“奔腾III”、“奔腾4”的标称,正在朝面向企业计算的
独立平台转化,至强出现了按UP(单路系统)、DP(双路系统)和MP(多路系统)的划分方式。可以说,在NetBurst时代,
至强发生了脱胎换骨式的蜕变,企业计算的特征越来越明显,同时在2003年也直接受到了AMD皓龙处理器的强有
力挑战。
在这六年当中,至强的主要特性变化特点有:
1)能效计算:制造工艺从180纳米提升到了65纳米;伴随着制造工艺的进步,主频和功耗之间的关系变得微妙起来,
“要获得高主频往往得付出高功耗的代价”——180纳米(1.4-2GHz,48-77W)、130纳米(1.5-3.2GHz,30-90W)、90
纳米(2.6-3.8GHz,55-165W)、65纳米(2.5-3.7GHz,95-150W),比如主频3GHz的双核至强7040(PaxvilleMP)的TDP
功耗就高达165W,“每瓦特性能”的概念开始出现并广泛流行,同时,英特尔也开始通过一系列技术创新如制造工
艺改进、低功耗版处理器、EIST等,来保证平台更新时“在功耗不变的条件下提升性能”。英特尔甚至在2006年还
尝试动用了用于笔记本电脑的处理器微架构,推出基于PentiumM(Yonah)架构的双核至强DP处理器(Sossaman),TDP
功耗为31W,使用SocketM插座,不过,主频最大仅2.166GHz。
2)唯主频论过时:由于唯主频论开始过时,至强的命名型号也发生了大的变化,从2006年开始,英特尔不再用“至
强UP/DP/MP+主频”来的方式来命名、区别不同型号,而是分为针对双路平台的至强5000系列和针对多路平台的至
强7000系列,如至强50XX(Dempy)、至强70XX(PaxvilleMP)、至强71XX(Tulsa),后面两位数用来标识CPU的不
同,一般数字越大,表示性能越高;而且,由于这一阶段还开始出现核心数量、功耗的区别,所以有些产品前面也开
始加上DualCore(双核)、后面加上Low-voltage(低功耗)等字样。
3)64位计算:2004年6月,在AMD64位皓龙的竞争推动下,英特尔放弃过去单纯依靠安腾主打64位计算市场的策
略,推出EMT64的Nocano,走上32位/64位兼容型计算道路;
4)多核计算:2005年开始出现双核芯,多核计算开始走上快车道;
5)多功能:指令集和CPU的功能得到了频繁更新,跟P6架构相比,新增了SSE2、SSE3指令集,以及许多过去闻所
未闻的新技术,如超线程、EIST(EnhancedIntelSpeedStepTechnology)智能降频节电技术、EMT64兼容32位和64位
计算、XDbit(NoeXecute)防病毒防恶意攻击技术、intel-vt硬件辅助虚拟化技术等。
6)均衡计算:随着处理器的性能越来越强,但前端总线的带宽提升幅度却不大,从400、533、667、800提升到1066MT/s,
I/O瓶颈也越来越突出,尤其是对于四路以上的系统。在这一阶段,虽然AMD已经在2003年推出了“直连架构,集
成内存控制器”的皓龙,但英特尔仍然坚持FSB架构。于是,我们看到,为了缓解CPU“吃不饱”的状况,这一时
期英特尔主要是不断进行大容量L2缓存设计,甚至开始引入大容量L3缓存,如针对多路系统、FSB带宽仅有667MT/s
的双核至强7150N(Tulsa)就拥有2x1MB二级缓存和高达16MB的三级缓存。
7)虚拟化:随着X86服务器虚拟化的流行,英特尔在2006年5月份发布的Dempy处理器中开始引入其硬件辅助虚
拟化技术intel-vt,以缓解VMware等虚拟化软件的性能损耗,提高虚拟化的效率,此后,英特尔VT得到了长足的发
展,直至今天。
总之,这是新旧交替的六年,也是英特尔历尽蜕变的六年,不仅要面对功耗攀升的棘手问题,还要面对来自AMD的
挑战,期间双方在64位、双核、功耗等方面多次交手,虽然各有胜负,但总体来说,英特尔在这一时期失误颇多,
最终让AMD皓龙在市场中占稳了脚跟。
第3页:酷睿(Core)微架构时代
2006-2008年酷睿(Core)微架构时代
2006年其实是Netburst和酷睿两种架构并存的一年。差不多也是从这一年开始,英特尔引入了其新的产品更新策略:
Tick-Tock,这其实也是英特尔对市场的一种承诺,即当年更新微架构,下一年更新制造工艺,依次类推,不断推动
处理器技术的发展。于是我们看到2006年是酷睿微架构年,2007是45纳米工艺Penryn,2008是Nehalem微架构,
2009是32纳米工艺的Westmere,2010年是SandyBridge全新架构......
Core架构尽管历时才3年左右,但英特尔一共推出了近90款CPU,包括:65纳米针对单路平台的的双核Allendale(至
强3000系列)、双核Conroe(至强3000系列)、四核Kentsfield(至强3200系列),针对双路平台的双核Woodcrest(至强
5100系列)和四核Clovertown(至强5300系列),针对四路以上平台的Tigerton(双核至强7200系列、四核至强7300系
列),以及45纳米针对单路平台的双核Wolfdale(至强3100系列)和四核Yorkfield(至强3300系列),针对双路平台的
双核Wolfdale-DP(至强5200系列)、四核Harpertown(至强5400系列),还有针对四路平台的四核/六核Dunnington(至
强7400系列)等十来个类别。
和Netburst微架构相比,Core时代至强处理器的变化主要有:
1)制造工艺从65纳米升级到了45纳米(统称为Penryn),使用了高K材料,这一工艺的进步为英特尔在CPU中集成
更多的晶体管、提高主频、降低功耗、进行下一代微架构创新等提供了基础;
2)多核计算得到进一步发展,出出四核(最早出现在Clovertown至强5300系列中)与六核(最出现在Dunnington至强
7400系列中)产品;
3)指令集得到进一步发展,新增SSE4.1,在虚拟化、智能节能等方面也得到了进一步增强;
4)针对单路服务器的处理器统一到至强3000系列名下;
5)为了将CPU功耗控制在可接受的范围以内,英特尔一方面通过多核设计来提升性能,另一方面通过工艺进步来实
现主频与功耗的平衡,跟Netburst相比来看,主频甚至有所降低,但功耗基本得到了有效控制,65纳米(1.6-3GHz,
35-150瓦特)45纳米(1.866-3.5GHz,20-150瓦特);
6)由于Core时代仍然采用前端总线结构,为了提升I/O带宽,降低I/O延迟,英特尔一方面提升总线带宽(1066、1333、
1600MT/s),另一方面继续采用大容量L2和L3缓存设计,如六核心的至强7460主频为2.667GHz,FSB为1066MT/s,
L2缓存为3x3MB,L3缓存为16MB。
7)这一时期的CPU插座也发生了变化,主要有LGA771、LGA775和Socket604。
第4页:Nehalem微架构时代
虽然Nehalem微架构在2008年就已经在个人电脑的i7处理器上得到采用,但在服务器上的应用却是今年3月30日
Nehalem-EP至强处理器的发布——包括45纳米的针对单路系统的双核/四核Bloomfield(至强3500系列)以及针对双
路系统的双核/四核Gainestown(至强5500系列)。
对英特尔而言,基于45纳米的Nehalem代表了一个全新时代的到来:放弃传统前端总线架构,转向QPI直连架构,
打破传统I/O瓶颈的束缚,QPI带宽高达4.8-6.4GT/s,远远高于FSB时代的1.6GT/s!
如果说当年的奔腾Pro开创了X86工业标准服务器大批量生产和普及的时代,那么,至强5500则是15年来性能提
升幅度最显著的一代,其性能是2005年单核至强的9倍,是上一代至强5400的2.5倍,同时空闲状态下的平台功耗
降低了50%,其背后采用了一系列技术包括45纳米工艺、全新内存子系统、快速通道互联技术(QPI)、智能节能技术、
全新I/O子系统。在性能方面,智能加速技术可以满足对CPU主频比较敏感的应用需求,超线程技术则可以满足高
度并行的应用需求,针对能耗方面,则有集成功率门限、自动低功耗、节点管理器等等。这些创新的技术使得今天的
用户“可以在需要的时候提高性能,也可以在不需要性能的时候自动降低功耗。”
针对四路以上的系统,英特尔刚刚发布的八核心Nehalem-EX(命名为至强7500,代号Beckton)。Nehalem-EX将拥有
23亿晶体管,拥有4个QPI链接,可以让服务器从双路一直轻轻松松地扩展到8路,且无须第三方芯片组技术支持,
从而最高可以支持到64核、128个线程,拥有24MB共享L3缓存,每个处理器支持16个内存插槽,引入了原来只
在安腾上采用的RAS特性:MCA(机器检验体系结构)功能。根据英特尔的测试,Nehalem-EX与上一代的至强7400
相比,在性能和带宽两方面都实现了“前所未有”的飞跃:内存带宽高达9倍,数据库性能超过2.5倍,整数吞吐量
超过1.7倍,浮点吞吐量超过2.2倍!
本文发布于:2023-03-05 19:22:54,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/1678015374149094.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:至强处理器.doc
本文 PDF 下载地址:至强处理器.pdf
留言与评论(共有 0 条评论) |