CPU基本参数知识详解
在电子技术中,脉冲信号是一个按一定电压幅度,一定时间间隔
连续发出的脉冲信号。脉冲信号之间的时间间隔称为周期;而将在单
位时间(如1秒)内所产生的脉冲个数称为频率。频率是描述周期性
循环信号(包括脉冲信号)在单位时间内所出现的脉冲数量多少的计
量名称;频率的标准计量单位是Hz(赫)。电脑中的系统时钟就是
一个典型的频率相当精确和稳定的脉冲信号发生器。频率在数学表达
式中用“f”表示,其相应的单位有:Hz(赫)、kHz(千赫)、MHz
(兆赫)、GHz(吉赫)。其中1GHz=1000MHz,1MHz=1000kHz,
1kHz=1000Hz。计算脉冲信号周期的时间单位及相应的换算关系是:s
(秒)、ms(毫秒)、μs(微秒)、ns(纳秒),其中:1s=1000ms,
1ms=1000μs,1μs=1000ns。
CPU的主频,即CPU内核工作的时钟频率(CPUClockSpeed)。
通常所说的某某CPU是多少兆赫的,而这个多少兆赫就是“CPU的主
频”。很多人认为CPU的主频就是其运行速度,其实不然。CPU的主
频表示在CPU内数字脉冲信号震荡的速度,与CPU实际的运算能力并
没有直接关系。主频和实际的运算速度存在一定的关系,但目前还没
有一个确定的公式能够定量两者的数值关系,因为CPU的运算速度还
要看CPU的流水线的各方面的性能指标(缓存、指令集,CPU的位数
等等)。由于主频并不直接代表运算速度,所以在一定情况下,很可
能会出现主频较高的CPU实际运算速度较低的现象。比如AMD公司的
AthlonXP系列CPU大多都能已较低的主频,达到英特尔公司的
Pentium4系列CPU较高主频的CPU性能,所以AthlonXP系列CPU
才以PR值的方式来命名。因此主频仅是CPU性能表现的一个方面,
而不代表CPU的整体性能。
CPU的主频不代表CPU的速度,但提高主频对于提高CPU运算速
度却是至关重要的。举个例子来说,假设某个CPU在一个时钟周期内
执行一条运算指令,那么当CPU运行在100MHz主频时,将比它运行
在50MHz主频时速度快一倍。因为100MHz的时钟周期比50MHz的时
钟周期占用时间减少了一半,也就是工作在100MHz主频的CPU执行
一条运算指令所需时间仅为10ns比工作在50MHz主频时的20ns缩短
了一半,自然运算速度也就快了一倍。只不过电脑的整体运行速度不
仅取决于CPU运算速度,还与其它各分系统的运行情况有关,只有在
提高主频的同时,各分系统运行速度和各分系统之间的数据传输速度
都能得到提高后,电脑整体的运行速度才能真正得到提高。
提高CPU工作主频主要受到生产工艺的限制。由于CPU是在半导
体硅片上制造的,在硅片上的元件之间需要导线进行联接,由于在高
频状态下要求导线越细越短越好,这样才能减小导线分布电容等杂散
干扰以保证CPU运算正确。因此制造工艺的限制,是CPU主频发展的
最大障碍之一。
什么是总线?
微机中总线一般有内部总线、系统总线和外部总线。内部总线是微机
内部各外围芯片与处理器之间的总线,用于芯片一级的互连;而系统
总线是微机中各插件板与系统板之间的总线,用于插件板一级的互
连;外部总线则是微机和外部设备之间的总线,微机作为一种设备,
通过该总线和其他设备进行信息与数据交换,它用于设备一级的互
连。
什么是前端总线:“前端总线”这个名称是由AMD在推出K7CPU时
提出的概念,但是一直以来都被大家误认为这个名词不过是外频的另
一个名称。我们所说的外频指的是CPU与主板连接的速度,这个概念
是建立在数字脉冲信号震荡速度基础之上的,而前端总线的速度指的
是数据传输的速度,由于数据传输最大带宽取决于所有同时传输的数
据的宽度和传输频率,即数据带宽=(总线频率×数据位宽)÷8。
目前PC机上所能达到的前端总线频率有266MHz、333MHz、400MHz、
533MHz、800MHz、1066MHz、1333MHz几种,前端总线频率越大,代
表着CPU与内存之间的数据传输量越大,更能充分发挥出CPU的功能。
现在的CPU技术发展很快,运算速度提高很快,而足够大的前端总线
可以保障有足够的数据供给给CPU。较低的前端总线将无法供给足够
的数据给CPU,这样就限制了CPU性能得发挥,成为系统瓶颈。
前端总线的英文名字是FrontSideBus,通常用FSB表示,是将CPU
连接到北桥芯片的总线。选购主板和CPU时,要注意两者搭配问题,
一般来说,如果CPU不超频,那么前端总线是由CPU决定的,如果主
板不支持CPU所需要的前端总线,系统就无法工作。也就是说,需要
主板和CPU都支持某个前端总线,系统才能工作,只不过一个CPU默
认的前端总线是唯一的,因此看一个系统的前端总线主要看CPU就可
以。
北桥芯片负责联系内存、显卡等数据吞吐量最大的部件,并和南桥芯
片连接。CPU就是通过前端总线(FSB)连接到北桥芯片,进而通过
北桥芯片和内存、显卡交换数据。前端总线是CPU和外界交换数据的
最主要通道,因此前端总线的数据传输能力对计算机整体性能作用很
大,如果没足够快的前端总线,再强的CPU也不能明显提高计算机整
体速度。数据传输最大带宽取决于所有同时传输的数据的宽度和传输
频率,即数据带宽=(总线频率×数据位宽)÷8。目前PC机上所能
达到的前端总线频率有266MHz、333MHz、400MHz、533MHz、800MHz
几种,前端总线频率越大,代表着CPU与北桥芯片之间的数据传输能
力越大,更能充分发挥出CPU的功能。现在的CPU技术发展很快,运
算速度提高很快,而足够大的前端总线可以保障有足够的数据供给给
CPU,较低的前端总线将无法供给足够的数据给CPU,这样就限制了
CPU性能得发挥,成为系统瓶颈。显然同等条件下,前端总线越快,
系统性能越好。
外频与前端总线频率的区别:前端总线的速度指的是数据传输的速
度,外频是CPU与主板之间同步运行的速度。也就是说,100MHz外
频特指数字脉冲信号在每秒钟震荡一千万次;而100MHz前端总线指
的是每秒钟CPU可接受的数据传输量是
100MHz×64bit=6400Mbit/s=800MByte/s(1Byte=8bit)。
二级缓存
CPU缓存(CacheMemoney)位于CPU与内存之间的临时存储器,它
的容量比内存小但交换速度快。在缓存中的数据是内存中的一小部
分,但这一小部分是短时间内CPU即将访问的,当CPU调用大量数据
时,就可避开内存直接从缓存中调用,从而加快读取速度。由此可见,
在CPU中加入缓存是一种高效的解决方案,这样整个内存储器(缓存
+内存)就变成了既有缓存的高速度,又有内存的大容量的存储系统
了。缓存对CPU的性能影响很大,主要是因为CPU的数据交换顺序和
CPU与缓存间的带宽引起的。
缓存的工作原理是当CPU要读取一个数据时,首先从缓存中查
找,如果找到就立即读取并送给CPU处理;如果没有找到,就用相对
慢的速度从内存中读取并送给CPU处理,同时把这个数据所在的数据
块调入缓存中,可以使得以后对整块数据的读取都从缓存中进行,不
必再调用内存。
正是这样的读取机制使CPU读取缓存的命中率非常高(大多数
CPU可达90%左右),也就是说CPU下一次要读取的数据90%都在缓
存中,只有大约10%需要从内存读取。这大大节省了CPU直接读取内
存的时间,也使CPU读取数据时基本无需等待。总的来说,CPU读取
数据的顺序是先缓存后内存。
最早先的CPU缓存是个整体的,而且容量很低,英特尔公司从
Pentium时代开始把缓存进行了分类。当时集成在CPU内核中的缓存
已不足以满足CPU的需求,而制造工艺上的限制又不能大幅度提高缓
存的容量。因此出现了集成在与CPU同一块电路板上或主板上的缓
存,此时就把CPU内核集成的缓存称为一级缓存,而外部的称为二
级缓存。一级缓存中还分数据缓存(I-Cache)和指令缓存(D-Cache)。
二者分别用来存放数据和执行这些数据的指令,而且两者可以同时被
CPU访问,减少了争用Cache所造成的冲突,提高了处理器效能。英
特尔公司在推出Pentium4处理器时,还新增了一种一级追踪缓存,
容量为12KB.
随着CPU制造工艺的发展,二级缓存也能轻易的集成在CPU内核
中,容量也在逐年提升。现在再用集成在CPU内部与否来定义一、二
级缓存,已不确切。而且随着二级缓存被集成入CPU内核中,以往二
级缓存与CPU大差距分频的情况也被改变,此时其以相同于主频的速
度工作,可以为CPU提供更高的传输速度。
二级缓存是CPU性能表现的关键之一,在CPU核心不变化的情况
下,增加二级缓存容量能使性能大幅度提高。而同一核心的CPU高低
端之分往往也是在二级缓存上有差异,由此可见二级缓存对于CPU的
重要性。
CPU在缓存中找到有用的数据被称为命中,当缓存中没有CPU所
需的数据时(这时称为未命中),CPU才访问内存。从理论上讲,在
一颗拥有二级缓存的CPU中,读取一级缓存的命中率为80%。也就是
说CPU一级缓存中找到的有用数据占数据总量的80%,剩下的20%从
二级缓存中读取。由于不能准确预测将要执行的数据,读取二级缓存
的命中率也在80%左右(从二级缓存读到有用的数据占总数据的
16%)。那么还有的数据就不得不从内存调用,但这已经是一个相当
小的比例了。目前的较高端的CPU中,还会带有三级缓存,它是为读
取二级缓存后未命中的数据设计的—种缓存,在拥有三级缓存的CPU
中,只有约5%的数据需要从内存中调用,这进一步提高了CPU的效
率。
为了保证CPU访问时有较高的命中率,缓存中的内容应该按一定
的算法替换。一种较常用的算法是“最近最少使用算法”(LRU算法),
它是将最近一段时间内最少被访问过的行淘汰出局。因此需要为每行
设置一个计数器,LRU算法是把命中行的计数器清零,其他各行计数
器加1。当需要替换时淘汰行计数器计数值最大的数据行出局。这是
一种高效、科学的算法,其计数器清零过程可以把一些频繁调用后再
不需要的数据淘汰出缓存,提高缓存的利用率。
CPU产品中,一级缓存的容量基本在4KB到18KB之间,二级缓
存的容量则分为128KB、256KB、512KB、1MB等。一级缓存容量各产
品之间相差不大,而二级缓存容量则是提高CPU性能的关键。二级缓
存容量的提升是由CPU制造工艺所决定的,容量增大必然导致CPU内
部晶体管数的增加,要在有限的CPU面积上集成更大的缓存,对制造
工艺的要求也就越高。
双核心CPU的二级缓存比较特殊,和以前的单核心CPU相比,最
重要的就是两个内核的缓存所保存的数据要保持一致,否则就会出现
错误,为了解决这个问题不同的CPU使用了不同的办法:
Intel双核心处理器的二级缓存
目前Intel的双核心CPU主要有PentiumD、PentiumEE、Core
Duo三种,其中PentiumD、PentiumEE的二级缓存方式完全相同。
PentiumD和PentiumEE的二级缓存都是CPU内部两个内核具有互
相独立的二级缓存,其中,8xx系列的Smithfield核心CPU为每核
心1MB,而9xx系列的Presler核心CPU为每核心2MB。这种CPU内
部的两个内核之间的缓存数据同步是依靠位于主板北桥芯片上的仲
裁单元通过前端总线在两个核心之间传输来实现的,所以其数据延迟
问题比较严重,性能并不尽如人意。
CoreDuo使用的核心为Yonah,它的二级缓存则是两个核心共享
2MB的二级缓存,共享式的二级缓存配合Intel的“Smartcache”
共享缓存技术,实现了真正意义上的缓存数据同步,大幅度降低了数
据延迟,减少了对前端总线的占用,性能表现不错,是目前双核心处
理器上最先进的二级缓存架构。今后Intel的双核心处理器的二级缓
存都会采用这种两个内核共享二级缓存的“Smartcache”共享缓存
技术。
AMD双核心处理器的二级缓存
Athlon64X2CPU的核心主要有Manchester和Toledo两种,
他们的二级缓存都是CPU内部两个内核具有互相独立的二级缓存,其
中,Manchester核心为每核心512KB,而Toledo核心为每核心1MB。
处理器内部的两个内核之间的缓存数据同步是依靠CPU内置的
SystemRequestInterface(系统请求接口,SRI)控制,传输在CPU
内部即可实现。这样一来,不但CPU资源占用很小,而且不必占用内
存总线资源,数据延迟也比Intel的Smithfield核心和Presler核
心大为减少,协作效率明显胜过这两种核心。不过,由于这种方式仍
然是两个内核的缓存相互独立,从架构上来看也明显不如以Yonah核
心为代表的Intel的共享缓存技术SmartCache。
CPU封装技术
所谓“CPU封装技术”是一种将集成电路用绝缘的塑料或陶瓷材
料打包的技术。以CPU为例,我们实际看到的体积和外观并不是真正
的CPU内核的大小和面貌,而是CPU内核等元件经过封装后的产品。
CPU封装对于芯片来说是必须的,也是至关重要的。因为芯片必
须与外界隔离,以防止空气中的杂质对芯片电路的腐蚀而造成电气性
能下降。另一方面,封装后的芯片也更便于安装和运输。由于封装技
术的好坏还直接影响到芯片自身性能的发挥和与之连接的PCB(印制
电路板)的设计和制造,因此它是至关重要的。封装也可以说是指安
装半导体集成电路芯片用的外壳,它不仅起着安放、固定、密封、保
护芯片和增强导热性能的作用,而且还是沟通芯片内部世界与外部电
路的桥梁——芯片上的接点用导线连接到封装外壳的引脚上,这些引
脚又通过印刷电路板上的导线与其他器件建立连接。因此,对于很多
集成电路产品而言,封装技术都是非常关键的一环。
目前采用的CPU封装多是用绝缘的塑料或陶瓷材料包装起来,能
起着密封和提高芯片电热性能的作用。由于现在处理器芯片的内频越
来越高,功能越来越强,引脚数越来越多,封装的外形也不断在改变。
封装时主要考虑的因素:
芯片面积与封装面积之比为提高封装效率,尽量接近1:1
引脚要尽量短以减少延迟,引脚间的距离尽量远,以保证互不干扰,
提高性能
基于散热的要求,封装越薄越好
作为计算机的重要组成部分,CPU的性能直接影响计算机的整体
性能。而CPU制造工艺的最后一步也是最关键一步就是CPU的封装技
术,采用不同封装技术的CPU,在性能上存在较大差距。只有高品质
的封装技术才能生产出完美的CPU产品。
CPU芯片的封装技术:
DIP封装
DIP封装(DualIn-linePackage),也叫双列直插式封装技术,
指采用双列直插形式封装的集成电路芯片,绝大多数中小规模集成电
路均采用这种封装形式,其引脚数一般不超过100。DIP封装的CPU
芯片有两排引脚,需要插入到具有DIP结构的芯片插座上。当然,也
可以直接插在有相同焊孔数和几何排列的电路板上进行焊接。DIP封
装的芯片在从芯片插座上插拔时应特别小心,以免损坏管脚。DIP封
装结构形式有:多层陶瓷双列直插式DIP,单层陶瓷双列直插式DIP,
引线框架式DIP(含玻璃陶瓷封接式,塑料包封结构式,陶瓷低熔玻
璃封装式)等。
DIP封装具有以下特点:
1.适合在PCB(印刷电路板)上穿孔焊接,操作方便。
2.芯片面积与封装面积之间的比值较大,故体积也较大。
最早的4004、8008、8086、8088等CPU都采用了DIP封装,通
过其上的两排引脚可插到主板上的插槽或焊接在主板上。
QFP封装
这种技术的中文含义叫方型扁平式封装技术(PlasticQuadFlat
Pockage),该技术实现的CPU芯片引脚之间距离很小,管脚很细,
一般大规模或超大规模集成电路采用这种封装形式,其引脚数一般都
在100以上。该技术封装CPU时操作方便,可靠性高;而且其封装外
形尺寸较小,寄生参数减小,适合高频应用;该技术主要适合用SMT
表面安装技术在PCB上安装布线。
QFP封装
这种技术的中文含义叫方型扁平式封装技术(PlasticQuadFlat
Pockage),该技术实现的CPU芯片引脚之间距离很小,管脚很细,
一般大规模或超大规模集成电路采用这种封装形式,其引脚数一般都
在100以上。该技术封装CPU时操作方便,可靠性高;而且其封装外
形尺寸较小,寄生参数减小,适合高频应用;该技术主要适合用SMT
表面安装技术在PCB上安装布线。
PFP封装
该技术的英文全称为PlasticFlatPackage,中文含义为塑料
扁平组件式封装。用这种技术封装的芯片同样也必须采用SMD技术将
芯片与主板焊接起来。采用SMD安装的芯片不必在主板上打孔,一般
在主板表面上有设计好的相应管脚的焊盘。将芯片各脚对准相应的焊
盘,即可实现与主板的焊接。用这种方法焊上去的芯片,如果不用专
用工具是很难拆卸下来的。该技术与上面的QFP技术基本相似,只是
外观的封装形状不同而已。
PGA封装
该技术也叫插针网格阵列封装技术(CeramicPinGridArrau
Package),由这种技术封装的芯片内外有多个方阵形的插针,每个
方阵形插针沿芯片的四周间隔一定距离排列,根据管脚数目的多少,
可以围成2~5圈。安装时,将芯片插入专门的PGA插座。为了使得
CPU能够更方便的安装和拆卸,从486芯片开始,出现了一种ZIFCPU
插座,专门用来满足PGA封装的CPU在安装和拆卸上的要求。该技术
一般用于插拔操作比较频繁的场合之下。
BGA封装
BGA技术(BallGridArrayPackage)即球栅阵列封装技术。
该技术的出现便成为CPU、主板南、北桥芯片等高密度、高性能、多
引脚封装的最佳选择。但BGA封装占用基板的面积比较大。虽然该技
术的I/O引脚数增多,但引脚之间的距离远大于QFP,从而提高了组
装成品率。而且该技术采用了可控塌陷芯片法焊接,从而可以改善它
的电热性能。另外该技术的组装可用共面焊接,从而能大大提高封装
的可靠性;并且由该技术实现的封装CPU信号传输延迟小,适应频率
可以提高很大。
BGA封装具有以下特点:
1.I/O引脚数虽然增多,但引脚之间的距离远大于QFP封装方式,提
高了成品率
2.虽然BGA的功耗增加,但由于采用的是可控塌陷芯片法焊接,从而
可以改善电热性能
3.信号传输延迟小,适应频率大大提高
4.组装可用共面焊接,可靠性大大提高
目前较为常见的封装形式:
OPGA封装
OPGA(OrganicpingridArray,有机管脚阵列)。这种封装的
基底使用的是玻璃纤维,类似印刷电路板上的材料。此种封装方式
可以降低阻抗和封装成本。OPGA封装拉近了外部电容和处理器内核
的距离,可以更好地改善内核供电和过滤电流杂波。AMD公司的
AthlonXP系列CPU大多使用此类封装。
mPGA封装
mPGA,微型PGA封装,目前只有AMD公司的Athlon64和英特尔
公司的Xeon(至强)系列CPU等少数产品所采用,而且多是些高端
产品,是种先进的封装形式。
CPGA封装
CPGA也就是常说的陶瓷封装,全称为CeramicPGA。主要在
Thunderbird(雷鸟)核心和“Palomino”核心的Athlon处理器上采
用。
FC-PGA封装
FC-PGA封装是反转芯片针脚栅格阵列的缩写,这种封装中有
针脚插入插座。这些芯片被反转,以至片模或构成计算机芯片的处理
器部分被暴露在处理器的上部。通过将片模暴露出来,使热量解决方
案可直接用到片模上,这样就能实现更有效的芯片冷却。为了通过隔
绝电源信号和接地信号来提高封装的性能,FC-PGA处理器在处理器
的底部的电容放置区域(处理器中心)安有离散电容和电阻。芯片底
部的针脚是锯齿形排列的。此外,针脚的安排方式使得处理器只能以
一种方式插入插座。FC-PGA封装用于奔腾III和英特尔赛扬处理
器,它们都使用370针。
FC-PGA2封装
FC-PGA2封装与FC-PGA封装类型很相似,除了这些处理器还具
有集成式散热器(IHS)。集成式散热器是在生产时直接安装到处理器
片上的。由于IHS与片模有很好的热接触并且提供了更大的表面积
以更好地发散热量,所以它显著地增加了热传导。FC-PGA2封装用于
奔腾III和英特尔赛扬处理器(370针)和奔腾4处理器(478针)。
OOI封装
OOI是OLGA的简写。OLGA代表了基板栅格阵列。OLGA芯片也
使用反转芯片设计,其中处理器朝下附在基体上,实现更好的信号完
整性、更有效的散热和更低的自感应。OOI有一个集成式导热器
(IHS),能帮助散热器将热量传给正确安装的风扇散热器。OOI用于
奔腾4处理器,这些处理器有423针。
PPGA封装
“PPGA”的英文全称为“PlasticPinGridArray”,是塑针栅格
阵列的缩写,这些处理器具有插入插座的针脚。为了提高热传导性,
PPGA在处理器的顶部使用了镀镍铜质散热器。芯片底部的针脚是锯
齿形排列的。此外,针脚的安排方式使得处理器只能以一种方式插入
插座。
S.E.C.C.封装
“S.E.C.C.”是“SingleEdgeContactCartridge”缩写,是
单边接触卡盒的缩写。为了与主板连接,处理器被插入一个插槽。它
不使用针脚,而是使用“金手指”触点,处理器使用这些触点来传递
信号。S.E.C.C.被一个金属壳覆盖,这个壳覆盖了整个卡盒组件的
顶端。卡盒的背面是一个热材料镀层,充当了散热器。S.E.C.C.内
部,大多数处理器有一个被称为基体的印刷电路板连接起处理器、二
级高速缓存和总线终止电路。S.E.C.C.封装用于有242个触点的英
特尔奔腾II处理器和有330个触点的奔腾II至强和奔腾III至
强处理器。
S.E.C.C.2封装
S.E.C.C.2封装与S.E.C.C.封装相似,除了S.E.C.C.2使
用更少的保护性包装并且不含有导热镀层。S.E.C.C.2封装用于一些
较晚版本的奔腾II处理器和奔腾III处理器(242触点)。
S.E.P.封装
“S.E.P.”是“SingleEdgeProcessor”的缩写,是单边处理器
的缩写。“S.E.P.”封装类似于“S.E.C.C.”或者“S.E.C.C.2”封
装,也是采用单边插入到Slot插槽中,以金手指与插槽接触,但是
它没有全包装外壳,底板电路从处理器底部是可见的。“S.E.P.”封
装应用于早期的242根金手指的IntelCeleron处理器。
PLGA封装
PLGA是PlasticLandGridArray的缩写,即塑料焊盘栅格阵
列封装。由于没有使用针脚,而是使用了细小的点式接口,所以PLGA
封装明显比以前的FC-PGA2等封装具有更小的体积、更少的信号传输
损失和更低的生产成本,可以有效提升处理器的信号强度、提升处理
器频率,同时也可以提高处理器生产的良品率、降低生产成本。目前
Intel公司Socket775接口的CPU采用了此封装。
CuPGA封装CuPGA是LiddedCeramicPackageGridArray的缩
写,即有盖陶瓷栅格阵列封装。其与普通陶瓷封装最大的区别是增加
了一个顶盖,能提供更好的散热性能以及能保护CPU核心免受损坏。
目前AMD64系列CPU采用了此封装。“CPU适用类型”是指该处理器
所适用的应用类型,针对不同用户的不同需求、不同应用范围,CPU
被设计成各不相同的类型,即分为嵌入式和通用式、微控制式。嵌入
式CPU主要用于运行面向特定领域的专用程序,配备轻量级操作系
统,其应用极其广泛,像移动电话、DVD、机顶盒等都是使用嵌入式
CPU。微控制式CPU主要用于汽车空调、自动机械等自控设备领域。
而通用式CPU追求高性能,主要用于高性能个人计算机系统(即PC
台式机)、服务器(工作站)以及笔记本三种。
台式机的CPU,就是平常大部分场合所提到的应用于PC的CPU,
平常所说Intel的奔腾4、赛扬、AMD的AthlonXP等等都属于此类
CPU。
应用于服务器和工作站上的CPU,因其针对的应用范围,所以此
类CPU在稳定性、处理速度、同时处理任务的数量等方面的要求都要
高于单机CPU。其中服务器(工作站)CPU的高可靠性是普通CPU所
无法比拟的,因为大多数的服务器都要满足每天24小时、每周7天
的满符合工作要求。由于服务器(工作站)数据处理量很大,需要采
用多CPU并行处理结构,即一台服务器中安装2、4、8等多个CPU,
需要注意的是,并行结构需要的CPU必须为偶数个。对于服务器而言,
多处理器可用于数据库处理等高负荷高速度应用;而对于工作站,多
处理器系统则可以用于三维图形制作和动画文件编码等单处理器无
法实现的高处理速度应用。另外许多CPU的新技术都是率先开发应用
于服务器(工作站)CPU中。
在最早期的CPU设计中并没有单独的笔记本CPU,均采用与台式
机的CPU,后来随着笔记本电脑的散热和体积成为发展的瓶颈时,才
逐渐生产出笔记本专用CPU。受笔记本内部空间、散热和电池容量的
限制,笔记本CPU在外观尺寸、功耗(耗电量)方面都有很高的要求。
笔记本电池性能是十分重要的性能,CPU的功耗大小对电池使用时间
有着最直接的影响,所以为了降低功耗笔记本处理器中都包含有一些
节能技术。在无线网络将要获得更多应用的现在,笔记本CPU还增加
了一些定制的针对无线通信的功能。
服务器CPU和笔记本CPU都包含有各自独特的专有技术,都是为
了更好的在各自的工作条件下发挥出更好的性能。比如服务器的多
CPU并行处理,以及多核多线程技术;笔记本CPU的SpeedStep(可
自动调整工作频率及电压)节能技术。
封装方式三者也有不同之处,笔记本CPU是三者中最小最薄的一
种,因为笔记本处理器的体积需要更小,耐高温的性能要更佳,因此
在制造工艺上要求也就更高。
三者在稳定性中以服务器CPU最强,因为其设计时就要求有极低
的错误率,部分产品甚至要求全年满负荷工作,故障时间不能超过5
分钟。
台式机CPU工作电压和功耗都高于笔记本CPU,通常台式机CPU
的测试温度上限为75摄氏度,超过75摄氏度,工作就会不稳定,甚
至出现问题;;而笔记本CPU的测试温度上限为100摄氏度;服务器
CPU需要长时间的稳定工作,在散热方面的要求就更高了。
在选购整机尤其是有特定功能的计算机(如笔记本、服务器等)
时,需要注意CPU的适用类型,选用不适合的CPU类型,一方面会影
响整机的系统性能,另一方面会加大计算机的维护成本。单独选购
CPU时候也要注意CPU的适用类型,建议按照具体应用的需求来购买
CPU。
倍频
CPU的倍频,全称是倍频系数。CPU的核心工作频率与外频之间存在
着一个比值关系,这个比值就是倍频系数,简称倍频。理论上倍频是
从1.5一直到无限的,但需要注意的是,倍频是以以0.5为一个间隔
单位。外频与倍频相乘就是主频,所以其中任何一项提高都可以使
CPU的主频上升。
原先并没有倍频概念,CPU的主频和系统总线的速度是一样的,
但CPU的速度越来越快,倍频技术也就应允而生。它可使系统总线工
作在相对较低的频率上,而CPU速度可以通过倍频来无限提升。那么
CPU主频的计算方式变为:主频=外频x倍频。也就是倍频是指CPU
和系统总线之间相差的倍数,当外频不变时,提高倍频,CPU主频也
就越高。
多媒体指令集
CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列
与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,
指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系
结构讲,指令集可分为复杂指令集和精简指令集两部分,而从具体运
用看,如Intel的MMX(MultiMediaExtended)、SSE、SSE2
(Streaming-Singleinstructionmultipledata-Extensions2)
和AMD的3DNow!等都是CPU的扩展指令集,分别增强了CPU的多媒
体、图形图象和Internet等的处理能力。我们通常会把CPU的扩展
指令集称为"CPU的指令集"。
1、精简指令集的运用
在最初发明计算机的数十年里,随着计算机功能日趋增大,性能
日趋变强,内部元器件也越来越多,指令集日趋复杂,过于冗杂的指
令严重的影响了计算机的工作效率。后来经过研究发现,在计算机中,
80%程序只用到了20%的指令集,基于这一发现,RISC精简指令集
被提了出来,这是计算机系统架构的一次深刻革命。RISC体系结构
的基本思路是:抓住CISC指令系统指令种类太多、指令格式不规范、
寻址方式太多的缺点,通过减少指令种类、规范指令格式和简化寻址
方式,方便处理器内部的并行处理,提高VLSI器件的使用效率,从
而大幅度地提高处理器的性能。
RISC指令集有许多特征,其中最重要的有:
指令种类少,指令格式规范:RISC指令集通常只使用一种或少数几
种格式。指令长度单一(一般4个字节),并且在字边界上对齐,字
段位置、特别是操作码的位置是固定的。
寻址方式简化:几乎所有指令都使用寄存器寻址方式,寻址方式总数
一般不超过5个。其他更为复杂的寻址方式,如间接寻址等则由软件
利用简单的寻址方式来合成。
大量利用寄存器间操作:RISC指令集中大多数操作都是寄存器到寄
存器操作,只以简单的Load和Store操作访问内存。因此,每条指
令中访问的内存地址不会超过1个,访问内存的操作不会与算术操作
混在一起。
简化处理器结构:使用RISC指令集,可以大大简化处理器的控制器
和其他功能单元的设计,不必使用大量专用寄存器,特别是允许以硬
件线路来实现指令操作,而不必像CISC处理器那样使用微程序来实
现指令操作。因此RISC处理器不必像CISC处理器那样设置微程序控
制存储器,就能够快速地直接执行指令。
便于使用VLSI技术:随着LSI和VLSI技术的发展,整个处理器(甚
至多个处理器)都可以放在一个芯片上。RISC体系结构可以给设计
单芯片处理器带来很多好处,有利于提高性能,简化VLSI芯片的设
计和实现。基于VLSI技术,制造RISC处理器要比CISC处理器工作
量小得多,成本也低得多。
加强了处理器并行能力:RISC指令集能够非常有效地适合于采用流
水线、超流水线和超标量技术,从而实现指令级并行操作,提高处理
器的性能。目前常用的处理器内部并行操作技术基本上是基于RISC
体系结构发展和走向成熟的。
正由于RISC体系所具有的优势,它在高端系统得到了广泛的应
用,而CISC体系则在桌面系统中占据统治地位。而在如今,在桌面
领域,RISC也不断渗透,预计未来,RISC将要一统江湖。
2、CPU的扩展指令集
对于CPU来说,在基本功能方面,它们的差别并不太大,基本的
指令集也都差不多,但是许多厂家为了提升某一方面性能,又开发了
扩展指令集,扩展指令集定义了新的数据和指令,能够大大提高某方
面数据处理能力,但必需要有软件支持。
MMX指令集
MMX(MultiMediaeXtension,多媒体扩展指令集)指令集是
Intel公司于1996年推出的一项多媒体指令增强技术。MMX指令集中
包括有57条多媒体指令,通过这些指令可以一次处理多个数据,在
处理结果超过实际处理能力的时候也能进行正常处理,这样在软件的
配合下,就可以得到更高的性能。MMX的益处在于,当时存在的操作
系统不必为此而做出任何修改便可以轻松地执行MMX程序。但是,问
题也比较明显,那就是MMX指令集与x87浮点运算指令不能够同时执
行,必须做密集式的交错切换才可以正常执行,这种情况就势必造成
整个系统运行质量的下降。
SSE指令集
SSE(StreamingSIMDExtensions,单指令多数据流扩展)指令
集是Intel在PentiumIII处理器中率先推出的。其实,早在PIII
正式推出之前,Intel公司就曾经通过各种渠道公布过所谓的KNI
(KatmaiNewInstruction)指令集,这个指令集也就是SSE指令集
的前身,并一度被很多传媒称之为MMX指令集的下一个版本,即MMX2
指令集。究其背景,原来"KNI"指令集是Intel公司最早为其下一代
芯片命名的指令集名称,而所谓的"MMX2"则完全是硬件评论家们和媒
体凭感觉和印象对"KNI"的评价,Intel公司从未正式发布过关于
MMX2的消息。
而最终推出的SSE指令集也就是所谓胜出的"互联网SSE"指令
集。SSE指令集包括了70条指令,其中包含提高3D图形运算效率的
50条SIMD(单指令多数据技术)浮点运算指令、12条MMX整数运算
增强指令、8条优化内存中连续数据块传输指令。理论上这些指令对
目前流行的图像处理、浮点运算、3D运算、视频处理、音频处理等
诸多多媒体应用起到全面强化的作用。SSE指令与3DNow!指令彼此互
不兼容,但SSE包含了3DNow!技术的绝大部分功能,只是实现的方
法不同。SSE兼容MMX指令,它可以通过SIMD和单时钟周期并行处
理多个浮点数据来有效地提高浮点运算速度。
SSE2指令集
SSE2(StreamingSIMDExtensions2,Intel官方称为SIMD流
技术扩展2或数据流单指令多数据扩展指令集2)指令集是Intel公
司在SSE指令集的基础上发展起来的。相比于SSE,SSE2使用了144
个新增指令,扩展了MMX技术和SSE技术,这些指令提高了广大应用
程序的运行性能。随MMX技术引进的SIMD整数指令从64位扩展到了
128位,使SIMD整数类型操作的有效执行率成倍提高。双倍精度浮
点SIMD指令允许以SIMD格式同时执行两个浮点操作,提供双倍精
度操作支持有助于加速内容创建、财务、工程和科学应用。除SSE2
指令之外,最初的SSE指令也得到增强,通过支持多种数据类型(例
如,双字和四字)的算术运算,支持灵活并且动态范围更广的计算功
能。SSE2指令可让软件开发员极其灵活的实施算法,并在运行诸如
MPEG-2、MP3、3D图形等之类的软件时增强性能。Intel是从
Willamette核心的Pentium4开始支持SSE2指令集的,而AMD则是
从K8架构的SledgeHammer核心的Opteron开始才支持SSE2指令集
的。
SSE3指令集
SSE3(StreamingSIMDExtensions3,Intel官方称为SIMD流
技术扩展3或数据流单指令多数据扩展指令集3)指令集是Intel公
司在SSE2指令集的基础上发展起来的。相比于SSE2,SSE3在SSE2
的基础上又增加了13个额外的SIMD指令。SSE3中13个新指令的主
要目的是改进线程同步和特定应用程序领域,例如媒体和游戏。这些
新增指令强化了处理器在浮点转换至整数、复杂算法、视频编码、SIMD
浮点寄存器操作以及线程同步等五个方面的表现,最终达到提升多媒
体和游戏性能的目的。Intel是从Prescott核心的Pentium4开始
支持SSE3指令集的,而AMD则是从2005年下半年Troy核心的Opteron
开始才支持SSE3的。但是需要注意的是,AMD所支持的SSE3与Intel
的SSE3并不完全相同,主要是删除了针对Intel超线程技术优化的
部分指令。
3DNow!(3Dnowaiting)指令集
3DNow!是AMD公司开发的SIMD指令集,可以增强浮点和多媒体
运算的速度,并被AMD广泛应用于其K6-2、K6-3以及Athlon(K7)
处理器上。3DNow!指令集技术其实就是21条机器码的扩展指令集。
与Intel公司的MMX技术侧重于整数运算有所不同,3DNow!指令
集主要针对三维建模、坐标变换和效果渲染等三维应用场合,在软
件的配合下,可以大幅度提高3D处理性能。后来在Athlon上开发了
Enhanced3DNow!。这些AMD标准的SIMD指令和Intel的SSE具有相
同效能。因为受到Intel在商业上以及PentiumIII成功的影响,软
件在支持SSE上比起3DNow!更为普遍。Enhanced3DNow!AMD公司继
续增加至52个指令,包含了一些SSE码,因而在针对SSE做最佳化
的软件中能获得更好的效能。
本文发布于:2023-02-28 09:55:42,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/167754934279467.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:cpu的主频.doc
本文 PDF 下载地址:cpu的主频.pdf
留言与评论(共有 0 条评论) |