正在阅读:芯片辉煌的背后 多年来服务器领域的坚持芯片辉煌的背后 多年来服务器领域的坚持

2012-03-19 00:16 出处:PConline原创 作者:Echo 责任编辑:xujian1
1Pentium PRO处理器回顶部

  【PConline资讯】英特尔E5服务器处理器的发布让英特尔这一在服务器处理器领域占据半壁江山的系列产品再次聚集了世界的目光,而正如罗马不是一夕建成的一样,在现在芯片辉煌的背后,这一品牌的塑造也经历漫长的过程。

  在早期的服务器领域,RISC构架处理器一统天下,这种架构的代表性产品有IBM的Power系列处理器、Sun公司的SPARC和UltraSparc处理器以及惠普的PA-RISC以后被惠普收购的康柏旗下的Alpha处理器等,这类型处理器的共同特点是性能高、稳定性好,但却有一个很大的缺陷,那就是成本太高,因此早期的服务器都是比较高端,很难普及,这也在一定程度上限定了服务器市场的发展。而这一切,后来都随着Intel推出IA架构的X86处理器而逐渐改变,而Intel IA架构的X86处理器也就是我们今天要介绍的Xeon系列处理器。

  Xeon系列处理器的出现可以说重塑了服务器市场,随着PC服务器性能的逐渐增强,现在的服务器市场上X86处理器已经占据了超过50%的市场份额,原本站统治地位的RISC处理器现在只占据着较为高端的UNIX服务器市场,而随着X86处理器性能的不断增强,RISC处理器的生存空间仍在不断地经受着挤压,而在X86市场中,Intel的Xeon系列处理器占据了90%左右的份额。今天,就让我们翻开历史的书页,再次回顾Xeon一路走来的历程。

  1、Pentium PRO处理器

  Intel在1995年推出了自己第一款面向服务器和工作站的处理器产品——Pentium PRO。当时的命名规则沿用了Intel在台式机处理器方面的风格,这款产品是在Pentium(中文名:奔腾) MMX的基础上推出的,但在产品外形和接口上都有所变化。

英特尔至强处理器
Pentium PRO处理器

  Pentium PRO是英特尔第一个应用于位32位(当时还是以16位程序为主)服务器、工作站设计的处理器,不过当时的名称并不是XEON,算得上是XEON的前生,它可以应用在高速辅助设计、机械引擎、科学计算等领域。不过英特尔在Pentium PRO的设计与制造工艺上又达到了新的高度,总共集成了550万个晶体管,并且整合了更高速二级缓存,更均衡的体系架构,更可以通过多路并行计算来提升整体计算性能。

英特尔至强处理器
Pentium PRO核心

  Pentium Pro透露出英特尔对服务器市场的高瞻远瞩,不过作为服务器和工作站CPU的开路先锋,还是有很多值得商榷和改进的地方。最有趣的一件事情是,Pentium Pro运行16位程序的效果还不及同频率Pentium的水平;当然这也不能怪intel,这跟我们现在运行winXP和VISTA是一样的道理,软件的兼容性也很重要。只是在当时16位程序数量还很多,32位软件还为形成当时的主流。>>

-----------------------------------------------------------------------------

如果您什么服务器问题,请点击以下链接,进入PConline 服务器论坛:
//itbbs.pconline.com.cn/network/f252.html

-----------------------------------------------------------------------------

2PentiumII XEON处理器回顶部

  2、PentiumII  XEON处理器

  三年之后,也就是1998年,Intel在奔腾pro的基础上,升级到了奔腾II  XEON,这是一个全新的开端,XEON是一个intel全新的名词也是一个全新的开端,当然它是由奔腾II 处理器而来,Pentium II XEOn主要面对中高端企业级服务器、工作站市场;这是英特尔公司进一步区格市场的重要步骤。Xeon主要设计来运行商业软件、因特网服务、公司数据储存、数据归类、数据库、电子,机械的自动化设计等。

英特尔至强处理器
奔腾II  XEON

  Pentium II Xeon处理器不但有更快的速度,更大的缓存,更重要的是可以支持多达4路或者8路的SMP对称多CPU处理功能。也就是说,在一个主板上,可以同时并行运算4-8个的CPU,到此,intel完成了桌面CPU和服务器CPU格局的划分,为日后服务器的发展,奠定了基础
 
  当时PII采用的是SLOT 1 架构,而至强平台则采用了SLOT 2 架构,两者并不兼容。进入PentiumIII时代后,服务器的概念更加深入人心,人们为了增强其服务器CPU的强大性能,可以轻松地选择Intel BX芯片组的主板,配合两颗PIII处理器来获得性能的大幅度提升。那时的处理器和芯片组都是支持双路并行处理,也就是SMP(对称多处理器)系统。从这个时候,SMP架构就成了逐渐成为服务器的基本指导思想,不过后来我们通常使用的都是基于双路CPU的服务器体统,多路的由于价格原因,并不常见。>>

3Pentium III Xeon处理器回顶部

  3、Pentium III Xeon处理器

  1999年,英特尔发布了Pentium III Xeon处理器。奔腾3代的时候,核心基本上采用铜矿或者图拉丁,他们的频率一样 ,二级缓存大小也一样,图拉丁P3和铜矿P3外频一样,二级缓存大小相同(都是256K,512K的是P3-S),但是图拉丁P3不支持双路处理器并行工作模式而铜矿P3支持;图拉丁P3的二级缓存延迟时间为1而铜矿P3为0;虽然图拉丁P3在某些方面仍然不如铜矿P3,因此虽然带有先进的数据预读取技术,在主频相近的情况下,也不过是个平手。

英特尔至强处理器
Pentium III Xeon处理器

  P3-S虽然也是采用了图拉丁的核心,但是却具备了铜矿和图拉丁几乎所有优点,并且二级从256M升级到了512M倍,很大的提升了性能,其此性能当然是P3时代的佼佼者,理所当然,做服务器CPU的核心,落在P3—S 的肩上。这就是我们所说的奔腾III XEON,它借用了Pentium III处理器新增的70条指令集,以便更好的执行多媒体、流媒体应用软件,提高了电子商务应用与高阶商务计算的能力。

  除此之外,奔腾III XEON 开始向多元发展,分为高端和底端,并重新为多CPU协同计算进行了设计。不过底端XEOn只用了256M的二级缓存,所以在实际使用的的效果并不理想,也不支持SMP,而高端Xeon还是具有以前的特征,支持更大的缓存和多处理器。>>

4Intel正式发布Xeon处理器回顶部

  4、Intel正式发布Xeon处理器

  2001年5月,intel发布了Xeon处理器。Intel为了将Xeon的品牌概念更加明确话,市场定位更加精准,去掉了一贯使用的的Pentium的名号。 Xeon处理器的市场定位也更加瞄准高性能、均衡负载、高强度科学计算、多路对称处理等特性,而这些是都是台式电脑的Pentium品牌系列所不具备的。

  虽然Xeon处理器还是采用和Pentium 4处理器的一样的Willamette核心(但是在服务器领域,我们却称之为Foster),而且同样是64位的数据带宽,但由于XEON利用了与显卡AGP  4X相同的原理--“四倍速”技术,因此XEOn FSB有了巨大的提升,和Pentium III Xeon处理器相比较,有了30%到90%左右的性能提升。

  这为服务器和工作站提供了强劲的动力,最初发布的Foster核心处理器具有三款:1.4GHz、1.5GHz 和 1.7GHz,都是内置256KB 二级缓存,采用Socket 603接口,支持400MHz总线,而新款的Foster处理器并不是支持多CPU版本,它只能支持单CPU或者双CPU工作。

  同年第四季度,Intel共推出了4款Xeon处理器:列表如下

至强

  4款Xeon处理器分别是2 GHz/2.4/02.66/2.80,前端总线也将从400MHz过渡到533MHz。新推出的Xeon处理器使用的都是0.13微米的制造技术,512KB的L2缓存,并支持双处理器并行操作。这个时期,XEON的产品线还是比较单一的,只有4个。

英特尔至强处理器
Xeon处理器
英特尔至强处理器
Foster核心

  这几款处理器上英特尔使用的是全新的NetBurst架构,具有更高级的网络功能,及更复杂更卓越的3D图形性能,另一方面,支持至强的芯片组也在并行运算、支持高性能I/O子系统(如SCSI磁盘阵列、双千兆网络接口)、PCI总线分段等方面更好地支持服务器端的运算。

  在Intel大力推动P4架构后,更加的细分了CPU市场定位,INTEL在其桌面平台CPU中去掉了SMP的支持,使得Pentium 4在整个系统中只能安装一个物理CPU, 而Xeon的接口也与台式P4完全不同,两者不能混用,并依照支持并行的数量分为支持两路的Xeon DP和支持4路以上的Xeon MP,MP比DP拥有更大的缓存,处理能力也更强。

  Prestonia是Xeon处理器的第二代核心,采用和上一代同样的架构,它同第一代的Foster核心之间的最主要的区别就是增加了对Hyper- Threading(超线程)的支持。二级缓存同为前者为512KB。Prestonia核心处理器也采用了先进的0.13微机制造工艺。Hyperthreading早先称为Jackson技术。Jackson技术能够将同时多线程技术(SMT)加入到CPU核心内部当中来。

  实际上,单CPU的限制之处在于它只能在同一时刻处理一条单线程指令,而SMT技术能够使得CPU在同一时刻能处理更多的指令。如果能够在硬件范围上实现单周期处理多线程数据的话,将大大增加CPU的工作效率(每块处理器可以同时进行多个进程以上的处理)。>>

564位的“Nocona”XEON处理器回顶部

  5、64位的“Nocona”XEON处理器

  2004年6月30日,Intel发布了最先支持IA-32E的处理器—代号为“Nocona”的64位Xeon处理器(即Prescott核心的 Xeon DP ),这是第一个64位至强处理器核心,采用90nm工艺制程,具有800MHz前端总线技术,(比较以前的FSB 533MHz大幅提升),16KB L1缓存、1MB L2缓存和12KB uOps Trace,支持超线程和SEE-3技术。

  CPU起跳频率为2.8GHz,同时还有3GHz、3.2GHz、3.4GHz和3.6GHz型号的产品问世。 Nocona使用604针PPGA封装,与533MHz主频Xeon处理器所用的处理器插座一样,它支持Intel Speedstep技术、Hyperthreading以及Extended Memory 64技术。

至强
“Nocona”64位Xeon处理器

  Nocona引入了一项称为DBS的节电技术。通过DBS,CPU能够在空闲时自动降低处理器的倍频、前端总线频率和电压,这样就降低了机器空闲时浪 费的功耗。与AMD的Opteron不同,Nocona内部仍然没有集成内存控制器,其MCH仍集成在北桥芯片E7525上,这就意味着Nocona在多 路处理时,两颗并行处理器必须共享内存带宽。>>

6双核心的双路处理器Xeon DP回顶部

  6、双核心的双路处理器Xeon DP

  2005年2月,intel正式推出了Irwindale 核心的Xeon产品,前端总线、HyperThreadingII、增强型Speedstep、EDB以及EM64T都和Nocona完全一致。该核心与 Nocona核心最大的不同就是二级缓存进升级到2MB,频率由3.0G开始起跳。不过由于二级缓存的加大,工艺也没得得到改进,导致该处理器的功率和发热量均大大高于Nocona。

至强
Irwindale 核心的Xeon产品

  2005年10月,英特尔凭借自己长久以来在封装技术上的优势,发布了其首枚双核心Xeon DP(Paxville DP)。这款全新的处理器将可以帮助提高多线程服务器应用的性能并缩短响应时间。 Paxville DP是将两颗2MB二级缓存的“Irwindale”至强DP处理器,封装在一颗CPU中。这款全新双核至强处理器拥有2.80 GHz的运行速度和800 MHz系统总线,每个内核独享2 MB二级高速缓存。由于每个内核都配置了高速缓存,所以系统总线上的数据量将大为减少,并使每个内核都可以更快地存取数据。此外,它还采用了英特尔64位内存扩展技术、超线程(HT)技术。

  在2006年以前的服务器和工作站平台处理器,无论是Xeon、Xeon MP还是DP,都是直接采用频率标注的方法。问题是在处理器的核心类型、前端总线频率、二级缓存和三级缓存容量、所支持的特性等等方面都不相同的情况下,只凭借标注的频率根本就无法区分不同型号的处理器。例如Xeon 2.0GHz就有Foster和Prestonia两种核心类型,基于此,intel抛弃了传统的对XEON  以频率来命名的方式,采取了对服务器和工作站平台上采用处理器使用数字编号。>>

7Xeon 5100 全新core架构登场回顶部

  7、Xeon 5100 全新core架构登场

  2006年INTEL发布了2款不同核心的双核至强处理器:除了使用上一代核心的XEON5000系列之外、布了基于最新的“Woodcrest”核心的5100系列。会上INTEL详细阐述了INTEL 双核至强的技术规格。新的双核至强架构和老一代处理器的根本不同之处,使用了全新架构core,到此,intel彻底的放弃了使用多年的NetBurst架构,XEON5100系列立的FSB达到1066而老一代的是共享800MFSB,这样可以使得性能提高2倍到3倍。

  在CPU处理能力越来越强大的今天,共享前端总线越来越难满足CPU的需要,AMD在2年前,就甚至彻底放弃了传统的前端总线架构。INTEL这次,将前端总线的架构做了一次重大的改变,不再像以往那样,通过单纯的提高频率来提高带宽,而是将前端总线和CPU的数目挂钩,每个CPU都可以有自己独立的前端总线,彻底改良了共享前端总线的弊端。

至强
Dempsey 核心Xeon 5000处理器,这是Netburst架构的最后一代产品

  XEON 5000系列系列均为双核心,主频从2.50GHz到3.73GHz,所有处理器采用 65 纳米制造工艺,均支持FB-DIMM内存,英特尔虚拟化技术、超线程(HT)技术、增强型英特尔SpeedStep动态节能技术(其中5063、5060 不支持)、英特尔64位内存扩展技术、英特尔病毒防护技术。这些处理器均配置了4MB L2缓存,其中每个核心独享2MB L2缓存,其前端总线为1066MHz或者667MHz,可以提供8.5GB/s或者5.3GB/s的传输带宽。采用65nm工艺的双核心Xeon Dempsey使用LGA771接口。

woodcrest
Woodcrest Xeon与同期的移动处理器Merom和桌面处理器Conroe均采用Core微架构设计

  Woodcrest采用英特尔先进的65纳米制程技术,加上最优化的Core微架构设计,与前代产品相比,不仅耗电量降低40%,性能则大幅提升135%,在 这个时候提出了一个新的名词:功耗比。所有Woodcrest皆内含4 MB共享型高速二级缓存,功耗方面除5160型号为80瓦以外,其余全部为65瓦;另外,在系统总线 (FSB)上,四款2 GHz及以上频率版本为1333 MHz,其余两款低频版本为1066 MHz。

英特尔至强处理器
Woodcrest核心 

  另有一款低功耗产品XEON 5148 LV,频率为2.33GHz/4MB L2 Cache/1333MHz FSB,但最高功耗只有40W,是正常型号的一半,并完全支持援Intel EM64T、Intel Execute Disable Bit、Intel Virtualization Technology功能及Demand-Based Switching功能。无论是XEON5000,还是XEON5100,都是使用了相同的主板平台,INTEL 5000系列芯片组提供了良好的兼容支持。>>

8完善产品线 Intel推出单路XEON 3000回顶部

  8、完善产品线 Intel推出单路XEON 3000

  由于上代Netburst架构的Xeon处理器无论性能和价格均不及对手AMD Opteron产品,令对手于服务器处理器市占不断上升,尤其是入门级服务器市场更为明显,因此Intel决定Intel为了打压其对手,也看到了底端服务器的巨大市场,9月,发布了单路服务器处理器,冠以全新的名称intel  XEON 3000系列,取代早期的intel7230芯片组所支持的一系列CPU。当然,XEON 3000需要一个全新的主板芯片组那支持,那就是intel3000芯片组,不过从成品的主板形状和规格来看,这和intel7230的主板基本上没有什么大的差异,intel3000主板也向上兼容。

Xeon3000
Xeon 3000系列处理器

  Intel XEON3000,采用 Conroe核心,最初发布的只有4个型号,包括Xeon 3040(1.86GHz/2MB L2/1066MHz FSB)、3050(2.13GHz/2MB L2/1066MHz FSB)、3060(2.4GHz/4MB L2/1066MHz FSB)及3070(2.67GHz/4MB L2/1066MHz FSB),同样为1066MHz FSB, 65奈米制程,处理器接采用Socket 775,而非服务器常用的Socket 771,支持Intel Virtualization技术、EIST省电功能、Intel EM64T技术、Execute Disable Bit技术。>>

9架构创新 Xeon进入4核45nm时代回顶部

  9、架构创新 Xeon进入4核45nm时代

  2007年04月9日,intel发布了XEON5300系列的XEON四核心CPU,用一句简单的话来讲,这是XEON5100的升级版本,是由两颗“Woodcrest”Xeon 5100系列处理器的核心(DIE),封装到一个处理器基板(Socket)上,所以在除了两倍(8M)于后者的2级缓存之外的其他技术指标上也是建立在CORE架构上的。

  同样的1333MHz的前端总线,同样的65nm工艺,同样的处理器还支持英特尔宽位动态执行技术、英特尔高级智能高速缓存、英特尔智能内存访问、英特尔智能功率管理等一系列的新技术。其中包含4种不同的具体型号,它们是“2.66GHz的Xeon X5355、2.33GHz的Xeon E5345、1.86GHz的Xeon E5320、1.60GHz的Xeon E5310”。

至强
Penryn架构XEON 5400系列处理器

英特尔至强处理器
XEON 5400系列处理器

至强

  同年11月,英特尔发布了代号为Harpertown(Penryn架构处理器衍生产品)的XEON 5400系列的处理器,这些产品采用了更先进的45纳米生产工艺,其中最复杂的一款拥有8.2亿个晶体管,频率从2GHz到3.2GHz不等,缓存达到12M,最高FSB是1600Mhz。英特尔上一代产品主要采用65纳米生产工艺,最复杂的一款处理器拥有5.82亿个晶体管。随着生产工艺的不断提升,英特尔可以在处理器上部署更多晶体管,从而提升处理器性能,并降低生产成本。这完全符合了摩尔定律:IC上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。>>

10Xeon的重要组成部分——Xeon MP多路处理器回顶部

  10、Xeon的重要组成部分——Xeon MP多路处理器

     最早的XEON MP我们可以追溯到2002年11月,intel发布的代号为Gallatin核心XEON处理器,它采用0.13微米制程,FSB 400MHz,Socket603接口,集成512KB二级缓存,1到4M三级缓存,支持4个CPU,支持超线程技术。从规格上也划分成三款,三款主频分别为1.5GHz、1.9GHz和2GHz,1.5GHz、1.9GHz的Gallatin芯片包含有1MB缓存,2GHz的Gallatin芯片包含有2MB的缓存。Gallatin芯片使用了0.13微米生产工艺,而旧的Gallatin芯片则使用了0.18微米生产工艺。

至强 
Gallatin核心XEON MP处理器

     2005年3月,intel针对多路市场发布了Potomac核心处理器,,采用了更先进的0.09微米生产工艺,,出了具备1MB的二级缓存外,还具备4至8MB的三级缓存,前端总线也由以前的400MHz提升到667MHz,频率则由2.83GHz开始起跳,同时而Potomac可支持四路或八路处理器。。稍后一些时候,intel又推出了代号Cranford的处理器,与Potomac一样,Cranford也使用了667MHz的前端总线、1MB的二级缓存,频率由较高的3.16G开始起跳。不过,他降低了一些高速缓存,从成本上迎合了一些消费者。

至强
 “Paxville M P”双内核服务器处理器Xeon 7000系列

     同年11月初,英特尔公司发布了首款面向四路或多路服务器的代号为“Paxville M P”双内核处理器7000型,该处理器支持超线程(HT)技术。其主频为3.0 GHz,工艺为90NM,带有667 MHz双独立系统总线。该全新处理器将适用于采用英特尔E8500芯片组的现有平台。

  2006年8月,英特尔按照他的发展路线,推出了代号为“Tulsa  MP”7100系列处理器,这是65纳米双内核多路英特尔至强处理器,具有更大的16 MB共享三级高速缓存,可用于四路或更多路服务器。Tulsa适用的系统与2005年推出的双内核英特尔至强处理器7000系列型相同。

     2007年推出代号为“Caneland”的新平台,它将包括一个四内核处理器(代号“Tigerton”),并基于英特尔的下一代微体系结构。Caneland平台设计通过直接连接各处理器与芯片组的高速互连接口提供更卓越的性能。此外,Caneland平台还有望采用未来内存技术,即全缓冲双列内存模组(FB-DIMM),并将包括四个内存互连接口,可充分利用增强的技术能力。

xeon
"Dunnington"Xeon 7400系列服务器处理器

六核处理器
"Dunnington"核心布局

7300处理器性能
65纳米技术

     2008年9月22日,英特尔发布了代号为Dunnington的45纳米英特尔至强7400系列处理器产品,继续巩固其在高端服务器细分市场的领先优势,全面提升性能标尺,并为虚拟化性能表现设定了全新标准。英特尔至强7400系列处理器可在一个处理器芯片上最多提供6个处理核心以及16MB共享缓存,以及最多支持到16路处理器,以提供高达16×6个处理器核心的计算能力。

  Xeon系列处理器进入一个崭新的时代,全新的Nehalem架构将使其摆脱一直以来伪多核的诟病,而内存控制器、QPI总线的引入也使得处理器I/O速度更快,而新增加SSE4.2指令、同步多线程以及更好的虚拟化性能使得处理器运算性能更强,自动化能源控制技术的引入也顺应了现在用户对能耗越来越重视的趋势。>>

1132nm至强处理器回顶部

  代号“Westmere-EP”的英特尔至强5600系列处理器也在2010年3月发布,可以看做是英特尔至强5500(Nehalem-EP)的升级版。从英特尔“Tick-Tock”的产品推进策略可以看出,Nehalem是45nm工艺成熟之后的Tock年,因此处理器微架构发生了翻天覆地的变化。而Westmere-EP则是同样微架构下的制程工艺进步——首款采用32nm工艺的至强处理器。

2
Nehalem架构

  同样针对双路服务器市场,与至强5500相比,除了提升了工艺制程外,至强5600的重要变化还体现在:6核心12线程设计、1.86~3.46GHz(四核产品)、2.26~3.33GHz(六核产品)的主频、12MB的更大L3缓存,以及在能耗管理方面的增强技术等。

  由于决定处理器最关键的因素有处理器微架构和制造工艺,至强5600仍然沿用了至强5500的Nehalem架构,因此,最重要的不同就在于32纳米工艺。和至强5500一样,至强5600采用相同的插槽、芯片组,同样具有两个QPI通道,三个内存通道,支持DDR3规格内存,主频范围基本相当,也支持超线程、Turbo Boost等技术。
  
  其中,低功耗版的四核至强L5609不支持超线程和睿频技术,不过功耗可以低到40W。值得一提的是,英特尔在Westmere中对微内核做了一定的升级,加入了AES增强指令集,,专门用来加密数据。还追加引入了早先就有的Intel Trusted Execution Tech可信计算技术(TXT),从处理器层面大大提升了系统安全性。在虚拟化方面,英特尔优化了微内核内的虚拟页面表单,使其可以存取1Gb的虚拟机页面文件(虚拟内存地址与物理内存地址靠这个表单做映射)。
  
  据英特尔官方的说法称,采用了32nm工艺的至强5600相比上一代产品性能提升了60%,并且可以实现15:1的服务器整合比。
  
  2011年3月,英特尔发布了同样基于Westmere架构的至强E7产品,同期也发布了基于全新Sandy-Bridge架构的至强E3处理器。这是至强家族再一次更换产品线的名称——第一次用DP和MP来称呼,第二次用3000系列、5000系列和7000系列来区分入门级、主流应用和高端多路应用。
  
  我们首先来看代号“Westmere-EX”的至强E7处理器。该系列产品延续了Westmere架构,采用32nm制程工艺,最高型号拥有10核心(20个线程)以及近30MBL3缓存,自发布以来就荣登了x86处理器性能之王的位置。
  
  至强E7除了核心数更多以外,相比上一代至强7500(Nehalem-EX)系列产品,其内存容量扩大了一倍(四路产品可以支持到2TB内存)。此外由于工艺提升至32nm,至强E7还拥有30MB的L3缓存。这些特性使得至强E7较上一代至强7500有了近40%的性能提升。
  
  而在虚拟化方面,至强E7支持VT-x3实模式寻址与1GB虚拟页面支持(与Westmere-EP相同的改进),从而改善了虚拟机的切换潜伏时间。新加入的C6节能模式可以让应用和核心运行状态关联更紧密,当系统认为某个线程空闲时,相应的处理器核心也将进入C6节能状态,这项技术对于大规模数据中心来说非常关键,可以大大节省能耗成本。
  
  相较于至强7500引入的RAS特性以面向关键业务应用,至强E7则进一步增强了这些特性,如机器校验架构恢复(MCA-R)能够让系统在发生特定内存错误时正常运行,双设备数据更正(DDDC)可以在两个内存设备出现故障时恢复数据,部分内存镜像功能则可选择性地对最重要的内存区域进行镜像,既能降低成本,又提高了数据保护的灵活性。Intel AES New Instructions(IntelAES-NI)可以保护企业和云计算环境中敏感的业务数据和私密数据,Intel Trusted Execution Technology(IntelTXT)则可以进一步保护虚拟化环境的安全。>>

1245nm工艺和全新微架构的至强处理器回顶部

  2009年3月,英特尔宣布推出基于45nm工艺和全新微架构的至强处理器,代号Nehalem-EP,包括12款至强5500系列产品面向双路主流市场和3款至强3500系列产品面向单路市场。该处理器由于采用了全新的微架构而被称作是自PentiumPro以来最具革命性的x86服务器处理器产品。

  Nehalem-EP系列至强处理器内核数虽然同样为四核,但是与至强5400的最大区别在于统一封装在了一个DIE上,并且将FSB前端总线彻底抛弃,转而采用了QPI总线(快速互联通道),并且加入了能动态调节处理器主频频率和功耗的Turbo Boost睿频技术。此外,HT超线程技术的回归让逻辑处理器一下上升到了8个,而Integrated Power Gate功率门技术和新一代VT硬件虚拟化,集成的三通道DDR3内存控制器都华丽丽的让Nehalem黄袍加身,成为当时x86领域的性能之王。而取代FSB的QPI总线彻底解决了多路互连的瓶颈,是Nehalem架构的精髓所在。

44
至强5500

  根据英特尔的官方数字,至强5500相比上一代产品性能提升了1.25倍,带宽提升了2.5倍,而功耗则降低了一半。该系列处理器有W、X、E、L五个子类别,除最低端的E5502是双核心型号外均为四核心,集成7.31亿个晶体管,主频1.86-3.20GHz不等,QPI总线频率4.8/5.86/6.4GT/s,三级缓存4/8MB,热设计功耗60/80/95/130W,支持DDR3内存频率低则800MHz、高则1333MHz,最大容量144GB(18×8GB)或192GB(12×16GB),插槽为LGA1366。

  Xeon3500系列代号Nehalem-WS,有W3570/W3540/W3520三款,就规格而言分别与Corei7-965/940/920完全相同,也是四核心八线程、3.20/2.93/2.66GHz频率、8MB三级缓存、QPI总线频率6.4GT/s或4.8GT/s、热设计功耗130W。

  此外还有两款嵌入式服务器处理器XeonL5518/L5508,也是Nehalem架构产物,前者主频2.13GHz、热设计功耗60W,后者主频2.00GHz、热设计功耗38W,均面向通信市场领域,享受长达七年的生命周期支持。

  之后,在2010年3月,英特尔又发布了基于Nehalem微架构面向四路和八路市场的至强7500处理器,代号“Nehalem-EX”。该系列处理器与至强7400相比性能提升也是巨大的,首先工艺升级到45nm,意味着功耗的降低,而八核心16线程的设计也让至强7500成为新的性能王。四条QPI总线意味着四路系统中任意两个内核可以直接通讯,通过第三方节点控制器最多可以支持八路并联——也就是单一节点最多可以拥有64核心,128个逻辑线程。

  至强7500核心面积近600多平方毫米,集成23亿个晶体管。这么多晶体管,除了八核心之外,还拥有多达24MB的三级缓存,四条QPI总线等。其他如内存控制器、VT硬件虚拟化和睿频支持都与Nehalem-EP相似。但是插槽是LGA1567,其热设计功耗最高为130W。

55
Nehalem-EP

  至强7500系列处理器首批共有八款型号,其中Xeon X7560/X7550/L7555都是八核心,主频最高2.26GHz,三级缓存最多24MB,热设计功耗最高130W,QPI总线频率最高6.40GT/s;Xeon E7540/E7530/L7545/X7542都是六核心,主频1.86-2.00GHz,三级缓存18MB,热设计功耗95-130W,其中X7542不支持超线程,但主频高达2.66GHz;Xeon E7520则是四核心,主频1.86GHz,三级缓存也有18MB,QPI总线仅为4.80GT/s,不支持Turbo Boost加速技术。

  此外还有一个衍生的至强6500系列处理器,包括Xeon X6550/E6540/E6510三款型号,分别为八、六、四核心,专为需要大容量内存的双路服务器提供低价解决方案。

  值得注意的是,至强7500中首次引入了多达22条RAS特性,这是原先在传统RISC处理器中才具有的高可靠性和可用性特性。这些特性保证了x86处理器在关键业务中也能一展拳脚。此外,至强7500对内存容量的支持增加了四倍(四路最多1TB),对虚拟机动态迁移的特性支持以及高I/O特性也保证了该产品在虚拟化和数据库业务方面的强势。

  英特尔官方介绍表示,至强7500系列处理器的性能是至强7400的三倍,可以取代20套四路单核至强服务器系统,且能耗要低92%。>>

13至强E3首次亮相回顶部

  如果说E7延续了英特尔多路7系列性能之王的称号,那么至强E3就是Sandy-Bridge架构首次进入至强家族的惊艳露面。
  
  与E7家族同时推出的至强E3-1200系列处理器主要面向入门级服务器和工作站,与以往的3000系列至强产品一样,该产品与桌面级Sandy-Bridge架构第二代酷睿i7有着血缘关系,只支持单路产品自不用说,其主频分布在2.2GHz~3.5GHz,只有两款不支持HT超线程技术,全线产品都支持Turbo Boost睿频技术,并且在E3-1260L、E3-1225、E3-1235、E3-1245、E3-1275等产品中集成了HD200“核芯”显卡(E3-1260L是HD100)。包括低功耗版本在内的处理器功耗分布在20W~95W之间。

3
Sandy-Bridge架构

  至强E3的亮点主要在Sandy-Bridge架构的首次登场,其新型环形总线设计、AVX向量指令集和同DIE集成的GPU是最主要特点。早先处理器内核与System Agent(北桥,后部分集成在CPU内)的通讯采用的交叉通路,这使得在多核时代其设计越发复杂和低效,而在Sandy-Bridge中启用的全新Ring Bus环形总线则很轻松的将CPU各个核心、GPU以及北桥连接在在了一起。
  
  环形总线的存在,可以大大减少核心访问三级缓存的周期。在以往的产品中,多个核心共享一个三级缓存,需要访问的话必须先经过流水线发送请求,在进行优先级排序之后才能进行。新的环形总线将三级缓存分割成了若干部分,借助于每个站台,核心可以快速的访问LLC。LLC小容量缓存的延迟优势与核心频率一致性在这里也就体现了出来,这就使得Sandy Bridge的周期相比以往产品有所缩减,从原来的35-40个缩减到了26-31个。同时,由于每个核心与LLC之间可以提供若干带宽,使得Sandy Bridge的整体带宽也提升了4倍。

33
Processor Overview

  相比带宽的提升,AVX向量指令集首次随着至强E3出现在至强家族中意义重大。这让向量宽度一举从128位增加到了256位,原有的16个128位XMM寄存器也一举扩充为256位YMM寄存器,可以同时处理8个单精度浮点数和4个双精度浮点数。换句话说,Sandy Bridge的浮点吞吐能力可以达到前代的两倍。
  
  此外,AVX指令集的出现对于原有的X86指令集也进行了优化与重新组合——这主要源于AVX指令集新的操作码编码方式。AVX指令集的编码方式叫做VEX(Vector Extension),其主要用途是缩短指令长度,降低无谓的代码冗余,并且也降低了对解码器的压力,实现的方式也很特别——压缩各式各样的Prefix前缀,集中到一个比较固定的字段中,从而达到了精简指令集的目的。
  
  最后提一下GPU,对于企业级应用来说核内GPU有些多余——这部分晶体管不如用来做Cache来的实惠。然而对于入门级服务器和工作站来说,至强E3提供的核内GPU可以轻松的提供图形环境,省去了部分成本。而同DIE集成GPU的做法也大大降低了系统功耗,提升了GPU性能。Sandy-Bridge架构里的GPU也支持睿频技术,这意味着其可以独立的加速或降速,并与CPU共享L3缓存。而可编程着色硬件的加入,使得Sandy-Bridge在视频转码等方面的具有独特的优势。
  
  不过也可以看到,英特尔只在部分E3中提供了集成显卡,另一部分则没有——很显然对于想用独立显卡的用户来说,可以选择这部分没有GPU部分的CPU,以获得更高的计算性能。而原定于2011年底发布的Sandy-Bridge至强E5系列处理器,则延期到了2012年第一季度发布。从目前得到的数据来看,面向主流服务器市场的至强E5是不会集成GPU的,其实际性能还是未知数。[返回频道首页]

 

 

 

 

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多

服务器论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品