正在阅读:至强5500对决六核皓龙 对比测试互有胜负至强5500对决六核皓龙 对比测试互有胜负

2009-07-04 06:41 出处:PConline原创 作者:饺子 责任编辑:wenzhicheng

  数周之前国外有网站Advanced Clustering Technologies对英特尔Nehalem和AMD“伊斯坦布尔”的平台做了高性能 Linpack(简称HPL)对比测试(国际上最流行的用于测试高性能计算机系统浮点性能的benchmark,通过对高性能计算机采用高斯消元法求解一元N次稠密线性代数方程组的测试,评价高性能计算机的浮点性能),种种测试结果表明AMD“伊斯坦布尔”战胜了英特尔Nehalem平台。

至强对决皓龙
至强5500与六核皓龙“伊斯坦布尔”代表了英特尔与AMD最新的技术

至强5500系列和皓龙2400系列HPL对比测试,皓龙胜

  此项对比测试的目的只有一个:展示GFLOPS(每秒钟进行10 亿次浮点运算的工作能力)的峰值。理论上每个系统GFLOPS峰值取决于处理器核心的数量、主频和IPC(Instructions Per Clock Cycle,指令/时钟周期)。几年前上一代的处理器也只能做两个IPC,而最新的处理器在全新架构的帮助下能够达到四个IPC。为了便于比较,较老的主频为2.2 GHz的双核皓龙处理器的理论峰值仅为17.6 GFLOPS每台机器而如今四核的皓龙理论峰值却能够达到70.6 GFLOPS。

  HPL对比测试的两个平台介绍,AMD方面为皓龙2435“伊斯坦布尔”系统(六核心,主频2.6GHz,16GB 800MHz DDR2内存 );英特尔方面为至强X5550 Nehalem系统(四核心,主频2.66GHz,12GB 1333MHz DDR3内存)。测试人员尽可能的保持测试平台的平等性,同样的电源、硬盘驱动器以及操作系统。内存的容量在发挥三通道内存架构的Nehalem和双通道内存皓龙之间性能各不相同。由于该测试项目倾向于内存容量和测试成绩成正比,因此,测试人员调整了两个平台的内容容量大小。

至强5500与皓龙2400系列处理器性能对比测试

处理器型号

理论峰值

实测峰值

效能
平台价格
每GFLOP运算成本

Nehalem X5550 2.66GHz

85.12 GFLOPS

74.03 GFLOPS

86.97%
$3,800.00
$51.33

Istanbul 2435 2.6GHz

124.8 GFLOPS

99.38 GFLOPS

79.63%
$3,500.00
$35.21

  简而言之,在该测试中AMD“伊斯坦布尔”战胜了英特尔Nehalem,其测试结果对比为99.38个gigaflop(每秒钟至少进行10 亿次浮点运算的工作能力)VS74.03个gigaflop。也许六核战胜四核并不在意料之外,但考虑到英特尔支持单核心双线程的hyperthreading技术,也许会预测英特尔要在并行运算占据优势。而在实际应用,我们发现hyperthreading技术带来的性能的提升很大程度上取决于具体的应用。

  据Advanced Clustering Technologies的工程师介绍,在运行HPL测试软件的时候,hyperthreading却导致了一定程度上性能的削减,工程师还指出Linpack少数几个不从hyperthreadin技术中受益的应用之一。

  在有着更高带宽DDR3内存的支持下,Nehalem更具计算效能(HPL峰值和理论上峰值),尽管用户一般并不关注这些度量标准,但实际上这在英特尔设计中起到了不错的平衡系统的作用。讨论的最多的就是价格性能测试结果,而在该测试中AMD占据了优势。每一个gigaflop运算成本测试成绩对比为35.21美元VS 52.33美元。

  HPL对比测试最后结论:AMD“伊斯坦布尔”在每GFLOP运算成本和峰值表现上都胜英特尔Nehalem至强一筹,这表明六核心处理器提供了强劲的浮点运算性能,但在整体性能平衡性上不及英特尔Nehalem至强。较低的效能测试结果很可能是缺乏内存带宽,加大“伊斯坦布尔”系统内缓存轮询所导致的,处理器闲置较长时间等待来自内存的数据的同时也在检测系统内12个处理核心的缓存命中(cache hit),内存宽带对整个系统性能表现带来的巨大影响。

  尽管Nehalem可能是核心性能比最高的,但是“伊斯坦布尔”通过增加两个处理核心很好地弥补了自己的弱势。当用户为自己的下一代集群式计算系统挑选系统架构时,HPL测试成绩会是唯一的标准。

  然而此次针对同样处理器平台,测试人员又进行了STREAM测试,并将其结果公布在网站。据了解STREAM是HPC Challenge suite测试套件的一部分,是针对系统内存带宽的一种测试,由于内存带宽是整个计算系统中的一个最为重要的部分之一,因此STREAM的内存带宽测试也可以反映整个系统的性能水平。随着处理器核心数量的增加,内存带宽在许多应用程序中显得越发重要,计算性能已经悄然走到了内存性能的前面。和HPL测试一样,STREAM也是一项综合性的测试,但是总的来说,如果某个应用程序受内存性能限制的话,那么STREAM测试就是体现相对性能水平的好指标。

  STREAM对比测试的结果也毫无悬念。如果按照X86竞争的思维来看的话,有着高级内存子系统的英特尔Nehalem(至强5500)处理器完胜仅仅依靠上一代DDR2内存技术的AMD“伊斯坦布尔”皓龙。

  Advanced Clustering Technologies工程师Shane Corder表示,“就算是内存性能最差的至强5500处理器性能也会比最好的皓龙处理器要高出20%,如果皓龙处理器要和最强大的至强处理器相比的话,那么这种性能差距会扩大至超过75%之多,至强5500之所以能够获得高人一筹的内存带宽成绩,是因为三通道内存取代了双通道,DDR3内存频率的升高(高达1333MHz)以及QPI(快速通道互联)技术带来的高速点对点处理器互联。”

  STREAM性能测试中,一个值得关注的数据不得不提:六核“伊斯坦布尔”的测试结果要略微低于四核“上海”。Advanced Clustering Technologies测试人员将其归咎为“伊斯坦布尔”多出的两颗处理核心需要争取与“上海”处理器中数目一致的,仅有的两个内存控制器带宽。和Linpack的测试结果一样,反映了性价比之优势。

 
追求极致的体验 神画智能影院F1 Pro新品评测 斐讯与他的0元购:一个猜到开头却猜错结尾的故事 不好意思 你在电脑上干了什么我们都知道! 国外随时掐断咱的网络?危言耸听还是确有其事 清水、旧电厂做幕布 炫目影像让人叹为观止
键盘也能翻页,试试“← →”键
本文导航
第1页:HPL对比测试
第2页:STREAM对比测试(一)
第3页:STREAM对比测试(二)

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多

服务器论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品