正在阅读:功能出色 巴塞罗那图形工作站配置测试手记功能出色 巴塞罗那图形工作站配置测试手记

2008-04-29 18:51 出处:PConline原创 作者:万重山 责任编辑:wenzhicheng
1需求情况分析回顶部

前言

  近来,有客户来找老万,希望能够配置一个实用的图形工作站,而现在正好趁着这个机会,结合我这么多年的一点体会,和大家讨论下图形工作站的配置方法,并就我这次配置的产品做个具体的测试,而测试结果怎么样听听操作测试的设计工程师的话就知道了:“这台机器的渲染比我那台快多啦,原来这个图都是拉不动的,在这里就很流畅了……原来这个图在我那个机子上要渲染3天的,在这里渲6个小时就完成了……”

  熟悉工作站的朋友都知道图形工作站更需要注重两个方面的能力,一是图形处理效果(显卡),二是CPU渲染能力。而3D设计,基本上就是分建模和渲染两大阶段。建模阶段,对机器要求的主要是线框处理能力,直白点说,就是看显卡的3D专业性能。渲染阶段,则主要看CPU的处理能力,CPU的核心数量和每核心的性能,还有软件的优化,都对这个阶段的最终后果有着重大的影响。而不同的用户也对工作站有着不同的要求。在一些规模比较大的设计公司,建模和渲染的人员分工比较明确,所以采购硬件的时候,就经常将建模和渲染的配置分开来配置,给建模人员配置线框加速能力强的专业显卡,而另外配置一台或者多台渲染专用服务器,这样子建模和渲染各自独立,互不干扰,就可以充分利用工作人员的工作时间和机器,提高公司整体的工作效率。但是对一些规模较小的公司或者工作室、个人来讲,分开配置就显得不划算了,因为配置独立的渲染服务器,这一笔钱可不是一个小数目啊,所以,配置一个建模、渲染等综合能力都比较强的工作站,反而是一个最好的选择。因此,配置图形工作站的第一步就在于了解用户的具体需求,只有了解了,才能配置出合适的产品。

图形工作站测试

大型的设计往往需要性能强劲的工作站的支持

  现在市面上,可以用于组建工作站的产品可谓琳琅满目,而随着AMD 巴塞罗那四核Opteron处理器和新一代Intel 45nm Penryn核心Xeon处理器的上市,我们选择的余地就更加广泛了 。本次我们选择的就是一个采用四核Opteron(巴塞罗那)23xx平台的高端工作站。我们这里虽然是以DIY的角度来写的,但是里面的思路对品牌工作站的选择也同样适用的,所以不管您是打算配置DIY工作站,还是品牌工作站,相信也可以在这里得到一些有益的参考。

具体需求分析

  这次找到老万的用户是一家在国内很有名气的装饰设计公司,该公司的业务方向主要是大型的小区、别墅等高档次的建筑和环境设计。其方案中景观设计往往非常复杂,因此模型比较大,再加上为了得到尽可能逼真的输出图像而后期渲染阶段采用的高精度渲染,其对机器的要求非常高。该公司在建模阶段为了在最短的时间内完成任务采用了多人分工合作的方式,每人负责一小部分的模型的建模,因为每个人负责的模型并不复杂,所以对硬件的要求并不是太高。而在渲染的阶段,因为要把各个小模型合并起来,再经过整改才进行渲染,这样一来,需要操作的模型就比较复杂了,对机器的图型线框加速能力要求就大大提高,尽管可以通过模型塌陷来节省系统性能的消耗,但是对性能的要求,仍然大大高于普通的建模用的机器,而在后期整体渲染的时候,用户对机器的性能要求就更为苛刻了。该公司现在用的是一台性能稍高的PC来处理这个工作,而这台当时售价上万元的“高端机器”已经不堪重负了,在编辑模型的时候,不仅在拖拉、缩放的时候卡的不行,而渲染的时候,更是老牛拉破车,一般渲染较大尺寸的图片的时候,这个机子就直接卡住了,跟死机一样,几乎没有反应,而且用的时间也很长,花个3、5天的,那是常事了。这一次客户找我们出方案,就是为了解决这个渲染用的机器性能太差的问题。

图形工作站测试

    而在经过了和客户的反复沟通,了解了他们的具体需求之后,我给个客人推荐了以下的详细配置方案:

巴塞罗那工作站测试

配置方案

2硬件配置回顶部

  硬件配置

  可能有的朋友一看到这个配置,会有很多不同意见,觉得这个配置不符合自己的看法。这个是正常的,我们也欢迎大家多多讨论,不过在拍砖之前,还是先耐心听听老万的解释?

  其实每个配置,都应该针对具体情况来定,我们这个方案是对应这家公司的情况来制定的,但是并不代表适合其他单位的情况。为了让大家都明白我们的配置思路,下面我们就针对各个主要的部件逐个做一些详细的说明。

  (1)CPU:

  根据AMD的说明,AMD 皓龙Opteron(巴塞罗那)是AMD最新推出的全新一代四核高端产品,全部为原生四核心,4x512KB二级缓存,2MB三级缓存,1000MHz HyperTransport总线。Intel和AMD的处理器都非常出色,由于两者架构并不相同,所以在不同的应用上,可能表现就各有所长。以往的AMD的双核皓龙在测试中,3D专业性能相当优秀。所以我们对这款四核心的巴塞罗那处理器期望非常高。但是AMD这款四核产品因为产能问题,比AMD原计划的发布时间晚了几乎半年之久。AMD四核皓龙(巴塞罗那)刚一到货,我们马上就组织了人员在第一时间进行了测试,同时,也请一些做3D设计的老客户公司帮忙,用实际的工作模型来做过实地测试。测试表明,四核皓龙(巴塞罗那)的性能依然出色,在处理3D图像方面,跟他同样价格的竞争对手相比,有着明显的性能优势。所以,我们为这个客户推荐了这个AMD的四核处理器的方案。

  前面我们也提过,对于不同的应用,用户的需求也会不同。因此为这位客户推荐的产品,并不代表对所有应用都是最合适的。比如您要是做非编工作站的,那imtel 的45nm四核至强可能更加适合您。

  AMD Opteron(巴塞罗那)型号比较多,其中,较为高端的有2347(1.9GHz)、2350(2GHz)、2352(2.1GHz)、2354(2.2GHz)等,这类常规型号的TDP为95W;除此之外,还有一些后缀为 HE的功耗型号,如2347 HE(1.9GHz)等,这类的功耗为68W。处理器价格不断降低和性能不断的提升,对广大消费者来讲,都是受益的,当然更得益的莫过于处理器厂商。产品型号多,但是我们要做到合理的投入,所以需要对市场的了解、软件的使用条件,对硬件的支持各种因素都要考虑,综合考虑之后,才能选择最具性价比的产品。经过价格对比和性能的衡量之后,我们最终选择了Opteron2350(2GHz)这个型号。一共采用2颗Opteron2350,总共八个处理核心,给整机提供彭湃动力。

  (2)主板

  主机板是关系到整机的性能和稳定性的关键配件,为什么国际名牌大厂的产品性能好,质量高?和这些大厂采用的质量可靠的名牌产品有很大关系。而泰安(TYAN)的质量品质,也不需要我在这进行过多的说明。TYAN作为专门研发高端服务器、工作站主板的老牌厂商,长期给国际大厂提供OEM、ODM业务,如果他的东西不好的话,估计也能难找比他更好的。在众多的AMD Socket F服务器主机板中,TYAN的S2915-E是一款配置完美的经典设计。而泰安S2915A2NRF-E是TYAN S2915A2NRF的升级版本,增强了内存供电模块的功能,提供了对巴塞罗那处理更为稳定的支持,是专为高端工作站和服务器设备而设计。除了支持两颗AMD Opteron2000/2300系列处理器。其强大功能还包括nVIDIA 3600芯片组板载的双千兆网口,1394a火线接口,板载声卡,USB2.0接口,并且拥有多条PCI-E x 16显卡插槽,可同时支持4张显卡,能够支持SLi技术。此外,S2915还具有PCI-X插槽,支持带RAID功能的SATA2/3G接口和许多其他功能,能够为您的系统搭配组建SATA RAID 0,1,5,10等等, 当然,如果你舍得多花几两银子,那么完全可以使用TYAN S2915WA2NRF的型号,带W的后缀,也就表示提供对SAS硬盘的支持。这款主板也是被多家高端厂商采用的热门型号,据说其中就包括一家以“H”开头的国际大厂的高端工作站。不过他们厂商之间是有协议的,我们对这个也不是很方便说,呵呵,毕竟老万还不想被这些国际巨头告上去。

巴塞罗那工作站测试

泰安S2915A2NRF-E

  (3)显卡

  PNY  Quadro FX 3400,是目前市场上性价比最高的专业图形卡之一,它配备有256MB超高速GDDR3缓存、40.0GB/s内存带宽、256位内存总线,以及支持两个超高分辨率(3840 x 2400)数字屏幕;下一代PCI Express总线架构使其在几何与填充率上有超过两倍的改善,为专业CAD、DCC和科学应用领域与专业用户,带来最高质量的图像整体解决方案。其采用的nVIDIA Quadro FX3400 GPU 提供了高性能的解决方案,提供了一对具有Dual-Link信号输出能力的DVI接口,256MB的GDDR3显存,以及HD视频输出能力, PNY  Quadro FX 3400采用了“大众化价格+优异性能”的全新设计,不但有亲和力的价格,在功能/性能上也毫不含糊,提供完整且先进的功能与价值,兼顾高质量、高精确度、高效能表现和可程序化功能,超越竞争者高阶产品在价格/性能比的表现。从下图可以看到两块显卡,没有错,这次我们就是使用了SLI的方案。

  可能也有朋友对采用Quadro FX 3400 做SLI不以为然,他可能会说了:“要更高的性能,为什么不采用更高端的显卡呢?比如Quadro FX 3500、Quadro FX 4500之类的,不是比用两个Quadro FX 3400组SLI方便一些吗?价格也差不多啊。”对,没错,如果是个人使用,那肯定是采用单个高端显卡更合适了。但是,我们之前也说了,做方案是要考虑客户的使用情况的。这个机器是公司用的,现在是组建SLI来给1个机器使用,假设以后如果有什么紧急任务,建模任务紧的话,那这2块Quadro FX 3400就可以分1块出来给其他建模的机器使用。早期建模阶段对显卡性能要求不是太高,所以1张Quadro FX 3400完全够用了。所以这里采用2块Quadro FX 3400做SLI,其实是一个经过全盘考虑的、具有高度弹性的一个上佳方案。  

巴塞罗那工作站测试

PNY Quadro FX3400专业显卡

(4)硬盘

  这里我们讨论一下硬盘的选择。可能这里很多朋友早就有质疑了:“为什么不用带SAS的主板,而用了独立SAS卡?为什么用73G这么小的容量?其他配置都这么高,偏偏硬盘选了这么小的???”

  呵呵,大家可先别急,且听我慢慢道来。用独立的卡,其实理由也很简单,那就是:尽可能使客户的投资得到最大的回报。这话怎么说呢?大家想想,现在硬件更新换代这么快,虽然说是高端机器,但是2~3年后,肯定又要换新的设备了,如果采用独立SAS的主板,那到时候升级的时候,这块SAS卡还能继续用,毕竟SAS接口是最新的技术,没有那么快就淘汰的,就算不用在新的工作站上面,也可以用于别的机器上,拿来组建文件服务器啊、存储服务器啊之类的,用处就很灵活了。

  容量方面,因为这台机器是用来处理人家已经建好的模型,所以本机的编辑、修改的时候不是很多,所以也不用在本机上存放太多的素材、资料什么的,并且公司有其他专门的机子做存储数据用的,所以这台机器上,完全没必要用多少容量的硬盘,只要满足一个操作系统和几个必要的软件就可以了,尽管多花几百元,就能用更大的容量的硬盘,但是本着“不该花的钱,一分钱也不要浪费”的原则,还是选用了73G这个看起来比较小的硬盘了。

巴塞罗那工作站测试

安装完毕后整机外观

  好了,基本上,硬件方面的几大方面就讨论到这里,其他方面的,虽然也很重要,但是因为篇幅问题,就不再一一阐述了,有这方面兴趣的朋友,可以直接找我交流。

4软件配置回顶部

软件配置

  硬件的安装什么的,不是什么难题,说白了就是拧螺丝,呵呵,所以我们就不再罗嗦,接下来我们来详细说明一下下一个关键部分:软体部分。

  系统的选择:考虑到常用的32位win XP系统只能识别3.5G 的内存容量,而我们本身配置了4G,所以在做系统的时候,我们选择了服务器版本的win2003。很多人认为Win 2003是服务器上使用的系统,不适合工作站用,因为win2003下显卡没有加速功能,也没有声卡。但是事实上,只要手动打开系统的显卡、声卡硬件加速功能,win2003同样可以作为一个很好用、很稳定的工作站操作系统。但是后来的情况证明,win2003确实不适合我们这台机器。并非Win 2003 不可以作为工作站系统使用的,而是当我们安装完系统和所有的驱动之后,进到显卡设置里面,才发现,nVIDIA的驱动,根本没有提供在win2003下面组建SLI的功能,实在令我们郁闷无比。

   于是我们重新再来,这回我们选择了win  XP  64 位系统,顺利做完上面的工作,心里窃喜,以为可以安心了,其实困难是走一步步走才会发现的。客人运行的是3D max 软件 ,而渲染是工作站的一个重要部分,3D max 自带的渲染功能不是很强大,所以另外安装了3D max的一个外挂渲染插件:VRay,不过Vray版本众多,要命的是早期的都不支持64位的系统,好不容易找了一个支持64位、稳定的版本,这才算初步成功了。

  这是进入系统后的,显卡和CPU详细情况,虽然是2个实体CPU,但是核心显示为8个Opteron 2350:

巴塞罗那工作站测试

系统信息


   3Dmax支持OpenGL和Direct 3D这两种加速API,对新版本的3Dmax来讲,对Direct 3D的优化更加明显,所以安装完系统之后,别忘了也装个最新版本的DirectX进去。

巴塞罗那工作站测试

安装DirectX 9.0c

   安装好显卡的驱动程序,会在右下角出现一个显卡的图示,点击设置显卡属性,其中有两项为:设置SLI配置和管理3D设置。我们需要根据实际的软件使用情况做调整,SLI设置成功后,两块显卡只能有一个显卡接口能正常使用,SLI技术理论上能把图形处理能力提高一倍,当然实际上没有这么高,根据软件对SLI的优化程度,大约会有20%~60%上下的提升。

巴塞罗那工作站测试

SLI设置

  好了,到此为止,所有的系统设置和优化都已经完成了,下面我们就来进行一些相关的测试。

巴塞罗那工作站测试

显卡工作模式设置为3D max优化

5实际测试回顶部

实际测试

  我们用常见的SiSoftware Sandra,还有CineBench9.5、CineBench10等测试软件进行测试,最后也用了客户提供高精度模型在3DMAX下进行了实地性能测试。

  (1)处理器科学运算性能测试

巴塞罗那工作站测试

  Processor Arithmetic是测试单纯CPU运算性能的项目,该项目能通过算法最大程度避免由于芯片组/内存所带来的影响,着重体现出CPU的差距。在这项测试中,Opteron 2350的优势非常明显,命名为巴塞罗那的K10核心,并没有令我们失望。

  (2)处理器多媒体性能测试

巴塞罗那工作站测试


   这一项测试的CPU的多媒体处理能力,对应的就是视频、音频文件的编码、解码能力,换而言之,这项性能对应类似非编工作站的工作内容。多媒体处理一向对intel处理器的SSE加速指令集青睐有加,在这里AMD处理器稍逊一筹。所以之前我们也提过,AMD和intel的性能各有所长,对应不用的应用,选择相对应的优势产品,才能得到最好的性价比配置方案。

  (3)内存带宽测试

巴塞罗那工作站测试


  Memory Bandwidth 测试得正是我们经常讲到的内存频宽,特指内存外部传输率,这个测试项目受影响的因素非常多,首当其冲的是内存的频率,还有FSB频率,其次是内存控制器的差异也会对整个结果产生很大的影响,而内存时序的变化也会影响到内存频宽的一部分。
在这项测试中,AMD集成内存控制器的架构,使得该项成绩极为突出,基本上,都是AMD自家的产品在这里争夺冠亚军。Opteron 2350比上一代双核型号有微小的提高,当然,绝对性能还是比不上价格昂贵的4路产品的。

  (4)内存延迟测试

巴塞罗那工作站测试


  Opteron 2350平台采用的是DDR2 REG ECC服务器专用内存,根据理论推测,通常认为DDR2的内存延迟会比较大,而加入REG ECC等校验功能的服务器内存,也会增大内存的延迟。但是测试结果表明,我们这台机器的内存延迟并没有出现预想中的大幅度提升,而是跟原先以低延迟见长的DDR 一代内存的数值接近。从另一角度来讲,也说明了我们整个平台已经相当成熟了,整体的优化已经达到了一个较高的水平。

  (5)缓存和内存测试

巴塞罗那工作站测试

  这一项测试是测试CPU缓存与内存的综合性能。Opteron 2350因为集成了2MB的三级缓存,所以缓存性能远远高过之前的产品,AMD为四核产品设置了这个三级缓存的机制,大幅提升了处理器的综合性能。

  (6)CineBench9.5测试

巴塞罗那工作站测试

  CineBench使用针对电影电视行业开发的Cinema 4D特效软件引擎,可以测试CPU和显卡的性能。第一项测试纯粹使用CPU渲染一张高精度的3D场景画面的速度,在单处理器单线程下只运行一次,如果系统有多个处理器核心或支持多线程,则第一次只使用一个线程,第二次运行使用全部处理器核心和线程。第二项测试则针对显卡的OpenGL性能。

  在CineBench9.5的测试中,单个CPU的测试分数为281CB,而8个核心同时渲染的分数为1590CB,是单个核心的5.66倍;OpenGL性能提升到8.25倍,总时间为14秒。这个成绩好还是不好,我们就不发表意见了,毕竟数值摆在这里,有兴趣的朋友也可以下载这个软件,自己做个测试,比较一下分数。

  (7)CineBench10 测试

巴塞罗那工作站测试


  现在CineBench推出了最新R10版,最新的CineBench 10支持Windows XP和Vista的X86/X64系统,以及PowerPC和Intel架构Mac平台,最高支持16个处理器核心!相对于之前的9.x版,R10版宣称更能榨干系统的最后一点潜能,准确体现系统性能指标。从测试实践来看,对多核心的优化程度,确实比以前的版本有了很大的提升。Intel也经常用这个软件,来作为测试和演示的标准之一。
  
  CineBench r10的测试中,单个核心渲染分数是1679CB ,8个核心渲染分数是11321,是单个核心的6.74倍。时间为1分18秒。从结果来看,CineBench r10的确比CineBench 9.5能更加有效的利用多核心,多核心渲染提升倍速,从9.5版的5.66提升到了R10版的6.74。

  (8)3DMAX 实际模型渲染测试

   之前的测试,都是采用专门的测试软件,对客户来讲,这些数据其实只能做个参考,毕竟这个机器是干活用的,就算测试分数高到天上去,如果实际使用不好,那也没有任何意义。所以最后,我们也用了客户提供的几个实际模型来进行实地渲染测试。

巴塞罗那工作站测试

  在实际的测试过程中,内存占有练会随着时间的增加而增加,当然CPU的使用律一直都是100% 。渲染的模式也可以根据自己的爱好来修改,如果在渲染过程中发现和自己的预想有出入,也可以停止渲染在修改参数,这也是VRay 的灵活所在。

  这项测试是没有分数的,但是,却是客户感受最为直观的,从本文开头客户3天变6小时的感慨中大家一定都知道了吧。

巴塞罗那工作站测试

完成渲染

  后记:

  一个追求卓越、追求完美的设计工作者最大的理想,就是借助超级图形工作站,实现自己完美设计,四核Opteron(巴塞罗那核心)工作站最大限度地满足的这种需要,上述配置就是根据这一想法打造的一款高性能图形工作站,当然受成本限制,并没有达到所谓的“顶级配置”,但是,追求顶级配置,并不是我们的目标,我们的目标,就是追求在有限的资金下,尽可能的优化整套配置,使得客户的每一分钱,都能得到最大限度的效益回报。

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多

服务器论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品