正在阅读:构建企业级刀片中心的四大核心要素构建企业级刀片中心的四大核心要素

2007-07-19 10:43 出处:PConline 作者:PConline服务器频道 责任编辑:gongjianhui

 

 
  当企业决定选择刀片服务器产品后,可能会面对市场上种类繁多特性各异的产品而有所困惑。企业选择刀片服务器并不是追逐所谓的“时髦”,仅仅是简单的从1U机架到刀片服务器的外形升级,而应把刀片中心看作企业IT投资的关键平台。

  下面将具体分析企业在选择刀片服务器时应该考虑哪些方面的因素,从而衡量选择的刀片服务器产品是否能够达到IT架构核心平台的稳定性标准和整合能力要求。同时,我将以IBM的BladeCenter刀片服务器为例介绍IBM在设计上怎样满足这四个核心要素的要求。

  核心要素一:保证系统可靠性的双冗余设计

  在一个新产品出现在市场上的时候,很多用户都不会贸然去做“第一个吃螃蟹”的人。用户需要看到产品在市场上成熟、稳定,才可能进行采购。在国内有很多的客户选择购买IBM eServer x系列的4路产品x255搭建自己的IT系统,这是因为x255是x系列非常成熟的4路产品,其稳定性给了用户强大的保障。对于BladeCenter刀片服务器而言也是一样,如果没有稳定可靠作为“第一保证”,用户没有理由轻易地进行移植。因此,在BladeCenter刀片服务器的设计之初,提供刀片服务器的安全稳定性能被列为“重中之重”。

  在IT领域有个专业的名词叫做“单点故障”(Single-point Failure),这好比计算机的电源线插在电源插板上,由于是一根电源线,如果断了,系统立刻断电。服务器设计中也有类似的情形,我们不能容忍服务器可以掉电或者在电源、板卡接口上出现故障,因为服务器是用作核心应用的——个人用户可以重启PC,但是企业用户则希望这样的举动越少越好。“冗余”这个字眼从日常生活里的“多余”在这里则变成了非常重要的稳定性保证——没有双冗余设计,意味着在整个系统埋伏着许多潜在的“定时炸弹”,这些隐藏的“单点故障”嫌疑将使得企业的IT系统构建在不够坚实的地基之上。

  如图1所示,在IBM eServer BladeCenter刀片服务器中,许多部件都是双冗余的结构。比如每一片刀片服务器与刀片中心机柜的背板相连接都是上下两个板卡接口,应用了双冗余设计,当中如果一条出现问题时,并不会导致系统的停顿和崩溃,所有数据可以继续从另外一个网络接口跟外界进行沟通。刀片中心机柜的中间背板本身也是全冗余设计,其上没有芯片没有电源,只有一些最基本的线路板元器件——这样的设计考虑也大大降低了背板发生故障的几率。

  

刀片中心背板的双冗余设计


 
  图1 刀片中心背板的双冗余设计

  当我们从刀片中心的后面去看,会发现更多的冗余型设计。原先在1U高的机架式服务器上面无法实现的设备冗余,在BladeCenter刀片中心中都得到体现,比如光纤终端交换机、千兆以太网交换机、电源、风扇、远程管理模块以及KVM切换器,全部都可以进行冗余配备。其中,冗余电源是最为关键的部分。当机架式服务器在狭小的1U空间当中没有办法提供电源的时候,密度更高的刀片中心反而实现了双电源供应——这不得不说是BladeCenter刀片中心在整个服务器工业设计上带来的突破和进步。

  核心要素二:降温散热上的整体设计

  随着服务器集成密度的提高,整个刀片中心的散热要求也提高了。高计算力需要多CPU,而CPU本身以及相关设备的都需要刀片机柜具备强大的散热降温能力。IBM是采用了类似“中央空调式”的整体散热技术,来帮助整个刀片中心进行降温。

  IBM刀片中心的散热系统设计,是用两个冗余的风扇对放置在刀片中心中的14片刀片进行散热,就像大酒店的中央空调能够对各个房间同时进行散热。而且刀片中心的散热系统采用双冗余的设计,如同配备了两套酒店的“中央空调”。

  相比之下,一些厂商在进行刀片服务器设计改良时,会做一些非常简单的改变——只是简单地把一个服务器压扁,仍然为每个服务器采用类似“挂壁式空调”来帮助每个刀片单独散热,如同为房间中的每个人配备一个“电风扇”。但这样的设计可能会带来两个问题:一、我们需要一个非常敬业勤劳的电工每天去检修每个“挂壁式空调”、“电扇”是否正常,如果出现问题需要对每个散热设备进行更换;二、仅仅保证了刀片服务器自身,而忽视机柜空间内的空气流通和整体散热。

  IBM刀片中心采用整体散热设计和双冗余的高速风扇配置,则另辟蹊径化繁为简,保证了机柜散热上的可靠、高效。不仅如此,IBM设计的这套双冗余的“中央空调”风扇还具有“变频”功能,在平时标准使用的时候,每分钟150立方英尺的散热风量。当它出现温度预警、部件故障时,或者一个风扇彻底坏掉,另外一个风扇会开足马力进行工作,每分钟出风量可以达到325立方英尺的散热空气流动量。如果有人在这个时候站在运行中的IBM刀片中心背面,会发现风量非常大,这个道理和站在酒店中央空调的主出风口一样。因此,双冗余的设计保证了不用担心单个风扇故障引起的服务器性能问题。

  

刀片中心散热气流示意图


 
  图2 刀片中心散热气流示意图

  如图2所示,整个刀片机柜的散热系统空气流动顺畅:冷空气从刀片中心前方进入,首先为最热的两个核心CPU进行散热,然后其次为内存、板上芯片、硬盘、直至这两个电源的部分,最终由刀片中心机柜后端的两个风扇把热空气抽出。此外,整个刀片中心在设计的时候还保证了密封性,IBM在服务器刀片与机柜的缝隙上精心设计,确保漏风量减到最小。

  核心要素三:硬件厂商设备的整合能力

  在整个刀片中心的系统架构上面,IBM跟许多世界顶级的硬件厂商强强联手,提供给用户整体的IT系统解决方案。IBM与全球最大的CPU的生产厂商Intel,全球最大的光纤存储设备生产厂商Brocade,全球最大的网络产品厂商Cisco,以及全球知名的2到7层交换机生产厂家Nortel,最大的高性能计算交换机生产厂商Myricom等合作,将它们的技术全部融入到BladeCenter刀片中心当中。IBM也因此成为业内唯一一家能在精密7U空间中集成这些界最知名厂商技术的服务器厂商。

  

硬件设备的整合


 
  图3 硬件设备的整合

  如图3所示,我们可以通过一个典型的例子看一下刀片中心技术的强大整合能力。假设要建设一个中型企业计算数据中心,一般需要许多设备来帮助支撑中小企业的计算以及网络和存储平台,配置如下列10类产品:2路CPU的服务器10台、基于RISC的两路CPU的服务器1台、某个品牌的4路服务器1台、7层以太网交换机1个、光纤通道存储交换机1个加上许多光缆、2层以太网交换机1个、KVM切换机至少1个、网线若干、KVM电缆若干、电源线若干。从这张直观的照片我们可以看到,当IBM把这些全球知名厂商的技术集成到BladeCenter当中之后,一个7U高的刀片机柜就可以整合原先的那些设备,大大简化了用户搭建数据中心的成本——无论是空间成本、管理成本还是使用成本都大大降低。

  核心要素四:先进的软件方案整合能力

  除了硬件整合能力外,是否有成熟先进的软件方案整合能力,也是用户在选购刀片服务器时非常关注的一点。IBM在拥有基于自己的软件产品的解决方案同时,与很多著名的软件方案提供商都有在刀片服务器上的合作,如VMware、 CITRIX、Novell、SAP等。比如由IBM eServer BladeCenter、与Tivoli、 WebSphere、DB2和FAStT存储产品所组成的多应用动态负载均衡的基础设施交响曲方案,它非常适合用在企业对自己的某一种应用的工作负载和应用的资源分配难以预测的情况,它可以帮助用户不必购买所谓“足够量”服务器,而只需要购买适当数量的服务器,由系统自动分配调拨它们之间应用的平衡。

  对于企业关键应用,IBM刀片服务器可以实现基于VMware在刀片间不间断任务转移。当企业关键应用业务不能停机又需要扩展比如要升级CPU处理能力时,以前是一定要停机的。即使先安装好新系统,在切换时依旧会丢数据,还是要出现业务停顿。使用基于VMware的这一方案,迁移工作可以在IBM刀片服务器上不停机完成。此外,当BladeCenter上面开了很多虚拟的VMware Server,需要对一台刀片服务器的内存、CPU或者硬件设计进行扩展或调整的时候,它上面的应用可以不停机地切换到另外一台拥有VMware V/Motion的刀片上面,所有的数据包括内存上的数据都会不间断地迁移过去并予以保留,待原有刀片的维护工作完成后再平滑地迁移回来。

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多

服务器论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品