正在阅读:曙光TC2600刀片服务器解决方案曙光TC2600刀片服务器解决方案

2008-10-09 12:10 出处:PConline原创 作者:佚名 责任编辑:zhaojuan

  1. 背景概述

  1.1. 计算化学和材料物理

  进入20世纪以后,由于受到物理学理论的飞跃尤其是量子力学的发展的影响, 研究人员广泛地应用了当代科学的理论、技术和方法,在认识物质的组成、结构、合成和测试等方面都有了长足的进展,而且在理论方面取得了许多重要成果。随着计算机硬件技术的发展和计算方法的突飞猛进,基于量子力学的计算模拟手段已经被广泛应用于化学、材料物理以及有关的其它学科在解释和预测材料结构、物理性质和化学行为中。现在根据量子化学计算可以进行分子的合理设计,如药物设计、材料设计、物性预测等。

  Kohn和Pople等人开创的密度泛函理论(Density Functional Theory, DFT)在过去的20年里得到了广泛的应用,包括固体物理、化学、生物等学科,都能看到密度泛函理论的影响。与传统的量子力学方法不同的是密度泛函理论的基本变量是单粒子密度,通过体系的单粒子密度而不是波函数来描述体系基态的性质,如总能量等。因此密度泛函理论降低了量子化学计算的计算量。随着高性能计算技术的平民化浪潮以及并行软件逐渐普及,高性能计算已经成为上述领域中的除了理论和实验外的主要研究手段。

  1.2. 曙光TC2600刀片服务器

  曙光高性能机群采用机群体系结构,由若干台高性能服务器(节点机)和高速互连网络连接到一起,通过作业调度系统形成单一系统映象的高性能计算机,并通过监控系统和一组机群管理软件对其进行有序管理。曙光公司的服务器产品线非常丰富,通常机群中的节点机可以采用双路、四路,甚至高端的八路服务器选择,另外对于整体解决方案中,数据的前后处理也可以采用曙光图形工作站组成一个完整的曙光机群解决方案。

  TC2600 刀片服务器是曙光公司研发的第三代双核/四核刀片服务器产品,它在众多方面超越了传统机架式服务器,是高密度、高性能的新一代服务器产品。刀片服务器由于物理形态上的高度集成,我们可以根据物理化学领域应用的不同的特色进行灵活配置,极大地丰富计算服务器的解决方案。

  刀片

  曙光TC2600刀片服务器提高了机群的计算密度、集成功能和管理能力,提供卓越的计算处理性能、简单方便的部署使用和全方位的监控管理,可以显著提高计算载体的计算密度和管理效率,最大限度地降低科研在IT方面运营和管理维护成本。

  2. 独立刀片解决方案

  2.1. 方案概述

  在研究组级的解决方案中,用户需求主要受到研究经费的规模和实验室场地的限制,无法与院系一级的计算平台的规模和运营环境相比,但是这部分客户又是最迫切需要计算平台,也是物理化学领域研究的中坚力量。

  曙光公司推出了独立刀片解决方案,主要依据曙光刀片服务器集成度高,管理性好的特色,在曙光公司众多成功案例的基础上,可以满足研究组级方案的苛求需求。

  一台独立的TC2600服务器,如果全部采用四核处理器,具有80核个计算核心,6400亿次理论浮点计算能力,已经接近入围2006年中国TOP100的标准,基本能够满足5个计算人员的计算需求。曙光TC2600支持Linux/Windows/WCCS等主流操作系统,可以灵活部署不同计算化学和材料物理领域的软件。

  7U高的曙光TC2600刀片服务器占地面积仅比一台塔式服务器略大,我们可以采用独立一台TC2600服务器作为小规模机群解决方案,这样可以避免41U(2米高)标准机柜占地和动力电扩容的扩容的困难。在未来规模扩大时,也可以作为刀片机群中的一部分和其他节点配合使用,不会浪费用户的投资,避免购买不同机群时,机群迁移的困难。

  模块化的硬件设计、可靠的基于web界面的监控和KVM over IP界面,使得使用者无论硬件安装还是系统管理上更容易入手,节省了研究组的宝贵科研时间,解决了额外配备管理人员的困难。

1页

  2.2. 配置

  

  计算刀片  

  TC2600刀片柜  

  刀片柜,19”标准,7U,可插10个刀片模块,高可用的机箱中板设计;  

    

  1  

  刀片模块  

  10×计算刀片模块:
2×AMD Opteron 2350
四核CPU(主频2.0GHz2MB L2 Cache8GB DDRII 533 ECC Register内存, 1×80GB SATA硬盘  

  交换模块  

  千兆交换模块;每个交换模块可对外提供4个千兆RJ45接口;  

  管理模块  

  管理模块;可实现共享USB功能、KVM切换、刀片状态、故障定位、开关机等全方位管理控制监视功能;  

  刀片中文管理软件  

  基于Web浏览器的管理方式,可提供所有组件的最新状态及图形标示的详细信息;实时状态监控、故障预警,动态优化调整资源配给和工作策略;保存并统计分析关键历史数据;直观显现重要信息的变化趋势;多种错误故障报警方式,日志、审计和报表可供查询;允许加密的远程控制,可从任何位置控制操作及监控整体运行状况  

  3. 大规模刀片计算机群解决方案

  3.1. 设计原则

  曙光TC2600刀片服务器也可以作为机群中的基本构建单元组成刀片计算机群。在搭建刀片计算机群中,我们需要考虑刀片服务器的特点,和机群方案进行结合,充分发挥刀片服务器密集度高的特点。

  * 实际原则,从用户实际需求出发,遵照实际情况确定方案的选择与实施。

  * 经济原则,刀片机群系统采用广泛应用且具有良好性能价格比的产品,既考虑节省投资,又保证产品的先进性和可用性。

  * 完整原则,曙光机群的解决方案是一套针对特定领域、完整的高性能解决方案,无论从软硬件选择,具体根据用户的应用需求;特别的,我们在方案中还能根据我们的成功案例实施的情况,对于用户的管理和运行模式提出自己的建议。

  * 扩展原则,系统支持动态扩展,在系统性能需要提升时,可以很方便地进行扩展。

  * 易管理原则,机群服务器的管理方案非常简便,即保证了用户使用的方便性,也可以保证系统管理的有序性,高效性,避免管理上的混乱

  3.2. 方案配置

曙光TC4000高性能计算机

品目

设备名称

组成单元

单位

数量

节点机

计算刀片柜1

曙光TC2600刀片柜

曙光TC2600刀片柜,可插10个刀片模块,

4

刀片模块

10×计算刀片模块:
2×AMD Opteron 2350
双核CPU(主频2.0GHz),8GB内存, 1×73GB SAS热插拔硬盘

网络模块

直通网络模块(Pass-though)

交换网络模块(Switch Module

管理模块

管理模块

IO节点

曙光天阔A620r-F

2*Opteron 2218处理器2.6GHz8G内存,73G热插拔SCSI硬盘,RAID 1光纤HBA

1

接入节点

曙光天阔A620r-F

2*Opteron 2218处理器2.6GHz8G内存,73G热插拔SCSI硬盘,RAID 1

1

 控制台&视频切换子系统(SKVM)

控制台

内置控制台

19"标准,1U,含液晶显示器、8个标准VGA接口、笔记本键盘、笔记本鼠标、标准机柜上架套件

1

 网络子系统

高速计算网络

InfiniBand高速网络

1×Infiniband交换机9040484X端口

1

41×Infiniband HCA10Gb/s,单端口Memfree

41×InfiniBand铜缆

数据交换网

千兆交换机

48口千兆交换机

1

管理网

百兆交换机

24口百兆交换机

1

 存储子系统

存储系统

曙光存储

DS-8340FF,光纤盘阵,3U机架式,16槽位,双冗余电源,4个光纤主机通道

1

11×300GB SATA硬盘

2页

  4. Materials Studio计算机群解决方案

  4.1. Materials Studio软件刀片解决方案

  Materials Studio软件是Accelrys公司专为材料科学领域开发的的材料计算软件。Materials Studio软件采用Client/Server结构,客户端基于Windows系统,计算服务器可以进行灵活的配置,使得任何研究人员可以在熟悉的界面下轻易获得强大的计算模拟能力。客户可以从PC客户端向专用的Windows 系统、UNIX或Linux单个服务器提交计算,也可以向拥有大量计算资源的高性能计算机提交任务。工作可以在不连接模式下计算,这样他们与客户PC上的资源无关。Materials Studio软件在科学计算可视化方面具有独到领先的特色,极大的降低计算软件使用和数据分析的难度,受到科研人员的广泛欢迎和使用。遗憾的是,Materials Studio软件价格昂贵,所需计算有限,因此在设计方案中,我们必须要考虑到这点。

  小型研究组原来采用的Materials Studio的解决方案主要是用户个人电脑加上一台昂贵的4路UNIX小型机,性价比非常低。曙光在自主研发的曙光TC2600刀片服务器的产品上,参考独立刀片解决方案可以为用户提供替代UNIX小型机的方案。

  4.2. 方案配置

计算刀片

TC2600刀片柜

刀片柜,19”标准,7U,可插10个刀片模块,高可用的机箱中板设计;

1

License

服务器

1个计算刀片模块

2×AMD Opteron 2216双核处理器,2GB内存, 1×80GB SATA硬盘,Windows 2003,主要用于安装License,向其他接入台式机提供License验证服务,同时可以在该刀片模块上也可以建模,提交任务

Gateway

服务器

1个计算刀片模块

2×AMD Opteron 2216双核处理器,2GB内存, 1×80GB SATA硬盘,Linux,主要用于安装Gateway服务器,也是计算的一部分

刀片模块

计算刀片模块

2×AMD Opteron 2220 双核CPU8GB内存, 1×80GB SATA硬盘,作为计算节点使用,由于Materials Studio License非常昂贵,因此需要追求单处理器核心处理能力高

交换模块

千兆交换模块;每个交换模块可对外提供4个千兆RJ45接口;

管理模块

管理模块;可实现共享USB功能、KVM切换、刀片状态、故障定位、开关机等全方位管理控制监视功能;

刀片中文管理软件

基于Web浏览器的管理方式,可提供所有组件的最新状态及图形标示的详细信息;实时状态监控、故障预警,动态优化调整资源配给和工作策略;保存并统计分析关键历史数据;直观显现重要信息的变化趋势;多种错误故障报警方式,日志、审计和报表可供查询;允许加密的远程控制,可从任何位置控制操作及监控整体运行状况

控制设备

控制设备

17 LCD显示器,鼠标,键盘

 

 

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
IT热词

服务器论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品