5.曙光公司基因比对解决方案 曙光公司专著于为用户提供高性能计算领域的全套解决方案。经过十几年的积累,曙光公司具有独特的优势: 1,熟悉应用,高性能集群系统针对应用特点而定制; 2,专业化、高性能的集群中间件; 3,专业化的各应用领域人才,保障用户应用的顺畅。 目前,各种基因序列比对软件在曙光的系列高性能集群系统上都得到了部署和应用。 基因序列比对的对计算资源的要求不断提高,一方面是由于数据库不断增大,另外一个原因是检索时需要进行匹配的序列数据增多。这使得检索速度会变慢,并且随着数据库的进一步膨胀,比对的速度将会使用户不可忍受。 同时,每一种生物的基因序列数据都是一个极其庞大的数据,必须将它分解成几个基因序列数据库。一般典型的基因序列数据库大小在100MB~500MB之间,需要将数据库序列数据映象到内存中,这将会消耗大量的时间用于数据库数据的I/O操作,并且在运行中消耗大量的内存资源。 总结来说,基因比对应用有三个特点: 1)检索速度慢; 2)对系统的I/O的要求高; 3)程序消耗内存大 机群系统可以为序列比对提供一个高性价比的应用平台,机群系统的特点非常适合序列比对的应用。 整个系统包含如下组成部分: 计算节点:用于计算,根据用户的实际需要选择配置和数量; 管理/登陆节点:用于系统的管理和外部接入; I/O节点:连接磁盘阵列,提供网络共享文件系统; 计算网络:连接计算节点,使用高性价比的千兆以太网; 数据网络:和计算网络共用一套千兆以太网; 管理网络:配合集群中间件,对集群实现统一管理; SKVM网络:大规模视频切换系统,实现本地化管理; 方案拓扑图 曙光高性能机群系统非常适合于基因序列比对的应用:
1,曙光机群系统提供了一个高性价比的方案。 2,序列比对软件都可以在曙光机群系统上得到无缝部署和应用。 3,机群中的各个节点可以同时运行多个串行查询的应用。 4,机群系统安装了mpi并行环境,可以运行并行版本的序列比对软件。机群系统很适合并行基因查询,如mpiBLAST的应用。 6.典型成功案例 用户单位:华大基因中心 应用:基因测序为主体的生物信息学应用 2000年7月,曙光公司与华大基因研究中心共建生物信息学联合实验室,华大向曙光订购了2套天潮2000-Ⅱ超级服务器,采用“全基因组鸟枪法”来进行测序工作。曙光高性能计算机使得华大基因中心的计算能力与测序能力相匹配,在人类基因组计划16个成员单位中位居第7位。 2001年,华大又向曙光购买了一套天潮3000服务器,保证了其快速和高质量完成丹麦猪和超级杂交水稻基因图项目。
|