正在阅读：倚天剑在手高性能计算第二次浪潮倚天剑在手高性能计算第二次浪潮

2009-03-09 10:24 出处：PConline原创作者：老笨责任编辑：huangjianjun

　　通用CPU要面对更复杂更宽泛的处理任务，例如从事务处理、高性能计算。相比GPU，通用CPU在软件兼容性以及处理带有分支判断的任务时具有巨大的优势。但是在某些高性能计算领域，其效能相比为密集计算专门优化的GPU要差很多。

　　GPU通常都设计了众多的处理单元，例如nVIDIA的Tesla就有240个处理核心，这些处理核心在并行处理大数据量的高性能计算问题时具有巨大的优势，这也就是“倚天”系统能够超越传统机群的原因。

　　Tesla的出现，是因为在很多高性能计算的领域，例如地震模拟、生命科学、金融工程、医学成像、模式识别、CAD/CAM/CAE等领域，都拥有巨大的数据量需要做相同或者相似的处理，而且这些数据的处理是可以高度并行的，或者说数据的处理不需要有严格先后顺序。处理这些问题最佳的办法就是增加处理核心。

Tesla架构

C+G架构代表 Tesla逻辑架构

　　但是通用处理器需要解决的很多问题都是有严格的前后顺序限制，后一步处理依赖前一步处理的结果，因此通用CPU有很强大的分支判断能力，并且为了提高处理效果，在CPU内部集成了3级缓存来提高CPU与内存的通讯效率。因为分支判断的问题，通用CPU的内核并不是越多越好。越多的处理内核意味着更复杂的同步机制，意味着处理器核心的设计将更加困难。

　　正式因为CPU和GPU是针对不同应用设计的计算器件，所以他们在处理不同问题时才会有完全不同的表现。CPU长于逻辑判断和分支处理，而GPU长于海量并行计算。

　　在C+G的模式想，CPU将待处理的数据集通过PCIE接口传给作为一张附加卡形式的GPU，这块卡上不光有GPU，还有数ＧＢ的内存，GPU处理完数据后，将结果传回给CPU，然后在开始下一个循环。

　　从目前的情况看，经过编程优化的处理任务在C+G的模式下确实能够取得突破性能的性能提升。这样高性能计算平台价格就能够因为这种架构而大大降低成本。这对很多科研项目而言无疑是一个好消息。

　　实际上不仅仅是nVIDIA沿着C+G的模式推动高性能计算的普及，包括Intel也已经宣布推出所谓的“众核”产品，其第一款产品代号就是Larrabee。

　　当然，普及高性能计算并不那么简单，问题到不是出在需求方面。高性能计算的需求现在越来越强劲，例如给奥运开模式做动画渲染的水晶石公司就有非常强劲的需求。他们购买的曙光5000机群基本上处在满载运行的状态。除来动画设计外，他们有大量的建筑渲染的任务要处理。

　　另外水晶石公司还有一个数字城市的项目，用三维立体来实时展示城市，实际上他们正面临处理能力不够的困局。

　　上海超算中心的情况与水晶石的情况相似，虽然上海超算中心前不久刚拥有了排名世界第十位的机群系统，但是上海超算的计算任务也基本上一直处于饱和状态，从科学研究到工程应用。上海超算中心的负责人曾经用“无所不在”来形容高性能计算的需求。他举例说从井盖的设计到胸罩的设计，都可以用到超算，前者是一个力学问题，后者是一个流体力学问题。现在设计和工程应用高性能计算不普及，原因不是没有需求，而是高性能计算还是过于昂贵，并不是普通机构能够拥有。

　　人类基因组工程也同样要用到高性能计算，每个人有数十亿个基因，到目前为止全球也不过测定了约1000个人的基因。如果想从基因中寻找众多疾病的诊断及治疗办法，就需要测定更多人的基因并同这些人的病史相互关联。

　　高性能计算从最微小的原子分之研究领域到最宏大的宇宙研究，都是不可缺少的工具。而在工程上也有非常多的成熟应用，典型的如飞机设计制作，汽车设计制作以及碰撞试验等等，都离不开高性能计算。

　　但是事情并不是那么简单，并不是有了C+G的架构，业界就找到了解决高性能计算的灵丹妙药。因为体系结构的变化，类似“倚天”这样的系统要真正发挥效用，还必须进行重新进行软件开发。