正在阅读：万亿次计算未来CPU+GPU承载超算未来万亿次计算未来CPU+GPU承载超算未来

2012-09-14 09:03 出处：PConline原创作者：Echo 责任编辑：xujian1

1未来CPU+GPU承载超算未来回顶部

　　【PConline 资讯】随着超级计算机在国内的迅猛发展，不难发现全球几大知名的超算榜单上很多系统都是GPU构建的。在今年6月份刚刚发布的TOP500超级计算机榜单中，我们发现共有52套系统采用了英伟达GPU。GPU以其独有的技术优势已经迅速成为打造全球顶尖超级计算机的关键技术。

GPU
NVIDIA时代

　　由于GPU可以通过并行度的提升获得整体高性能计算性能的大幅提升，因此越来越多的超级计算机开始使用GPU来构建系统，并且也给浪潮公司等IT厂商共同推进GPU在中国的发展及应用带来了重要的发展契机。

　　随着GPU的计算能力被进一步挖掘出来，GPU越来越被市场所认可，GPU尤其在并行计算领域，以其强大的运算能力，在视频处理、石油勘探、生物化学等行业取得了巨大的成功，这一市场也被各家厂商所认同，分别推出产品以期占领先机。

超级计算机模拟太阳黑子真面目

　　在越来越多的领域，GPU所表现出来强大性能提升正在逐步蚕食传统的CPU市场。在航空航天装备研制、卫星遥感数据处理、气象预报、海洋环境数值模拟、石油勘探数据处理、生物医药研究、金融工程数据分析、新材料开发和设计、计算结构力学、生命科学计算、流体动力学、计算机视觉、数据挖掘、数值分析（这几个领域用加重或有色字体以示突出）等领域，GPU计算正在发挥出强大的能量。而传统上这些计算属于使用CPU计算领域，用户为了完成这些运算，会选择工作站、刀片甚至集群方案。相对CPU方案，GPU方案具有价格低、速度快等优点，无疑非常适合用户使用。

　　但是在英伟达和浪潮这几年推进GPU计算的具体业绩当中，很明显的能看到GPU面临的一些挑战：如在并行计算上的挑战，编程效率上的挑战，大规模计算性能上的挑战，而归根结底这些都是人才的问题，如果有足够解决并行计算、编程、以及大规模计算性能方面挑战的人才的话，相信很多问题就能迎刃而解。>>

英伟达GPU为俄顶级超级计算机提供计算能力
//servers.pconline.com.cn/skills/1203/2723743.html

英伟达携手浪潮共同发布GPU卓越人才计划
//servers.pconline.com.cn/skills/1209/2940078.html

MIC众核加速技术剖析将亮相2012HPC用户大会
//servers.pconline.com.cn/skills/1209/2937770.html

浪潮百万亿次神机妙算南海海洋气象预报
//servers.pconline.com.cn/skills/1208/2901773.html

如果您有什么服务器问题，请点击以下链接，进入PConline产品论坛讨论：
//itbbs.pconline.com.cn/network/f768799.html

2GPU计算的发展历史回顶部

GPU（图形处理器）计算的发展历史

　　GPU是相对于CPU的一个概念，由于在现代的计算机中图形的处理变得越来越重要，需要一个专门的图形的核心处理器。NVIDIA（英伟达）推出了第一款 GPU（图形处理器）。

GPU

　　1999-2000 年间，计算机科学家，与诸如医疗成像和电磁等领域的研究人员，开始使用 GPU（图形处理器）来运行通用计算应用程序。他们发现 GPU（图形处理器）具备的卓越浮点性能可为众多科学应用程序带来显著的性能提升。这一发现掀起了被称作 GPGPU（GPU（图形处理器）通用计算）的浪潮。

　　进入21世纪，为了解决CPU发展遇到的上述瓶颈，x86处理器进入了多核时代，GPU也进入了通用处理时代。GPU设备的高浮点运算能力受到越来越多的科研人员所青睐。

　　其实GPU（图形处理器）计算模型就是在一个异构计算模型中同时使用了 CPU 和 GPU（图形处理器）。应用程序的顺序部分在 CPU 上运行，计算密集型部分在 GPU（图形处理器）上运行。虽然应用程序使用了 GPU（图形处理器）的卓越性能来提升运行性能，但对用户而言，他们所能感知到的将仅仅是运行速度更快的应用程序。

性能差异

　　应用程序开发人员将需要修改其应用程序中的计算密集型内核，并将其关联到 GPU（图形处理器）。应用程序的其它部分将仍然依赖于 CPU 进行处理。将一项功能关联到 GPU（图形处理器）需要重写功能，以在其中支持并行处理，同时添加“C”关键字以在应用程序和 GPU（图形处理器）之间往返传输数据。

　　GPU（图形处理器）计算得到了 NVIDIA（英伟达）被称作 CUDA 架构的 GPU（图形处理器）大规模并行架构的支持。CUDA 架构由 100 多个处理器内核组成，这些内核能够协作运行来处理应用程序中的数据集。>>

3浪潮率先发布GPU超级计算机回顶部

浪潮看准GPU市场率先发布基于GPU的超级计算机

　　　2009年浪潮正式推出业界首款万亿次桌面超级计算机——“倚天”，售价仅为5万元。可以说浪潮“倚天”的问世，标志着我国在桌面超级计算机领域已经达到国际领先水平，将极大缓解高性能计算资源紧张的局面，有效提升我国基层科研水平，推动我国科研计算轻松步入“万亿次普及时代”。

浪潮“倚天”NF5588

　　据了解，“倚天”是“浪潮高效能服务器和存储技术国家重点实验室”的重要研发成果，其峰值计算能力最高可达4万亿次/秒，相当于40台服务器或200台PC的计算力，体积与普通计算机相仿，而成本只有传统高性能计算系统的1/5。

　　“浪潮‘倚天’打破了原有的高性能集群思路，采用协同加速架构，实现了在单台计算机上性能的倍速提升，而成本的大幅度下降，有效解决了用户在应用传统高性能集群时，所面临的成本、体积、功耗、部署等一系列问题，大幅提升国家科研竞争力的水平。同时，倚天也成功开创了桌面超级计算机这一细分市场，并将这一领域的起步水平直接提升到万亿次以上。”浪潮集团高级副总裁王恩东介绍说：“更重要的是，‘倚天’的问世，标志着浪潮高性能战略步入一个新的阶段，围绕协同加速的创新架构，浪潮将不遗余力加大高性能应用软件的移植和开发，真正让中国用户‘用得好、用得上’高性能平台，才是浪潮高性能发展的硬道理。”

　　“倚天”能取得这个成绩的全部奥秘，就在于“倚天”采用了nVIDIA开发的Tesla协处理器。

tesla
NVIDIA Tesla

　　在NVIDIA的官方网站，是这样描述Tesla的：NVIDIA Tesla计算解决方案实现了向节能型并行计算动力的必要转变。每颗Tesla处理器拥有240个核心并且基于革命性NVIDIA CUDA 并行计算架构，Tesla支持扩展，可更快、更精确地解决世界上最重要的计算难题。

　　简单的说，Tesla的价值就在于用GPU的形式来担负在传统集群架构中由通用CPU负责的密集计算的功能。因为Tesla设计的架构优势，在处理某些密集高性能计算的问题时，Tesla能够达到通用CPU10——20倍的性能。

Tesla架构

C+G架构代表 Tesla逻辑架构

“倚天”采用的这种新的高性能计算架构，被通俗的称为“C+G”架构，“C”就是通用CPU，而G就是GPU Tesla。

　　今后和未来，GPU将重新定义高性能计算，计算架构将是并行核心GPU与多核CPU串联运行的混合型系统，配备GPU将成为超级计算机的发展趋势；而这些计算机将在更多的领域内得到更广泛的支持和应用，并将曾经不可能实现的科学极限变为现实。>>

4X86、GPU不是关键关键是能耗回顶部

X86、GPU不是关键关键是能耗

　　随着摩尔定律的进化，超级计算机的性能也正在迅速提升，但因此带来的功耗问题也越来越显著，比如一度全球最快的我国天河一号A，要想达到百亿亿次计算级别，必须付出16亿瓦的耗电量，相当于200万个家庭的用电量。未来技术发展会更快，性能飞速发展的同时，功耗则是厂商需要仔细考量的问题了。

NVIDIA
NVIDIA

　　关于能耗问题，NVIDIA公司全球副总裁兼中国区总经理张建中有着明确的考虑。他在接受我们采访时表示，“要完成天河一号计算水平，如果全部换成CPU的话，X86的架构必须药美国的一年的发电量才够用。如果建一个世界上第一大超级计算机的话，则要专门建一个核电站来给超级计算机供电，这是不现实的。但是作为GPU应用的话，它的能量功耗性能至少减少10倍以下。这就是GPU的优势所在。”

　　GPU强大的并行运算能力可以看的一清二楚，而这一点也完全可以从GPU与CPU的对比中看得非常清楚，CPU由于架构的原因以往一直都通过提升制程工艺和主频上来下手，但这迟早会遇到壁垒，而于此同时GPU却的性能以每年2.8倍的速度增长。

　　而在CPU与GPU的性能比较方面，如果说CPU一条单车道公路，一次只能走一辆车的话，GPU就是拥有多个车道的高速公路，正式大量并行的结构使得其在浮点运算方面拥有了非常块的速度，而在GPU基础上发展起来的GPGPU（通用图形处理器）很好地继承了这一优点，其具有比CPU高一个数量级的浮点性能，因此在注重运算速度高性能领域被格外看好。

gpucpu

　　因此将并行运算能力更为强大的GPU释放出来，与CPU相结合进行运算，开始成为超级计算机领域一个新的解决方案。更何况GPU的架构虽然简单，如果在超级计算机中增加一块GPU，耗能与CPU不相上下，计算能力却可以提高10倍之多。英伟达从自己擅长的领域中最先发现了这样的机会和可能。

　　正因如此，张总表示：“所以能根据需要去开不同的计算量，很灵活性应用的技术用于各个领域才是最重要的。当然对于芯片厂商来说，有每年都在攻关的三大难题——cheaper、faster、better。什么意思呢？也就是说芯片需要做的一代比一代更快，一年比一年更好，却要一年比一年便宜。”>>

5GPU加速所面临的人员匮乏回顶部

GPU加速所面临的人员匮乏

　　虽然GPU在并行处理方面的优势获得了普遍承认，但其未来发展的道路上还有不少的挑战，这其中一部分是由于历史原因造成的，而另一部分是市场发展造成的技术人员匮乏。

　　可是仅靠芯片厂商的努力是无法解决如此大的市场空缺的，正如NVIDIA公司全球副总裁兼中国区总经理张建中所说“目前中国的硬件跟世界水平同步，但是应用比国外要落后。主要原因就是GPU在各个行业应用当中人才缺乏。某一些领域中国走的很前，很早，比如过程控制，石油勘探ITM应用，中国走得很快。但是在生命科学、在其他国防应用，等领域的话就走得比较慢。

　　还有中国的GPU的应用中科研性的应用比较多，生产性的应用比较少。那科研性的应用大部分是在高校，科研机构，但是生产性的应用就会变成是有一个脱节，这虽然和国家的各个体制也有关系。当然最主要的原因还是在各个企事业单位，尤其是在科研跟企业的连接性方面都很缺乏，所以也促成了浪潮和NVIDIA推动GPU人才培养的一个计划。”

　　对此，浪潮集团高性能服务器总经理刘军先生表示“浪潮一直跟一些行业做GPU开发包括合作，比如OEM、清华大学、中国石油都在合作，并且也取得了开发的成果。这个过程当中浪潮跟用户是一个团队，这个团队当中就已经包括人才培养和培训的计划，但是那个计划可能不是对社会对外去做的。

浪潮集团高性能服务器总经理刘军

　　比如中石油他的人才也不可能学好了以后做其他的一些应用，这就是浪潮已经在做的工作。浪潮为什么要对社会来开放，对更多人才来培养呢？就是考虑到了“众人拾柴火焰高”，只有少数人的力量是很有限的。现在GPU的应用在各个领域当中都需要去开发，都需要去扩展，才可以让我们某一个行业的用户彻底得到满足。”

　　NVIDIA公司全球副总裁兼中国区总经理张建中认为“培养学生参加培训的话肯定还有自己的想法，未来找工作。前期企业应用会更多，为什么这么讲呢？这个GPU计算是一个大的趋势，大家都认可，都知道，这里面蕴藏了很多的商机，今后软件应用，谁能够走得更快谁就能够超越你的对手，所以说大量的商机就会促使各个行业的应用不停的对GPU人才的追求很多。

英伟达
NVIDIA公司全球副总裁兼中国区总经理张建中

　　像有的企业宁可自己出钱派他们的人员参加培训，让他们能够回到企业当中帮他们提高GPU的应用，这些都会很多。当然如果说学生自己有这个前瞻性，把自己培养成一个GPU应用的专业人才，那这些企业就会很容易的帮你找到一个合适的位置，让你会发挥更多的作用。

　　经济社会一切以引领效率为基础，所以GPU计算为什么能够在国外那么火？最大的原因是用更少得钱经济投入，更高的效率，然后获得不可想象的性能，这个几乎是满足了所有行业的需求。目前，欧美等国家已经有一些专业的认证培训机构或组织，如ANEO，CAPS，HPC Project等。相比于国外市场，中国基于CPU-GPU认证培训由于人才、市场等原因，基本属于起步阶段。因此，想要在中国落实市场共识和推动产业发展的关键，就需要确实促进应用人才的培养，掌握异构计算技术应用认证领域货真价实的技术，这样才能够某天在全球超算领域真正的强大起来。[返回频道首页]