6.fft_example (傅里叶变换) 测试结果:如图5左侧所示为1U服务器进行傅里叶变换的结果曲线,表示随矩阵规模的增大,计算时间也随之增加,在矩阵规模为1000时的计算时间约为15毫秒。 如图5右侧所示为在“倚天”上进行傅里叶变换的结果曲线,其中红线为基于“倚天”CPU的运行时间曲线,绿线为基于“倚天”GPU的运行时间曲线,蓝线即为相应的矩阵规模下“倚天”GPU相对于“倚天”CPU的加速比曲线。从结果显示,在矩阵规模为1000阶时,“倚天”GPU的运行时间仅为1毫秒,相比1U服务器性能提高了15倍之多。 并且我们很容易发现,随着矩阵规模的增大,“倚天”GPU计算的优势变得更加明显,相对于CPU的加速比一直处于增加的趋势。 7.blas_example (线性代数运算) 测试结果:如图6左侧所示为1U服务器进行线性代数运算的结果曲线,表示随矩阵规模的增大,计算时间也随之增加,在矩阵规模为2000时的计算时间约为140毫秒。 如图6右侧所示为在“倚天”上进行线性代数运算的结果曲线,其中红线为基于“倚天”CPU的运行时间曲线,绿线为基于“倚天”GPU的运行时间曲线,蓝线即为相应的矩阵规模下“倚天”GPU相对于“倚天”CPU的加速比曲线。从结果显示,在矩阵规模为2000阶时,“倚天”GPU的运行时间仅为50毫秒,相比1U服务器性能提高了2.8倍。 可以看到,同傅里叶变换的测试类似,随着矩阵规模的增大,利用GPU进行线性代数运算的优势更加明显,相对于CPU的加速比一直处于上升的趋势。 五、测试结论: 由以上涉及工程与科学绘图、图形图像处理以及数值运算等应用领域的7个Matlab算例的测试结果可以看出,“倚天”无论在计算运行时间上,或是在图像模拟的质量、真实感和实时性上,都要相比主流配置的1U服务器性能优越很多,性能加速的倍数因应用算例不同而略有差异,在几倍到几十倍不等,个别算例甚至可以提高100多倍。 目前,数以万计的软件开发人员正在使用免费的CUDA软件开发工具来解决各种专业应用程序中的问题。浪潮“倚天”凭借创新的协同计算加速架构,在低成本的范围内实现了计算性能万亿次的突破,并且以优化的单机产品形态,破解了系统功耗、体积、噪音、便携性等一系列难题,进一步降低了HPC的应用门槛,为高性能计算的发展开辟了新的天地。 相信GPU高性能计算技术在生命科学、工程科学、石油天然气勘探、金融、医学成像以及视频与音频处理等高性能计算领域有着广阔的应用前景,浪潮“倚天”的普及将为广大科研机构及企业带来计算性能的巨大提升,同时也为我国高性能计算的普及开拓了新的路径。 (本文作者为浪潮高性能服务器产品部资深工程师 吕文静) |
正在阅读:浪潮“倚天”桌面超算高性能计算实测浪潮“倚天”桌面超算高性能计算实测
2009-07-20 14:22
出处:PConline原创
责任编辑:wenzhicheng
键盘也能翻页,试试“← →”键
本文导航 | ||
|