正在阅读：CPU遭遇瓶颈效应 GPU催热桌面高性能计算CPU遭遇瓶颈效应 GPU催热桌面高性能计算

2010-06-23 18:00 出处：PConline原创作者：菠萝果汁责任编辑：liuyu1

在本页浏览全文

　　NVIDIA Fermi双精度计算

Fermi CUDA core
Fermi CUDA核心

Fermi内核
Fermi CUDA核心

　　Tesla Fermi的理论浮点运算能力

　　Fermi改变了GPU功能执行方式，单精度模式下每个时钟循环均可执行512个积和熔加运算(Fused Multiply-Add/FMA)，双精度下则是256个。

　　双精度:SP频率*2Float*256（Fermi最大CUDA核心数）= X GFLOPS

　　单精度:SP频率*2Float*512（Fermi最大CUDA核心数）= X GFLOPS

　　对于实际上市产品C2050来说（448个1.15GHz CUDA核心）

　　C2050双精度浮点运算能力 1.15*2*448*0.5=515.2 GFLOPS

　　C2050单精度浮点运算能力 1.15*2*448=1030.4 GFLOPS

　　AMD RV870

AMD CORE

　　AMD依然沿用了之前的RV6XX与RV7XX的架构，也就是我们通常理解的5SP 4D+1D约等于一个完整的核心,而RV870具备320个4D+1D。单精度浮点（32位）5个MAD（StreamCores的4个+SFU里的1个），双精度浮点（64位）1个64bitMAD。

　　双精度：SP频率*2Float*320（RV870最大流处理器数）= X GFLOPS

　　单精度：SP频率*2Float*320*5（RV870最大流处理器数）= X GFLOPS

　　这样看来，RV870的双精度浮点运算能力只有单精度的5分之1。这也是延续了RV670,RV770架构的原因。

再来看下我们这个月初测试的，基于Nehalem-EX E6540的Dell R810表现吧。

Xeon E6540相关参数

Xeon E6540运算能力

　　一颗6核12线程主频2GHz的Nehalem-EX Xeon的浮点运算能力为129.19GFLOPS（单精度）。约为一颗Tesla C2050浮点运算能力的8分之1。 >>

键盘也能翻页，试试“← →”键

服务器产品报价

服务器排行榜最新报价

品牌: IBM 戴尔惠普联想 SUN 华硕曙光易腾强氧正睿

价格: 1万元及以下 1-2万元 2-5万元 5万元及以上

CPU系列: 至强E7 至强E5 至强E3 至强7000 至强5000

热词：塔式服务器机架式服务器刀片式服务器

聚超值

热门排行

京东索泰ZOTAC服务器旗舰店五一大放价，多款机型折上加礼 0

服务器论坛精选

进入论坛>>

IT百科 热门专题

热门经销商

北京上海广州深圳分站

服务器论坛帖子排行

最高点击 最高回复 最新

汽车资讯

正在加载中...

成都车展宏光MINI EV 普拉多欧拉黑猫途达起亚嘉华玛奇朵皇冠陆放奔驰C级哈弗神兽坦克600 奥迪Q5 思域卡罗拉双擎E+ 轩逸太平洋汽车网app 新能源车

最新资讯离线随时看 聊天吐槽赢奖品

正在阅读：CPU遭遇瓶颈效应 GPU催热桌面高性能计算CPU遭遇瓶颈效应 GPU催热桌面高性能计算

为您推荐

服务器产品报价

聚超值

服务器论坛精选

服务器论坛帖子排行

汽车资讯