正在阅读:三年磨一剑:RISC处理器新代表 Power7三年磨一剑:RISC处理器新代表 Power7

2010-12-18 02:47 出处:PConline原创 作者:佚名 责任编辑:xiongxuehui

Power7详细参数:
   

power7
图1:Power7

  典型的Power7处理器是单晶片的,具有八个核心,另外也提供4核与6核型号。晶体管数量为12亿,核心面积567mm2。采用的是IBM的45nmSOI铜互联工艺制程。

  从图2可以看到Power7处理器的内部结构,8个核心,三级缓存,Power7同时还集成了两个四通道DDR3内存控制器,持续内存带宽100GB/s,每个通道的速度为6.4Gbps,最大可以访问32GB(使用两根16GB内存条)。Power7处理器最大可以访问256GB。SMP带宽360GB/s,整个芯片总带宽高达590GB/s。

  缓存设计上,Power7处理器可谓是高速缓存的佼佼者,每个内核都独占32kb的一级缓存和256KB的二级缓存,另外多达32MB的三级缓存是八个内核共有的。与广泛采用的SRAM(Static RAM,静态内存)不同的是,Power7处理器使用的L3缓存属于DRAM(Dynamic RAM,动态内存),IBM为了避免SRAM技术的规模庞大且成本高昂的弱点,转而采取一种名为E-DRAM的技术,使得晶体管的总数、芯片面积都得以减小。

  “Power7晶体管的总量保持在12亿个左右,而如果我们将所有的缓存都通过静态RAM来完成,那么晶体管的数量肯定会超过20亿个”IBM技术人员如是说。对比同类处理器,八核心的Nehalem-EX具有23亿个晶体管。

结构
图2:Power7芯片结构

  除了多核带来的运算性能优势外,Power7每个核心的结构也非常复杂。每个核心都具有12个相对独立执行单元,包括两个整数单元(FXU)、一个十进制整数单元(DFU)、四个向量/标量扩展浮点单元(VSXFPU)、四个存取单元(LSU)和一个条件寄存器/分支单元(CRU/BRU)。

 单核
  图3:Power7单个核心结构

  Power7是OOOE(Out-of-Order Execution,乱序执行)架构的处理器,与上一代POWER6的IOE(In-Order Execution,顺序执行)。顺序执行的结构简单,可以获得较高的运行频率,乱序执行则可获得更好的运行效率。Power7在每个时钟周期可以分发6条指令,Nehalem-EX则是4条。

  强大的执行能力让Power7可以具有更多的线程能力:每个Power7的内核具有4个同步多线程的处理能力,8核的Power7处理器同时具有32个线程的处理能力,是同为8核的Nehalem-EX的两倍。

  Power7的一个重点是多路处理器,实现了32路SMP(Symmetrical Multi-Processing)能力,Power7是通过三个方面的设计来达到32路SMP能力:巨大的带宽、特别的拓扑结构和特别的一致性协议。

带宽:
  Power7处理器拥有出色的I/O性能,其集成有两个四通道的内存控制器,可以连接DDR3内存。Power7持续内存带宽100GB/s,SMP带宽360GB/s,整个芯片总带宽高达590GB/s。
   
拓扑结构:
  Power7一个两层的拓扑模型,4个处理器组成一个本地SMP组(需要7个本地I/O总线),然后8个SMP组之间两两直接互联(每个SMP组需要7个外部I/O总线),为了实现这个目标,Power7提供了两个总线:一个用于本地SMP,一个用于远程SMP。总线的位宽是120Byte。
   
协议:
  Power7的一致性协议混合了两种一致性消息的广播方法:一种是全局广播,一种是本地SMP组的猜测性广播。这个一致性协议定义了13种状态(Nehalem使用的MOESI是5种),并通过缓存线上额外的设置位,Power7最终实现了复杂的结构,在32路处理器、8核心、总共256个处理内核的SMP系统里,可以同时维持20000个缓存一致性操作。

键盘也能翻页,试试“← →”键

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多

服务器论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品