最快的IBM处理器z196

时间:2011-09-03

  IBM公司(International Business Machines Corporation)在周二的Hot Chips 2010大会上开始讨论起,这款产品首次发布于7月29日,出货日期在9月份,IBM并没有太多地透露太多关于系统的新四核处理器的技术和性能的信息,直只说了新型主机的处理器主频为5.2GHz,是"快的微处理器".如果单单看原始主频的话确实如此。除了高主频之外,还有更多与z196处理器相关的信息。

    这种芯片是IBM在纽约州Poughkeepsie的工程师设计的,由IBM在纽约州 East Fishkil的300毫米晶圆加工厂采用45纳米SOI加工工艺生产的。IBM在奥斯汀、德克萨斯州、德国、以色列和印度的实验室都为z196芯片做出了贡献。

  四核z196处理器与4.4GHz的四核z10处理器有很多地方类似。z196处理器采用了45nm制程工艺(z10芯片采用的是65nm),这意味着IBM可以在这个芯片上集成所有东西,IBM确实是这么做的,就像它在今年二月公布8核POWER7时所说明的那样。

  跟据了解,Z196处理器有着14亿个晶体管,面积为512.3平方毫米,这使得Z196处理器在晶体管数量和面积上都要强于POWER7芯片。z196芯片采用了IBM的触点陈列封装,被称为C4的金属触点封装取代了针状插脚--其触点达到令人大跌眼镜的8093个电源触点和1134个信号触点。

  z196芯片每个都有64KB的L1指令缓存和128KB的L1数据缓存,这一点上和Z10很相似。但是z196有100个新指令和超标量通道允许重新排序指令,使Z196通道就比z10有更加好的效率,并且有不可见的编辑代码。另外,Z196的每个都有1.5MB的L2缓存。

  z196引擎的超标量通道都能在每个时钟周期内解码3个z/Architecture CISC指令并执行多达5个操作。每个有6个执行单元:2个整数单元,2个加载/保存单元,1个浮点单元和1个小数单元。IBM表示,这浮点单元要比z10芯片的更加好,但是没有透露其在每个时钟周期内可以做多少flops.之前的一些z/Architecture CISC指令已经被分割成块,使其能更加有效地分部在通道中,让z196更像是RISC.,z196也与POWER7芯片一样在其中采用嵌入式的DRAM(eDRAM)作为L3缓存。这种eDRAM比往常用作缓存的静态DRAM(SRAM)速度更加慢,你可以将其指定到一个特定的区域。对很多工作负载来说,让更多内存接近于芯片重要于使用高速内存。z196处理器有24MB的eDRAML3缓存,被划分为2个存储体,并由2个片上L3缓存控制器进行管理。

  每个z196芯片都能作为一个GX I/O总线控制器--同样方法也被用于POWER系列芯片当中,来连接主机通道适配器和其他一些外围设备,每个插槽分别分配得到一个与受RAID保护的DDR3主内存相连接的内存控制器。另外,z196芯片还有2个加密和压缩处理器,IBM大型机采用了这种第三代电路的设计。

  z196芯片采用两个共享其中一个协同处理器方式,且每个有16KB的缓存空间。终达到每个z196芯片有一个可连接SMP Hub/共享缓存芯片接口。如下图所示,有2个芯片被集成到一个z196多芯片模块(MCM)上,利用交叉耦合允许MCM上所有6个插槽通过40GB /s相连接。Z196提供的是交叉耦合访问方式,在MCM上提供了六个插槽以40GB/s的速度连接到各个芯片上,zEnterprise 196 SMP Hub/共享缓存。

  在IBM大型机中,z196处理引擎相当于中央处理器(CP),而CP的互连芯片称为共享缓存(SC)。每个SC有6个CP接口相互连接,其中有3个架构接口连接到全加载的z196系统中其他3个MCM.

  从上面的架构图来看,SMP Hub的优点就是可以加载到带L4缓存的组件上,这是大多服务器所不具备的--几年前IBM曾向至强处理器的EXA芯片组上增加了一些L4缓存(即采用了eX4架构的IBM X3850M2/3950M2平台,可通过扩展组建升级为16路系统。对应的CPU为Xeon 7400系列)。L4缓存非常重要的原因在于大型机引擎的主频要远远高于主内存速度,如果只通过增加一个缓存层来维持Z196的引擎需求是相当昂贵的。不管怎么说,这种SMP Hub/共享缓存芯片和CP一样也是采用45nm制程工艺,有着15亿个晶体管,面积为478.8平方毫米,封装中也有多达8919个触点。

  每个MCM上部署6个CP和2个SC,MCM是一个边长为96毫米,功耗1880瓦的正方形。每个处理器板都有一个MCM,这使得一个系统在完全连接的情况下可以拥有96个CP,十几个控制器可以访问多至3TB RAID内存,32个I/O Hub接口可实现288 GB/s的I/O带宽。顶架式zEnterprise 196 M80设备中的80个CP可用于运行工作负载,其他可以使用Parallel Sysplex集群来耦合系统、热备份和管理I/O等等。


  
上一篇:Velocity LP NV-RAM 为相变存储器提供无缝架构途径
下一篇:抢攻游戏阵地 ARM发布新款Mali GPU架构

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

相关技术资料