一种集成128个nxCPU的突破性多核处理器的实现

时间:2011-08-28

 

  提起多核处理器,大多数人就会想到是用在PC机或者是智能手机上的。但事实上,多核处理器在电信基础设施网络、数据中心网络、企业网络中都有广泛应用。NetLogic Microsystems就是这个领域的领导厂商。NetLogic Microsystems总部位于美国加州Santa Clara.在美国Santa Clara 、Austin,中国北京、上海、深圳、南京,以及印度班尔加罗和孟买设有研发中心。在中国,NetLogic Microsystems是所在市场领域的翘楚,在基于知识(knowledge-based) 处理器市场的占有率高达100%;而在多核处理器和物理层产品市场的占有率则分别超过85% 和55%.公司的销售额从2004年的4,800万美元增长到2010年预计的3.83亿美元。

  为下一代互联网网络提供高性能智能半导体解决方案的者NetLogic Microsystems,宣布推出创新的XLP8128S多核通信处理器解决方案。该方案集成了128个nxCPUs和160个以上可编程处理引擎,可为下一代3G/4G移动无线基础设施、企业、存储、安全、城域以太网、Edge和基础设施网络应用提供前所未有的每秒160Gb的吞吐量和每秒2.40亿数据包(240 Mpps)的智能应用程序性能。

  多核处理器是指在一枚处理器中集成两个或多个完整的计算引擎(内核)。多核技术的开发源于工程师们认识到,仅仅提高单核芯片的速度会产生过多热量且无法带来相应的性能改善,先前的处理器产品就是如此。他们认识到,在先前产品中以那种速率,处理器产生的热量很快会超过太阳表面。即便是没有热量问题,其性价比也令人难以接受,速度稍快的处理器价格要高很多。

  多核处理器代表了计算技术的创新。由于数字数据和互联网的化,商业和消费者开始要求多核处理器带来性能改进,这个重要创新就开始了;因为多核处理器比单核处理器具有性能和效率优势,多核处理器将会成为被广泛采用的计算模型。在驱动pc安全性和虚拟化技术的重大进程过程中,多核处理器扮演着中心作用,这些安全性和虚拟化技术的开发用于为商业计算市场提供更大的安全性、更好的资源利用率、创造更大价值。普通消费者用户也期望得到前所未有的性能,这将极大地扩展其家庭pc和数字媒体计算系统的使用。多核处理器具有不增加功耗而提高性能的好处,实现更大的性能/能耗比。

  这一新的XLP8128S多核处理器解决方案集成了突破性的XLP处理器架构,可提供无与伦比的处理性能和可扩展至128个nxCPUs的扩展能力,每个运行频率均高达2.0 GHz,且基于同类的超标量引擎以及融合数据平面和控制平面处理的乱序执行功能。该128个 nxCPUs可提供对高速芯片间一致性接口(ICI)的全面高速缓存和内存一致性(Memory Coherency),使软件应用程序得以无缝地运行于对称多处理(SMP)或非对称多处理(AMP)模式。卓越的处理器内核与可从1个扩展到128个nxCPUs的可扩展性的独特组合能够提供每秒240 Mp以上的智能应用程序处理性能,使其成为了用于业界4-7层智能网络、服务和应用程序处理的性能的多核通信处理器。

  The Linley Group的分析师Linley Gwennap说:"在保持全面的高速缓存和内存一致性的同时,在ICI接口上启用令人瞩目的128个nxCPUs,NetLogic Microsystems正在借助其第三代多核处理器提高性能门槛。甚至无任何竞争性产品能够接近这一性能水平。XLP处理器可提供诸多架构优势,可提升性能、可扩展性和电源效率。"

  NetLogic Microsystems的执行副总裁兼总经理Behrooz Abdi说:"在保持全面的高速缓存和内存一致性的基础上,我们能向128个nxCPUs进行扩展以提供每秒160Gb的吞吐量和每秒超过240Mp的应用程序性能,这一能力在业界是的,而且为我们的客户提供了新的设备类别。继续在下一代网络和通信基础设施、安全和存储应用多处理领域领跑技术创新,令我们倍感兴奋。 "

  XLP8128S解决方案搭载NetLogic Microsystems的高速、低延迟Enhanced Fast Messaging Network?,可实现128个nxCPUs间的高效、高带宽通信,并支持所有片载组件间的数十亿种空中消息和数据包描述符。作为128个nxCPUs的补充,XLP8128S解决方案提供了160个以上完全自治的处理引擎,以从nxCPUs上独立和完全地卸载特定网络功能,包括:

  每秒160 Gb完全自治安全加速引擎,支持联网、无线和存储加密/解密和协议

  用于入口/出口包解析和管理的每秒160 Gb网络加速引擎

  每秒512 Gb RAID-5/RAID-6加速

  每秒40 Gb压缩/解压

  包排序

  存储重复删除加速

  TCP分段卸载

  IEEE 1588硬件时戳

  该XLP8128S多核解决方案可提供三层高速缓存架构,具备50兆字节以上全面一致的片载高速缓存,可提供每秒40 Tb的极端高速板载存储带宽。另外,该XLP8128S解决方案还囊括16条72位DDR3互联通道,可产生每秒1600 Gb以上的片外总内存带宽,这一带宽为近公布的竞争性解决方案的DRAM带宽的4倍。128个nxCPUs与quad-issue以及卓越内存子系统架构的组合使得该设备特别适用于数据平面应用程序和控制平面应用程序,前者对于内存延时具有固有的敏感性,而后者则要求同类的处理性能。

  另外,XLP8128S多核处理器解决方案还集成了众多高速联网接口,包括Interlaken、XAUI、SGMII、PCI-Express、USB2.0和NetLogic Microsystems的高带宽片间一致性接口(ICI),可以全面的软件透明度提供无缝的芯片对芯片高速缓存和内存一致性。XLP8128S解决方案采用TSMC的先进40纳米工艺技术制造。 NetLogic Microsystems的多核处理器系列由一个包含参考和生产就绪软件部件的综合软件开发包(SDK)提供支持,因此可使客户得以加速投放市场的时间。

  XLP8128S解决方案将于2010年第三季度进行样产,NetLogic Microsystems目前正在联系这一技术的早期采用者。

 



  
上一篇:浅谈ADI ADF4150HV 4.4 GHz频率合成方案
下一篇:80 PLUS的ATX电源公开参考设计

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

相关技术资料