基于LTE/4G的新型处理器架构满足无线处理的需求

时间:2011-05-25

  引言

  为了让现今的无线蜂窝网络满足日益增长的无线数据处理需求,加速向LTE/4G迁移的趋势已经日益明显。LTE或3.9G通过采用更有效的传输技术来提升数据速率,下一步,4G要提升到更高数据率,LTE、4G基础设施给半导体供应商提出的挑战是要用数字信号处理器(DSP)来满足更高的数据处理需求,这些新型DSP的性能要比我们今天所用的DSP高出几个数量级!

  移动设备供应商协会(GSA)2010年4月的指出,已有31个国家承诺将部署64个LTE网络,预计到2010年底将有22个LTE网络交付使用,截止2011年年底将有39个或更多LTE网络交付使用;总计88个运营商已经承诺将在42个国家部署LTE系统,有的已经开始进行测试或进行其他规划活动。

  半导体产业商机巨大但挑战并存,LTE的性能需求是现今3G网络性能需求的100到1000倍!相比目前在3G使用的CDMA无线技术,LTE采用的OFDMA技术采用多天线信号处理可以实现更高的频谱效率,并可以支持更宽的频谱。不过,OFDMA技术也更为复杂,需要的计算量比CDMA技术大得多。如图1所示,从GSM迁移到UMTS/HSDPA再迁移到LTE,计算量需求要提升4、5个数量级――从大约10个MOPS(每秒百万次运算)提高到10万甚至1百万MOPS,如此才可以提供LTE所要求的10到100 Mbps数据传输性能。

从GSM迁移到UMTS/HSDPA再到LTE,计算量需求要提升4、5个数量级

  图1、从GSM迁移到UMTS/HSDPA再到LTE,计算量需求要提升4、5个数量级

  LTE还采用了先进的多天线信号处理技术,涉及到两种的技术MIMO(多输入多输出)编程和波束形成,同样,这也都是高度密集计算型应用,需要新一代优化的专用DSP解决方案。

  1 所需的DSP性能达到新高

  LTE的运算处理要求如此巨大,因此对DSP的性能提升要求也是巨大的 ――单个通用DSP不能满足这样的性能需求,我们需要多颗DSP来实现LTE系统,而且这些DSP必须非常高效。以往的“通用”DSP将无法满足数据处理要求。半导体供应商和IP供应商都在努力打造全新一代DSP,其性能可以满足运营商新建基础设施的需求。

  要开发这些新的DSP,我们所面临的挑战是难以想像的,它无法通过提升DSP时钟频率来实现――这样做会大幅增加功耗。我们需要针对运算任务优化的全新架构,这不仅意味着硬件层面的开发,也需要开发配套的软件――因为越来越多的处理正在通过软件来完成。

  早期在开发软件定义无线电(SDR)方面的尝试令人失望,因为他们大多基于单一的DSP,其性能无法跟上运算需求的增长。而将密集运算交给RTL模块的方法从根本上违背了软件无线电的初衷,因为RTL模块是不可编程的。然而我们可以用多颗DSP处理器来实现无线射频系统――多颗针对不同任务进行优化设计的专用DSP。这些全新定制的专用DSP内核在设计之初就是从整个系统的角度出发,完全可以满足LTE的运算性能需求。

  2 所需的处理类型

  一个典型的现代通信收发机可以划分为三个计算域:

  信号域:实现复数或实数数据的优化运算,包括FFT、滤波、同步以及矩阵运算等靠近系统中RF一侧的运算。

  比特软值域(soft bit domain):包括从软件解映射模块到前向纠错(FEC)解码模块等靠近接收端MAC一侧的运算。

  比特域:通常是在发送端靠近MAC一侧,包括CRC编码、加扰、FEC编码和比特交织等操作。

  这三种根本不同的计算需求需要不同类型的DSP内核(IP内核是必要的,因为从功耗和面积效率的角度看,所有这些功能必须在单芯片而不是分开的芯片上实现)。

  3 LTE基带子系统分析

  图2展示了一个LTE基带子系统的功能模块图。该图上方显示了LTE接收端的信号处理通道。有天线连接到接收端RF模块,它很可能是MIMO配置的多天线系统。RF接收模块将信号输出到前端滤波模块,该模块驱动随后的OFDM信道估计和MIMO检测模块,这个模块将来自多天线的信号合并起来而且可以改善接收端的带宽和信号保真度,信号合并后会进行复数的解调,然后是前向纠错,终直接给LTE MAC层提供用于高层协议处理的比特流。在发射端,来自MAC层的比特流通过卷积编码以及各种频域变换后、输出整形,然后送给发射端RF模块、功率放大器和天线。

LTE基带模块方框图

  图2 LTE基带模块方框图

  针对LTE的ConnX ATLAS参考架构

  ConnX ATLAS参考架构是专为满足从RF一侧的前端滤波到MAC一侧的传输模块处理需求而开发的,ATLAS参考架构基于LTE 的UE CAT-4系统,支持一个发射天线,两个接收天线和20MHz带宽。也可以提供 10MHz及5MHz的ATLAS系统。图3为ConnX ATLAS UE(用户设备)的功能方框图。

 

ATLAS LTE用户设备方框图

  图3 ATLAS LTE用户设备方框图

  接收链路(图3底端)接收来自前端滤波器的数据并为MAC生成传输数据块,它包含控制器和三个计算域:信号处理域(接收信号处理器或RxSP)、矩阵处理域(接收信道处理器或RxChP)以及比特软值域(接收混合ARQ 处理器或者叫 RxHARQ、Turbo引擎和接收控制处理器或者叫RxCP)

  所有这些DSP包括Turbo 引擎,都可以用Tensilica公司的Xtensa可定制处理器技术实现,从而针对特定的任务进行优化。利用可配置技术还可以同时创建功能齐全的配套软件工具链,所以不需要把时间浪费在开发不同DSP的基本指令集仿真器、调试器方面。

  Tensilica公司的基带引擎ConnX BBE16是构成RxSP和RxChP的基础,该ConnX BBE16是一个128位、3发射、16MAC的数字信号处理器,能够在单周期内完成多个复数乘法运算和一个复数基-4FFT运算。RxSP为每个符号产生源数据块并进行信道估计。源数据块会立即写入接收链路中的下一个处理器RxChP的输入缓冲区,RxChP执行MIMO解码,并产生比特软值给HARQ模块。

  RxHARQ处理器接受解码后的比特软值,并将它们合并为合适的冗余版本,接着执行HARQ重组以产生码块,码块被写入Turbo解码器的输入缓冲区,完成解码后又被写入RxCP的输入缓冲区。

  RxCP是主控制器,执行休眠控制和电源管理。它对信道头进行解码以便配置收发链路正常工作,它还为MAC处理器提供了控制和数据接口。

  4 ATLAS发射链路

  发射链路包括两个计算域和两个处理器,发射位处理器(TxBP)和发射信号处理器(TxSP)。

  TxBP执行CRC编码、加扰、Turbo编码、子块交织、速率匹配和物理上行控制通道编码。针对这一过程,Tensilica开发了一种比特流处理器(ConnX BSP3),它是一个32位DSP,增加了一些特殊指令,用于CRC、Turbo编码和交织运算的加速。

  TxSP接收编码后的比特流,并产生相应的SC–FDMA符号,它们再提供给前端滤波器用于上变频和MASK兼容, TxSP用Tensilica的BBE16 DSP实现,执行CRC编码、位加扰、Turbo编码、格雷码编码、RB映射、层映射、DRT、FFT和运营商附加的前缀匹配运算等。

  5 基于同一架构的多核体系

  ATLAS参考架构的优势在于,所有的内核都基于Tensilica的Xtensa处理器架构。这意味着所有内核可以共享相同的基本指令集,并使用相同的开发工具。这样就简化了整个设计工作,并可以将培训成本降到。

  采用多核方案实现LTE系统,因为每个DSP内核是针对不同任务专门优化的,所以可以获得LTE所需的效率和性能。ATLAS架构专为模块化设计而开发,通过增减不同类型的处理器,它可以很容易扩展为不同性能级别的产品。由于处理器能够进一步定制,所以设计人员可以贯彻Tensilica公司的设计理念并将其进一步发扬光大,以更好地匹配他们的性能、功耗和成本预算,或者更好地实现他们的独特算法。

  使用小型定制处理器的优势是,如果不需要这部分处理能力的时候,该内核和它使用的存储器都可以关断(与3G和3.5G中的设计类似,在这些设计*耗是受关注的),这有助于将功耗保持在水平。一个优化的多核架构可以允许使用更小、更低功耗的内核而无需提升系统频率。

  针对LTE系统中的关键运算定制DSP,还可以提高设计人员的工作效率。由于所有处理器都基于Tensilica的Xtensa可配置处理器内核,它们使用相同的软件工具链。编译器、调试器、ISS等都可以识别和利用定制的硬件并提高软件的开发效率。

  多颗DSP串行连接的方式也非常适合LTE无线算法中的数据流处理方式。因为一种算法只运行在一个内核上,所以软件编程模型和调试都变得更加方便,多颗处理器之间的数据传输不是基于全局共享总线,而是专门的点对点连接,因此数据无需总线仲裁就可以快速地加载进其他DSP的存储器中。此外,与典型的基于总线的系统相比,也不会因为更多处理器挂到总线上而降低性能。

  6 复杂的LTE软件

  LTE系统中的软件也相当复杂,需要真正了解需求的软件供应商提供,Tensilica公司一直与mimoOn合作,该公司因软件专长而倍受产业推崇,mimoOn开发了LTE的物理层软件堆栈优化程序,可以让采用ATLAS架构的专用Tensilica DSP发挥性能。

  7 完整LTE L1 PHY的实现

  ConnX的ATLAS LTE的参考架构实现了完整的LTE的L1物理层设计,包括了运算量要求极大的Tubro解码器,并且完全基于软件可编程的DSP处理器实现。它可以作为设计团队实现LTE基带系统的起点,设计团队需要把L2的组件和其它的系统互连组件以及ATLAS组件整合在一起。

  由于是模块化设计,所以设计团队可以部署ATLAS架构中的所有7个模块,也可以复用他们已有的RTL模块去替代一个或者更多的ATLAS组件。不管是LTE设计师还是以后的LTE Advanced(4G)设计师,ATLAS LTE参考架构中的模块化组件都可以让他们事半功倍。


  
上一篇:一种基于数字预失真平台的推进算法研究
下一篇:简析信号链基础的时钟抖动问题

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

相关技术资料