I/O 速度
简单地说,标准同步 SRAM 的 I/O 速度就相当于时钟频率。但是,双数据速率 (DDR) 时钟方案推向市场之后,许多高性能器件的 I/O 速度均为时钟频率的两倍。
总线宽度
总线宽度的定义为构成总线接口大小的位数。对于给定的时钟频率,接口越宽,每次访问的数据量就越大。如果从支持总线宽度为 9 位的器件转而采用支持总线宽度为36 位的器件,那么在相同时钟频率下总带宽就会提高四倍。当然,根据所连接器件的总线宽度,SRAM的总线宽度受到市场中可用器件类型及其在系统中可用性的限制。
接入端口
按惯例,SRAM 具有单一接入端口,但目前已经出现了几种支持多个接入端口的 SRAM 存储器架构。这几种经过改变的器件具有专门的输入和输出总线,支持多个双向 I/O 总线以及实现独立时钟域的完全独立的 I/O 总线。
带有多个接入端口的器件能够同时访问(读取或写入)存储器阵列,因而可实现两倍乃至更高的总带宽。如果采用类似双端口 RAM 的器件,那么就能以两倍于单端口 SRAM 的速率访问数据。由于双端口可在两种不同时钟域内灵活操作,因此给系统带来的实际利益可能大大超出两倍速度的范畴。
系统需求决定着哪种类型的高性能存储器适用于某一特定应用。以下将简要介绍一下各种基于 SRAM 的存储器,它们可提高系统带宽和性能。
器件类型(相对带宽)
SRAM (1X)
标准同步 SRAM 是简单的器件,可将它作为比较带宽的基准。同步 SRAM 具有到存储器阵列的单一接入端口,它是一个常用的双向 I/O 总线。在一个给定的时钟周期内可进行读取或写入操作,但二者不能同时进行。同步 SRAM 通常有两种操作模式:流通式(flow-through) 或管线式 (pipelined)。管线式器件的输出进入寄存器,而流通式器件的输出不进入寄存器。输出通道中的寄存器使管线式器件可实现比流通式器件更高的时钟频率,但会造成延迟。延迟是指从存储器读取数据到其可从输出访问的延迟(通常以时钟周期数测量)。通常,网络系统需要高带宽或数据吞吐量,为增加管线式器件的吞吐量可牺牲初始延迟。由于本文重点讨论带宽问题,因此这里都假定器件为管线式。
NoBL/ZBT RAM (1X)
NoBL (No Bus Latency)或 ZBT (Zero Bus Turnaround) RAM 经过优化,可减少连续读写周期间的时延。像同步 SRAM 一样,它包括单独的普通双向 I/O 总线。用于管理管线数据流通并化连续读写操作间延迟的内部逻辑电路能够辨别该存储器与标准同步 SRAM。因此,该架构适用于读写操作需求各半的场合。但是,如果向器件发送较长的数据流,那么其峰值带宽将等于同步管线式 SRAM。
分离 I/O SRAM (1X)
顾名思义,这些器件将公用的普通 I/O 端口分为分离输入总线和分离输出总线,以避免总线争用和总线转换 (turnaround) 问题。但是,与普通I/O SRAM类似,该器件在任何给定时钟周期中只能进行单一的读取或写入访问。该架构消除了与普通I/O总线相关联的总线转换时间,使每个端口都能根据其操作进行优化。
DDR RAM (2X)
DDR RAM使用单条普通 I/O 双向总线。与同步 SRAM 不同,DDR 器件需要一个差分时钟或两个异相时钟(K和/K)。数据锁定在K或/K的每个上升沿上的存储器阵列中。这就有效地使数据传输和I/O速度翻番,达到时钟频率的两倍。
QDR RAM (4X)
QDR RAM (Quad Data Rate RAM) 是专门为高速网络应用开发的。基本架构结合了分离式I/O SRAM 和 DDR RAM 两者的优点。该器件保留两个独立的端口(一个用于输入,另一个用于输出),并用两个异相时钟输入对其计时。两个端口的地址相对独立,这就可同时访问存储器阵列。QDR RAM 可高效实现同步 SRAM 带宽的四倍。为了解决轨迹偏移 (trace skew) 和射程时间 (flight time) 等问题,QDR SRAM 提供了对相同频率采用独立的输入和输出时钟的选择,但为简单起见,两个端口都将以单独的时钟集(时钟和 /时钟)代表。
NetRAM SRAM (2X)
NetRAM SRAM 包括运行于同一时钟上的两条双向 I/O 总线。每个端口接口都与同步管线式 SRAM 类似。这些器件支持每个端口的同时读写访问。通过启用写入控制,该器件还可配置为接受读访问或写访问,也可配置为接受读写访问,这使系统设计更加灵活(见图1)。
双端口 RAM (2X)
双端口 RAM 实现了早先器件所无法实现的大量应用。它们与 NetRAM 类似,有两条双向 I/O 总线。但是,关键的区别在于双端口 RAM 还支持每个端口上完全独立的时钟域,这就将端口的功能、存取和寻址与其相连的器件分离。这种灵活性使得双端口 RAM 能够在完全不同的时钟域间实现数据的无缝缓冲,并简化了接口器件的优化工作。与此形成对比的是,由于单个时钟域的限制,NetRAM 还需要速度更快的端口将数据传输降至较慢端口的速度。
四端口 DSE (4X)
之所以谈到四端口DSE (Datapath Switching Element)及其它四端口存储器,是由于其集成了基于 SRAM 的阵列。这些器件包括复杂的逻辑特性,其目的是在高速通信应用中管理多达四个独立的时钟域。由于四端口DSE 包括四个独立的端口,它可极为灵活地通过接口连接至多个器件(见图2)。由于每个端口都支持同步管线式 SRAM 接口,因此可实现与之相应同步 SRAM 带宽的四倍。此外,四端口DSE 还支持新式应用,如三到一数据路径集成、冗余数据路径生成以及在多个处理器中实现数据共享(例如在 DSP 阵列的各 DSP 中实现系数共享)。
结语
存储器性能不应仅以时钟频率来衡量,还要考虑到带宽。带宽由 I/O 速度、总线宽度和器件接入端口数决定。目前市场中存在许多基于 SRAM 的不同架构。在速度和总线宽度相等情况下进行对比时(见表1),采用 QDR RAM 和四端口DSE 架构实现了带宽,这两种架构可实现相当于标准同步 SRAM 四倍的带宽。QDR RAM 通过采用专门的读写端口实现高带宽,每个端口均以双倍数据速率运行。四端口DSE 通过其四个完全独立接入端口的独特设计实现高带宽。终,对于特定应用,系统设计考虑因素决定着在越来越多的存储器类型中到底应该选择哪一种合适。■
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。