其额定值的计算机用户。Corsair公司的 XMS模块、Kingston 科技公司的HyperX模块和 Mushkin公司的高性能Black模块均采用比商用器件更先进的计时规范,并证明了较短的存储器等待时间在决定整个系统性能方面的重要性。例如,Kingston公司出售 333 Mbps/引脚的 PC2700 2-2-2、370 Mbps/引脚 的PC3000 2-2-2、400 Mbps/引脚 的PC3200 2-2-2 和 434 Mbps/引脚 的 PC3500 2-3-3 DIMM,PC3500 2-3-3 MIMM内含铝散热器来实现散热效果。
至于 AMD公司的 Athlon CPU,虽然该公司原来的 200 Mbps/引脚的前端总线数据传输速率超过了英特尔公司的奔腾 III 前端总线的速率, 但是英特尔公司推出奔腾 4,摘取了速度方面的皇冠,而且没有停滞不前。一代的Athlon XP 芯片采用333 Mbps/引脚的传输总线,而且近的芯片组新合作伙伴宣言表明,AMD 公司会很快改用 400 Mbps/引脚的总线。与Transmeta公司用于 SDR
和 DDR SDRAM 的 Crusoe、惠普公司用于直接式 RDRAM 的 EV7 Alpha 以及英特尔公司从未公布过的用于直接式 RDRAM 的 Timna 一样,AMD公司即将推出的 Athlon64 CPU将 DRAM 控制器嵌入微处理器中。这样做,可以通过外部芯核逻辑消除数据传输延迟,从而将 DRAM 与微处理器之间的等待时间影响降至程度。
然而,存储器供应商和用户终都会走到这一步:他们再也不能够经济有效地使一种体系结构达到其原本不想达到的更高的运行速度。正如 Nvidia 公司的蒙特里姆所指出的,"时钟速度和设计经验这两条曲线终有一个交点,至此,所需要的时钟速度超过设计经验。我们要达到这个转折点,就得改用新一代存储器。"即将问世的DDR-II 体系结构如何利用以成本为侧重点的 DRAM 阵列,在以同样甚至更低功耗的条件下进一步提高性能--或者在性能保持不变条件下如何获得更高的收益呢(图 3 和表 1)?
与 DDR-I 相比,DDR-II 有一项关键性的改进,就是改用更低的1.8V 芯核电压和 SSTL I/O电压。另外,为了减小阻抗和连线长度,DDR-II 器件将不用TSOP 封装,改用 BGA 封装。(出于同样的原因,某些 DDR-I 芯片已经采用了BGA 封装。)DDR-II 存储器采用所谓的 4n 预取方式,为每个数据位同时取4位串行信息,而 DDR-I 和SDR SDRAM则分别采用 2n 预取方式和 1n 预取方式。获得此项功能所付出的代价是,稍许增大了外部电路,以便能够保持面积的低速 DRAM阵列。从1 Gb这一代开始,DDR-II 器件还将采用8存储体阵列,而低密度器件和DDR-I 芯片则采用4存储体阵列。
为了方便系统集成,特别在载荷量很大的高端工作站和服务器设计中,DDR-II 器件将支持可选用的差分数据选通脉冲以及读出加单个写入周期等待时间。 (DDR-I 使用固定的单周期写入等待时间。) DDR-II 器件还具有发送的CAS,亦即一种锁存于列地址之前向存储器发送读写指令的能力。通过所发送的指令,存储器控制器可以启用和配置每个存储器的片上终端负载电阻器阻值,并校准每个芯片的输出驱动器强度。虽然DDR-II DIMM 的尺寸与DDR-I 的相同,但是输出引脚有所不同,能更可靠地传送功率,而且从184个
增加到240个触点,以便包含几乎为以前 3 倍的接地点并增加其他信号。因此,尽管DDR-I 和 DDR-II的 SODIMM 输出引脚和间距完全一样,但是 DIMM 触点的间距却缩小了。还应当注意的是,在DDR-II 这一代器件中,每块母板的印制线可连接到仅仅两个没有缓存器的DIMM,而在DDR-I中,则可连接4个DIMM。
英特尔公司突然改变立场,支持 DDR400-I,是因为它改换到 800 Mbps/引脚的前端总线比预期的快,还是因为DDR-II产量上升比预期的慢,或是这两个因素综合作用的结果? 没有一种肯定的说法,也没有人怀疑峰值数据传输速率与CPU匹配的DRAM接口的市场价值。但是,由于DDR400-I 真实的性能潜力还存在若干不确定性,具有所预测的3-3-3 和 2.5-3-3 速度的DDR400-II 以及后续的速度为533 MHz 和更快的器件很可能成为业界长期使用的DDR SDRAM 方式。
器和新的测试流程均会促使成存储器市场的短期动荡不定,根据《世界半导体贸易统计》杂志的估计,去年存储器市场的销售量达到将近 6000 亿位。Kentron 公司希望通过它一直推广了很多年的QBM(四存储体存储器)技术来利用这种动荡不定局面。QBM 利用 ST 微
电子公司的FET开关阵列和IDT公司的时钟电路来实现多个SDR SDRAM或 DDR-I SDRAM 的输出之间的快速切换,只要对DDR-I 增加一个小模块,就可提供相当于DDR-II的峰值性能(图4)。Via科技公司计划用其阿波罗PT600 芯片组来随时随地支持双通道 QBM 模块;该公司希望此项试验比它以前为日本NEC公司(现在已停产的)虚拟通道DRAM进行的试验更成功。
图4 FET开关阵列在DDR-ⅠSDRAM的多个存储体之间触发,使它们能以DDR-Ⅱ相似速度运行; Rambus公司也急切希望能从DDR-I 向 DDR-II过渡的动荡局面中受益。它的合作伙伴 SiS公司的 R658 芯片组,如同英特尔公司的 i850一样,也采用双通道RDRAM 接口,但与 i850不同的是, 除了PC800 和 PC1066
器件外,它还包括PC1200 存储器。预计今年第3季度上市的 SiSR659 将包括4个 Rambus 通道,如与PC1200器件结合,总峰值带宽将达到9.4 GB/s,所需接口引脚总数也比同等带宽的多通道 DDR SDRAM 要少得多。
千兆级图形存储芯片
密切关注图形业务的人们认为,获悉业界正在朝着大批量生产连接于64位存储器通道并以200 MHz时钟速度运行的DDR SDRAM这一目标努力,是令人有些奇怪的。毕竟,ATI 科技公司的Radeon 9800 Pro 图形板还是采用了连接于256位总线的340 MHz DDR SDRAM,Nvidia 公司的 GeForce FX 5800 Ultra 也将500 MHz DDR SDRAM连接到128位总线上。PC的主存储器与PC的图形存储器之间导致性能差异的不同之处是什么?
图形芯片通过2.5英寸或更短的点对点单个负载总线连接到帧缓存器,而主存储器使用的是长得多的多点总线。此外,图形芯片不必对付模块连接器阻抗。或许重要的是,对于图形芯片来说,标准化过程要简单得多。大多数图形卡制造商擅长于营销,而不精于工程设计,因此直接将芯片制造商的基准设计拿来生产,而不做任何改动。对于每一代产品,图形卡制造商都与一家或数家存储器制造商达成供货交易,让其提供经过专门测试的产品变型,其阻抗、工作温度、电压或许都与原来的不同,而且这些参数的容差范围也比PC主存储器的对应参数容差范围更窄。
有时,图形卡制造商与存储器制造商结成合作伙伴,生产定制DRAM。例如,低功耗的GDDR2-M SDRAM,它是Elpida 公司开发的,而ATI 科技公司将它用于Mobility Radeon 9600中(参考文献 3)。与 DDR-II SDRAM相比, GDDR2-M 芯片的片上终端负载通过一个NMOS晶体管将数据总线拉至地电位,从而无需吸收直流成分,而在普通存储器中则要将数据总线拉到数据总线高电平和低电平的中间电平。GDDR2-M 芯片只包括长度为4个脉冲串、一个串行脉冲串序列、一个固定脉冲串起始地址和长度为1的写入等待时间。此外,这些芯片还支持数据反转功能,以减少周期之间的外部总线转换。在读出期间,一个数据掩蔽信号与每8个数据位配对,而在写入期间,每32个数据位与一个数据反转掩蔽信号配对(图5)。
图5 数据反转支持图形帧缓存器在读和写操作周期期间使外部总线传输速度化。 然而,随着图形芯片行业竞争的日趋加剧,成本的压力就日益增大,由多家制造商和多家用户标准化的变型产品更加有吸引力。存储器制造商和图形卡制造商之间合作的成果就是制定了GDDR3 规范,该规范适用于时钟速率高达800 MHz 的存储器。GDDR3 没有使用DDR SDRAM的基于电流的SSTL总线,而采用基于电压的伪漏极开路输出。单向单端选通脉冲信号的空闲状态是VDDQ,以简化选通脉冲信号的分配。但是,与 DDR-II SDRAM一样, GDDR3 芯片在写入时将数据置于时钟窗的中央,而在读出时把数据按时钟脉冲边缘校准。
利用其 Yellowstone 技术,Rambus 公司正在加倍努力,以夺取图形产品和其他消费类产品市场,这些产品以及任天堂 64 和 Playstation 2 都是该公司批成功范例(图6)。Yosemite 采用低电压低功耗差分信令技术,具有在每个时钟边缘传输8位数据的能力,并能以 2.5 ps的进行FlexPhase 精密数据传输。这种精密数据传输解决了印制电路板走线、封装和片上时钟偏离等问题,从
而能够实现低成本系统的生产。
图6 低摆幅差分信号传输和8倍速时钟数据传输多路实现Yellow-stone的性能效力。 Yosemite 的初始变型产品将以 3.2 Gbps/引脚的数据速率运行, 该公司计划将Yosemite的数据速率提高到6.4 Gbps/引脚。Elpida 公司、索尼公司和东芝公司都获得了使用 Yellowstone 技术的许可证。索尼公司和东芝公司还获得了使用高速并行 Redwood 逻辑接口的许可证,这项技术肯定会应用在未来的 Playstation 游戏机上。与 DRAM 芯片相比,RDRAM 芯片过长的随机存取等待时间一直阻碍着该芯片成功地应用于非PC的主存储器中;至于Rambus公司在 Yosemite 这代产品中是否解决了这个问题,现有的 Yellowstone 文件中没有披露任何信息。该公司去年夏天展示了个基于逻辑过程的 Yellowstone 接口试验芯片。
尚未走完的路 在读者中间,仅仅很少一部分人从事PC或图形子系统的设计。那么,为什么本文的主要篇幅都用来讨论PC和图形子系统使用的DRAM呢?其原因是,PC和图形子系统是两
个的DRAM消费市场,因此销售到这些市场的DRAM芯片往往是价格的。价格常常是你在选择存储器时考虑的重要因素。(更准确地讲,它常常代表了你所考虑的10个重要因素!)
然而,有时会漏掉某种特点受欢迎的功能或存在与用户需求不符之处,但不包括你使用普通的DRAM。或许你需要更快的随机存取速度,以便与非顺序的数据读写相匹配。或许你要求DRAM具有更低的平均功耗,提供一条去多路复用的地址总线和其他一些常规控制信号。不必担心:机会即将来到。由于PC市场疲软,DRAM 制造商不能只耍嘴皮,必须支持新兴的各种应用,否则工厂就要停工。
今年还将发表一篇文章,论述取代DRAM的高速和低功耗SRAM,请注意阅读。在此之前,如果你很关注高速存储器,那么请留意Enhanced Memory公司的ESRAM、三星公司和东芝公司的FCRAM以及英飞凌 (Infineon) 公司和 Micron 公司的 RLDRAM。如果你尤其关注的是功耗问题,请考虑 PSRAM、符合JEDEC规范的低功耗SDRAM(具有部分刷新模式、温度补偿刷新模式和深度省电等模式)以及富士通公司的 FCRAM。
参考文献
1. Dipert, Brian, "The slammin', jammin' DRAM scramble," EDN, Jan 20, 2000, pg 68.
2. Denali Memory Report, June 2000, pg 10.
3. Dipert, Brian, "Graphics power plants expands their integration grasp," EDN, April 3, 2003, pg 16.
欲知详情
你与以下制造商直接联系时,请告诉对方你是从EDN China杂志获知其产品信息的。
AMD(Advanced Micro Devices) www.amd.com
Cisco Systems www.cisco.com
Elpida Memory www.elpida.com
Hewlett Packard www.hp.com
Inquest Market Research www.inqst.com
Kingston Technology www.kingston.com
Nvidia www.nvidia.com
ATI Technologies www.ati.com
Avnet www.avnet.com
Corsair www.corsairmemory.com
Denali Software www.denali.com
Enhanced Memory Systems www.edram.com
Fujitsu www.fujitsu.com
IDT (Integrated Device Technology) www.idt.com
Infineon Technologies www.infineon.com Intel www.intel.com
Kentron Technologies www.kentrontech.com
Micron Technology www.micron.com
Mushkin www.mushkin.com
Rambus www.rambus.com
Samsung Electronics www.samsungelectronics.com
SIS (Silicon integrated Systems) www.sis.com.tw
Sony Corp www.sony.com
STMicroelectronics www.st.com
Toshiba www.toshiba.com
Transmeta &n
bsp; www.transmeta.com
Via Technologies www.viatech.com.tw
Xilinx www.xilinx.com
WSTS www.wsts.org