站在十字路口的DRAM买方和卖方,何去何从?

时间:2007-06-18

DRAM供应商希望有朝一日一种产品大小规格能适应所有的应用要求,但各种各样的设备要求则与之相差甚远。DRAM用户也许更喜欢定制的芯片,但价格会格外昂贵。双方会在保持原则的同时作出足够的让步以达成顺利的交易么?

       三年前,在《EDN》杂志的封面特写栏目上曾详细地介绍过DRAM技术。如今,三年过去了,DRAM技术在某些方面已经发生了根本性的变化,而在某些方面却几乎依然如故(参考文献1)。在直接式 RDRAM 与 DDR SDRAM 争夺未来个人电脑(PC)的主存储器的竞争中,业界已经基本上作出了有利于 JEDEC 支持的DDR SDRAM的裁决。英特尔公司已经向 Rambus 公司认输--或者至少是英特尔公司现在这么说--因为在其芯片组开发道路图上只有 DDR SDRAM。长期被吹捧的 DR-II 技术来得太晚,迫使PC行业采用速度为 400 Mbps/引脚的 DDR-I 器件,而先前人们只把它当作一种小批量的短命产品。具有讽刺意义的是,制定产业标准的机构行动迟缓,是促使英特尔公司首先与Rambus 公司结成合作伙

伴关系的关键因素。与此同时,Rambus 公司与其的芯核逻辑电路合作伙伴 SiS 公司一道,继续不屈不挠地奋斗,支持高端PC定会成功的观点。
  存储器密度的颗粒度问题一直困扰非PC主存储器的应用,而现在这个问题也波及到PC。近来,市场已经从基于 DOS 的操作系统过渡到基于 Windows NT 的操作系统,即从 Windows 98 和 Windows ME 过渡到 Windows 2000 和 Windows XP,这导致基本系统存储器的密度得到适度增大,但是,由于缺乏大量使用存储器的设备,这一趋势没能进一步发展(图1)。人们需要日益提高的系统性能并为满足这些需要而生产更宽的系统总线,这些都使颗粒度问题更为突出,并正在迫使 DRAM 供应商开发他们长期抵制的32位接口存储器。

图1  DRAM密度转移逐年减慢,以及中等密度的128 Mb/80512Mb器件的兴起,将给陷入式DRAM供应商带来困难。
  受到应用制约的密度增长极限,一直令人沮丧的财务状况,以及伴随而来的研发和基础设施方面投资的匮乏,使得 DRAM 制造商落后于符合摩尔定律的晶体管集成度发展趋势的其他公司。(一直承诺的1Gb DRAM在何处?)如果说成本是芯片标准,那么低价格就是好消息。但是,一只 DRAM 之"鞋"再也不适合每一只应用之"脚"。如果某个 DRAM 制造商正在开发一种针对成本进行优化的器件,则该制造商就会选择体积小而速度慢的阵列晶体管和尽量少的阵列存储体,并会为芯片规定保守的电压、电流、交流计时和其他参数,以确保获得的生产收益。
  你需要的芯片是要具有快速突发传输性能,还是要具有持续传输性能,或是两者兼而有之呢?于是,制造商需要采用体积更大功耗更大的晶体管、读出放大器和其他电路;需要将阵列细分为多个存储体以便能进行重合运算;需要利用很宽的内部总线;并可能需要包括嵌入式 SRAM 高速缓存器。如果你的主要侧重点是低功耗,那又会怎样呢?制造商又会将阵列细分成许多存储体--在本例中,是为了更精细地控制存储晶体管、读出放大器以及其他电路的工作方式和备用方式。但是,在大多数其他方面,该芯片是与性能优化的同类芯片大不相同的,其主要侧重点是很小的开关电流和漏电流,而不是高速度。
  如果你的应用需要某项特殊功能,如少数专为图像应用定制的存储器仍然采用的按位写入和按块写入方式,那又会怎样呢?Nvidia 公司的总设计师约翰·蒙特里姆评述说:"我一直从事图形控制器的设计,时间之长使我能想起某些功能何时才有意义。而今天,我们的控制器必须与尽可能多的各种存储器一起工作,其中包括非新生的各种存储器。我们不愿意创造利用奇异功能的逻辑电路,这种逻辑电路的回报率比较低。另外,当图形要求改变时,这些存储器功能常常不再有效。我们发现,是将注意力集中在数据传输效率上。要让存储器存储每一位数据的费用很低,要使控制器快速存取这些数据位,还要使图形芯片能进行图形处理。"(参考文献2)
  蒙特里姆的观点很流行,但是不是到处适用。例如,当你试图把历来基于 SRAM 的设计快速移植到 DRAM上时,那么该 DRAM 必须提供与 SRAM 相似的接口,必须包括自动刷新电路,而且从更广泛的意义上讲,必须在所有可能的方面都要像它所替代的存储器一样工作。有时,小小的"整形外科手术"无法根除 DRAM所存在的随机存取速度慢的"毛病";或许需要做更大的改动。
  双倍的麻烦
  当英特尔公司的CPU从奔腾 III 发展到奔腾4,而且这些CPU的前端总线的数据速率相应地从133 Mbps/引脚提高到 40

0 Mbps/引脚,即 100 MHz 总线的4倍数据速率时,该公司将双重16位 Rambus 通道体系结构--这种体系结构曾经在奔腾III的i840工作站芯核逻辑器件中使用--引入奔腾4的主流i850芯片组和高端 i860芯片组。DRAM 子系统的峰值带宽提高一倍,达到3.2 GB/s,刚好与奔腾4前端总线的峰值数据传输速率相一致。随后宣布的i845 芯片组支持单个DDR-I SDRAM 通道,该通道的工作速度高达133 MHz,转换成峰值数据传输速率为266 Mbps/引脚,或对于一条64位的通道而言,转换成峰值速率为2.13 GB/s。虽然系统总线与 DDR-I SDRAM 总线之间的不匹配在理论上似乎很难看,虽然存储器密集的基准测试对基于 DRDRAM 的系统在性能上给予认可,但大多数用户几乎看不到系统速度上的差别。DDR-I SDRAM因其每一位存储成本更低而获得了成功。
  从2 GHz开始, 英特尔公司的奔腾4 CPU移植到工作频率为133 MHz、速度为533 Mbps/引脚的总线上,从而进一步加大了速度为266 Mbps/引脚的 DDR-I SDRAM 与CPU前端总
线速度之间的性能差距。64位总线的峰值数据传输速率为2.66 GB/s的DDR333-I SDRAM缩小了这一差距,但是没有消除此差距。然而,峰值数据传输速率为4.26 GB/s的双 PC-1066 DRDRAM 通道确实跟上了CPU的发展步伐,从而促使英特尔公司大量生产i850E 芯片组。但是,英特尔公司的奔腾 4 和 Xeon 两种CPU都是用0.09微米光刻工艺制造的,能以800 Mbps/引脚的前端总线数据传输速率运行。在直接式 RDRAM 不再是PC的典型产品而DDR-II 技术也没有投入大批量生产的情况下,为了确保DRAM子系统不拖整个系统性能的后腿, 英特尔公司将怎么办?
  预计今年夏季推出的英特尔公司的下一代产品Canterwood 和 Springdale 芯核逻辑芯片组,都将采用目前用在该公司E7205"Granite Bay"工作站芯片组中的双通道DDR-SDRAM方式。英特尔公司对400 Mbps/引脚 DDR-I SDRAM 所采取的态度发生了显著变化,从冷淡的"评估它"转变为在今年春天的开发者论坛上明确宣布的"支持它"。DDR400-I SDRAM 的两条64位通道大大地增加了芯核逻辑的北桥引脚数目,但它们也具有6.4 GB/s的峰值数据传输速率。为了克服存储器与前端总线速度之间的性能差距以及存储器与内部时钟速度之间的更大差距,英特尔公司还在进一步增加片上高速缓存器的数量(图2)。即将问世的Xeon 的 Nocoma 版本和奔腾 4 的一种 "Prescott"版本,将L2 高速缓存器的容量从512 KB增大到1 MB。Xeon 的Gallatin 版本将于明年推出,它将增加一个容量为4MB的L3高速缓存器。

图2  无论采取什么措施,DRAM体系结构看来仍不能与微处理器的时钟速率同步发展,因而导致高速缓存容量的快速增长。
  对于DDR400-I所取得的成功以及它对DDR-II 的面世所产生的影响,业界的分析人士持有不同的意见。在描述存储器总线的速度时,"峰值"这个词是关键。当你将串行数据从小型读出放大器阵列流式传送出去时,DDR SDRAM 和 直接式 RDRAM 提供的峰值数据传输速率的确都给人留下了深刻印象。但是,在这些伪高速缓存器的背后隐藏的是低成本和其随机存取时间大约为60毫微秒的低速DRAM 阵列。另外,还要考虑多路复用地址总线的多时钟系统开销,因为每当你访问一个未启用的 DRAM 页面时都会遇到这一种对性能有影响的开销。
  英特尔公司初规定用于 Canterwood 和 Springdale芯片组的DDR400-I SDRAM,是所谓的3-4-4 类型。3-4-4指的是:数据的3时钟周期 CAS(列地址选通脉冲)、CAS的4时钟周期 RAS (行地址选通脉冲)以及4时钟周期RAS 预充电等待时间。为了从DDR-I SDRAM 体系结构中获得这一速度, 英特尔公司将该器件的芯核电压和输入/输出(I/O)电压提高到 2.6V,并将这两个电压的容差减小到±0.1V;速度较慢的DDR-1 器件的工作电压为2.5 ±0.2V。在某些应用中,与时钟速率更快、但等待时间更长的DDR400-I 对应部件相比,主流的2.5-3-3 或速度更快的DDR333-I 器件具有大致相当甚至更好的性能!这些器件的成品率较高,因而相应成本较低。
  随着台式PC市场的日趋成熟和增长速度放慢,寻求高利润率缺口产品市场的公司日益将目标瞄准"超时钟用户",亦即为了寻求更高的图形帧速度和优化其他性能指标时而使系统的电压和时钟速度超过
其额定值的计算机用户。Corsair公司的 XMS模块、Kingston 科技公司的HyperX模块和 Mushkin公司的高性能Black模块均采用比商用器件更先进的计时规范,并证明了较短的存储器等待时间在决定整个系统性能方面的重要性。例如,Kingston公司出售 333 Mbps/引脚的 PC2700 2-2-2、370 Mbps/引脚 的PC3000 2-2-2、400 Mbps/引脚 的PC3200 2-2-2 和 434 Mbps/引脚 的 PC3500 2-3-3 DIMM,PC3500  2-3-3 MIMM内含铝散热器来实现散热效果。
  至于 AMD公司的 Athlon CPU,虽然该公司原来的 200 Mbps/引脚的前端总线数据传输速率超过了英特尔公司的奔腾 III 前端总线的速率, 但是英特尔公司推出奔腾 4,摘取了速度方面的皇冠,而且没有停滞不前。一代的Athlon XP 芯片采用333 Mbps/引脚的传输总线,而且近的芯片组新合作伙伴宣言表明,AMD 公司会很快改用 400 Mbps/引脚的总线。与Transmeta公司用于 SDR
和 DDR SDRAM 的 Crusoe、惠普公司用于直接式 RDRAM 的 EV7 Alpha 以及英特尔公司从未公布过的用于直接式 RDRAM 的 Timna 一样,AMD公司即将推出的 Athlon64 CPU将 DRAM 控制器嵌入微处理器中。这样做,可以通过外部芯核逻辑消除数据传输延迟,从而将 DRAM 与微处理器之间的等待时间影响降至程度。
  演进理论
  然而,存储器供应商和用户终都会走到这一步:他们再也不能够经济有效地使一种体系结构达到其原本不想达到的更高的运行速度。正如 Nvidia 公司的蒙特里姆所指出的,"时钟速度和设计经验这两条曲线终有一个交点,至此,所需要的时钟速度超过设计经验。我们要达到这个转折点,就得改用新一代存储器。"即将问世的DDR-II 体系结构如何利用以成本为侧重点的 DRAM 阵列,在以同样甚至更低功耗的条件下进一步提高性能--或者在性能保持不变条件下如何获得更高的收益呢(图 3 和表 1)?

图3  与现用的DDR400-Ⅰ产品相比,DDR400-Ⅱ的成品率优势(a)

应该转换成较低成本优势(b)。

  与 DDR-I 相比,DDR-II 有一项关键性的改进,就是改用更低的1.8V 芯核电压和 SSTL I/O电压。另外,为了减小阻抗和连线长度,DDR-II 器件将不用TSOP 封装,改用 BGA 封装。(出于同样的原因,某些 DDR-I 芯片已经采用了BGA 封装。)DDR-II 存储器采用所谓的 4n 预取方式,为每个数据位同时取4位串行信息,而 DDR-I 和SDR  SDRAM则分别采用 2n 预取方式和 1n 预取方式。获得此项功能所付出的代价是,稍许增大了外部电路,以便能够保持面积的低速 DRAM阵列。从1 Gb这一代开始,DDR-II 器件还将采用8存储体阵列,而低密度器件和DDR-I 芯片则采用4存储体阵列。
  为了方便系统集成,特别在载荷量很大的高端工作站和服务器设计中,DDR-II 器件将支持可选用的差分数据选通脉冲以及读出加单个写入周期等待时间。 (DDR-I 使用固定的单周期写入等待时间。) DDR-II 器件还具有发送的CAS,亦即一种锁存于列地址之前向存储器发送读写指令的能力。通过所发送的指令,存储器控制器可以启用和配置每个存储器的片上终端负载电阻器阻值,并校准每个芯片的输出驱动器强度。虽然DDR-II DIMM 的尺寸与DDR-I 的相同,但是输出引脚有所不同,能更可靠地传送功率,而且从184个触点增加到240个触点,以便包含几乎为以前 3 倍的接地点并增加其他信号。因此,尽管DDR-I 和 DDR-II的 SODIMM 输出引脚和间距完全一样,但是 DIMM 触点的间距却缩小了。还应当注意的是,在DDR-II 这一代器件中,每块母板的印制线可连接到仅仅两个没有缓存器的DIMM,而在DDR-I中,则可连接4个DIMM。
  英特尔公司突然改变立场,支持 DDR400-I,是因为它改换到 800 Mbps/引脚的前端总线比预期的快,还是因为DDR-II产量上升比预期的慢,或是这两个因素综合作用的结果? 没有一种肯定的说法,也没有人怀疑峰值数据传输速率与CPU匹配的DRAM接口的市场价值。但是,由于DDR400-I 真实的性能潜力还存在若干不确定性,具有所预测的3-3-3 和 2.5-3-3 速度的DDR400-II 以及后续的速度为533 MHz 和更快的器件很可能成为业界长期使用的DDR SDRAM 方式。
  新的封装、新的模块、新的芯片设计、新的测试仪
器和新的测试流程均会促使成存储器市场的短期动荡不定,根据《世界半导体贸易统计》杂志的估计,去年存储器市场的销售量达到将近 6000 亿位。Kentron 公司希望通过它一直推广了很多年的QBM(四存储体存储器)技术来利用这种动荡不定局面。QBM 利用 ST 微电子公司的FET开关阵列和IDT公司的时钟电路来实现多个SDR SDRAM或 DDR-I SDRAM 的输出之间的快速切换,只要对DDR-I 增加一个小模块,就可提供相当于DDR-II的峰值性能(图4)。Via科技公司计划用其阿波罗PT600 芯片组来随时随地支持双通道 QBM 模块;该公司希望此项试验比它以前为日本NEC公司(现在已停产的)虚拟通道DRAM进行的试验更成功。

图4  FET开关阵列在DDR-ⅠSDRAM的多个存储体之间触发,使它们能以DDR-Ⅱ相似速度运行;
  Rambus公司也急切希望能从DDR-I 向 DDR-II过渡的动荡局面中受益。它的合作伙伴 SiS公司的 R658 芯片组,如同英特尔公司的 i850一样,也采用双通道RDRAM 接口,但与 i850不同的是, 除了PC800 和 PC1066
器件外,它还包括PC1200 存储器。预计今年第3季度上市的 SiSR659 将包括4个 Rambus 通道,如与PC1200器件结合,总峰值带宽将达到9.4 GB/s,所需接口引脚总数也比同等带宽的多通道 DDR SDRAM 要少得多。
  千兆级图形存储芯片
  密切关注图形业务的人们认为,获悉业界正在朝着大批量生产连接于64位存储器通道并以200 MHz时钟速度运行的DDR SDRAM这一目标努力,是令人有些奇怪的。毕竟,ATI 科技公司的Radeon 9800 Pro 图形板还是采用了连接于256位总线的340 MHz DDR SDRAM,Nvidia 公司的 GeForce FX 5800 Ultra 也将500 MHz DDR SDRAM连接到128位总线上。PC的主存储器与PC的图形存储器之间导致性能差异的不同之处是什么?
  图形芯片通过2.5英寸或更短的点对点单个负载总线连接到帧缓存器,而主存储器使用的是长得多的多点总线。此外,图形芯片不必对付模块连接器阻抗。或许重要的是,对于图形芯片来说,标准化过程要简单得多。大多数图形卡制造商擅长于营销,而不精于工程设计,因此直接将芯片制造商的基准设计拿来生产,而不做任何改动。对于每一代产品,图形卡制造商都与一家或数家存储器制造商达成供货交易,让其提供经过专门测试的产品变型,其阻抗、工作温度、电压或许都与原来的不同,而且这些参数的容差范围也比PC主存储器的对应参数容差范围更窄。
  有时,图形卡制造商与存储器制造商结成合作伙伴,生产定制DRAM。例如,低功耗的GDDR2-M SDRAM,它是Elpida 公司开发的,而ATI 科技公司将它用于Mobility Radeon 9600中(参考文献 3)。与 DDR-II SDRAM相比, GDDR2-M 芯片的片上终端负载通过一个NMOS晶体管将数据总线拉至地电位,从而无需吸收直流成分,而在普通存储器中则要将数据总线拉到数据总线高电平和低电平的中间电平。GDDR2-M 芯片只包括长度为4个脉冲串、一个串行脉冲串序列、一个固定脉冲串起始地址和长度为1的写入等待时间。此外,这些芯片还支持数据反转功能,以减少周期之间的外部总线转换。在读出期间,一个数据掩蔽信号与每8个数据位配对,而在写入期间,每32个数据位与一个数据反转掩蔽信号配对(图5)。

图5  数据反转支持图形帧缓存器在读和写操作周期期间使外部总线传输速度化。
  然而,随着图形芯片行业竞争的日趋加剧,成本的压力就日益增大,由多家制造商和多家用户标准化的变型产品更加有吸引力。存储器制造商和图形卡制造商之间合作的成果就是制定了GDDR3 规范,该规范适用于时钟速率高达800 MHz 的存储器。GDDR3 没有使用DDR SDRAM的基于电流的SSTL总线,而采用基于电压的伪漏极开路输出。单向单端选通脉冲信号的空闲状态是VDDQ,以简化选通脉冲信号的分配。但是,与 DDR-II SDRAM一样, GDDR3 芯片在写入时将数据置于时钟窗的中央,而在读出时把数据按时钟脉冲边缘校准。
  利用其 Yellowstone 技术,Rambus 公司正在加倍努力,以夺取图形产品和其他消费类产品市场,这些产品以及任天堂 64 和 Playstation 2 都是该公司批成功范例(图6)。Yosemite 采用低电压低功耗差分信令技术,具有在每个时钟边缘传输8位数据的能力,并能以 2.5 ps的进行FlexPhase 精密数据传输。这种精密数据传输解决了印制电路板走线、封装和片上时钟偏离等问题,从
而能够实现低成本系统的生产。

图6  低摆幅差分信号传输和8倍速时钟数据传输多路实现Yellow-stone的性能效力。
  Yosemite 的初始变型产品将以 3.2 Gbps/引脚的数据速率运行, 该公司计划将Yosemite的数据速率提高到6.4 Gbps/引脚。Elpida 公司、索尼公司和东芝公司都获得了使用 Yellowstone 技术的许可证。索尼公司和东芝公司还获得了使用高速并行 Redwood 逻辑接口的许可证,这项技术肯定会应用在未来的 Playstation 游戏机上。与 DRAM 芯片相比,RDRAM 芯片过长的随机存取等待时间一直阻碍着该芯片成功地应用于非PC的主存储器中;至于Rambus公司在 Yosemite 这代产品中是否解决了这个问题,现有的 Yellowstone 文件中没有披露任何信息。该公司去年夏天展示了个基于逻辑过程的 Yellowstone 接口试验芯片。
  尚未走完的路
  在读者中间,仅仅很少一部分人从事PC或图形子系统的设计。那么,为什么本文的主要篇幅都用来讨论PC和图形子系统使用的DRAM呢?其原因是,PC和图形子系统是两
个的DRAM消费市场,因此销售到这些市场的DRAM芯片往往是价格的。价格常常是你在选择存储器时考虑的重要因素。(更准确地讲,它常常代表了你所考虑的10个重要因素!)
  然而,有时会漏掉某种特点受欢迎的功能或存在与用户需求不符之处,但不包括你使用普通的DRAM。或许你需要更快的随机存取速度,以便与非顺序的数据读写相匹配。或许你要求DRAM具有更低的平均功耗,提供一条去多路复用的地址总线和其他一些常规控制信号。不必担心:机会即将来到。由于PC市场疲软,DRAM 制造商不能只耍嘴皮,必须支持新兴的各种应用,否则工厂就要停工。
  今年还将发表一篇文章,论述取代DRAM的高速和低功耗SRAM,请注意阅读。在此之前,如果你很关注高速存储器,那么请留意Enhanced Memory公司的ESRAM、三星公司和东芝公司的FCRAM以及英飞凌 (Infineon) 公司和 Micron 公司的 RLDRAM。如果你尤其关注的是功耗问题,请考虑 PSRAM、符合JEDEC规范的低功耗SDRAM(具有部分刷新模式、温度补偿刷新模式和深度省电等模式)以及富士通公司的 FCRAM。
  参考文献
  1. Dipert, Brian, "The slammin', jammin' DRAM scramble," EDN, Jan 20, 2000, pg 68.
  2. Denali Memory Report, June 2000, pg 10.
  3. Dipert, Brian, "Graphics power plants expands their integration grasp," EDN, April 3, 2003, pg 16.

  欲知详情
  你与以下制造商直接联系时,请告诉对方你是从EDN China杂志获知其产品信息的。
  AMD(Advanced Micro Devices) www.amd.com
  Cisco Systems   www.cisco.com
  Elpida Memory   www.elpida.com
  Hewlett Packard   www.hp.com
  Inquest Market Research  www.inqst.com
  Kingston Technology  www.kingston.com
  Nvidia    www.nvidia.com
  ATI Technologies   www.ati.com
  Avnet    www.avnet.com
  Corsair    www.corsairmemory.com
  Denali Software   www.denali.com
  Enhanced Memory Systems www.edram.com
  Fujitsu    www.fujitsu.com
  IDT (Integrated Device Technology) www.idt.com
  Infineon Technologies  www.infineon.com Intel    www.intel.com
  Kentron Technologies  www.kentrontech.com
  Micron Technology  www.micron.com
  Mushkin    www.mushkin.com
  Rambus    www.rambus.com
  Samsung Electronics  www.samsungelectronics.com
  SIS (Silicon integrated Systems) www.sis.com.tw
  Sony Corp   www.sony.com
  STMicroelectronics  www.st.com
  Toshiba    www.toshiba.com
  Transmeta &n

bsp; www.transmeta.com
  Via Technologies   www.viatech.com.tw
  Xilinx    www.xilinx.com
  WSTS     www.wsts.org


  
上一篇:包含8位I/O扩展器和2Kb串行EEPROM的IC
下一篇:先进的MRAM技术受到IBM公司 和英飞凌公司研究人员青睐

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

相关技术资料