纳米级设计的时序收敛问题
在当今的市场上,时序收敛依旧是主要的问题。2004年,一半以上的SOC 设计都是采用130nm或以下的工艺技术。这会对时序收敛带来两大挑战。首先,在130nm及以下工艺,互连线对时序的影响越来越复杂,因而需要全局规划,物理综合和布线必须用与以往不同的方式通力合作才能达到时序目标。第二,设计人员充分利用纳米工艺技术使芯片的规模越来越大,使得传统的物理综合和布线工具难以接受如此大的容量。
目前,使用传统的物理综合和布线工具的设计人员也面临着以下压力:
● 物理综合和布线工具的运行时间(runtime)无法忍受。这是由于要处理更大规模和更复杂的设计造成的。
● Real-wire的实现很晚进入设计流程,在布线之前所谓的时序收敛不考虑real-wire 的拓扑结构,使得布线之后的时序难以收敛,或增加迭代次数。
● 对纳米级设计而言,设计收敛不仅仅是时序收敛。还要考虑面积、功耗、信号完整性等诸多因素及其相互之间的影响。
因此,设计人员为了要达到时序收敛目标就必须解决以上这些问题。
硅虚拟原型
理想上逻辑综合和物理实现之间的交互是在同一环境中。这样根据real-wire的拓扑结构进行有效的基于综合的优化,包括逻辑的重组、关键路径的优化,并可以同时考虑相关因素的影响。
因此,影响时序收敛流程需要解决的首要问题便是合理设置约束条件和连线拥挤程度(包括宏模块的布局和电源线的规划),而并不仅仅是时序优化本身。如果在物理实现不可行的设计上进行优化,时序是不可能真正达到收敛的。真正解决这些问题便是在早期产生real-wire。基于线的收敛基本的便是产生整个设计的物理原型。这样设计人员才可以在早期知道他们的目标和约束条件可否实现,以及如何实现。设计人员可以快速评估芯片实现的硅性能各个方面以及均衡各个方面的反馈信息。硅虚拟原型也能够帮助设计人员为层次设计提供可实现的时序预算。硅虚拟原型还可以提供一些重要的信息,譬如功耗和裸片尺寸的信息。
物理综合
一个差的版图会影响好的设计,但好的版图并不会使低速设计的速度加快。初始的逻辑结构是非常关键的。新的综合算法,会为物理优化产生一个良好的起点,意味着易于优化、较快的运行时间和优良的性能。
一旦有一个好的逻辑网表(或RTL)、好的综合技术和高质量的设计计划,便可以进行物理综合。 新的物理综合解决方案是在单一环境下硅虚拟原型和物理综合的结合。这将大大地减小对线负载模型的依赖,在时序收敛周期的早期可以得到的线负载信息。
我们来关注一下物理综合的容量问题。90nm的工艺技术可以支持超过3千万门的设计,然而代的物理综合只能处理1百万到2百万的非层次化的设计。在这样的设计流程中,规模达5千门的芯片设计只能划分为50个左右的单独模块,这使得在顶层上时序、信号完整性、功耗完整性几乎不可能达到收敛。
绝大多数的设计人员希望在顶层上只有6、7个模块。为了支持纳米级的SOC设计,物理综合可以处理非层次化的8百万到1千万门的模块,可以接受的运行时间通常是一天(是一个晚上),而且不影响硅性能。
同时,传统的物理综合也有一些有局限的地方。譬如,优化时每次只能优化一条路径,集中于小部分的单元。这使得这一过程很慢,占机器的内存很大,处理电路规模的容量也就受到限制。
然而,新一代的物理综合技术可以从全局出发同时优化多条路径。这样可以有效地解决整个芯片的时序收敛问题,避免只考虑局部的关键时序路径,又引起其他路径的时序问题,同时达到全局的时序收敛。
新一代的物理综合技术不仅仅进行全局的时序优化,还可以考虑信号完整性、功耗、芯片面积、走线的长度和拥挤程度等问题。
布线
在纳米级尺寸时,时序收敛需要考虑连线之间的串扰问题(crosstalk)。有效的解决方案是在设计流程的早期利用真正的连线的物理信息作为基础来考虑这些问题。同样在终的详细的布线阶段考虑时序收敛的同时,也要考虑预防串扰所带来的功能上的失效和对时序的负面影响。因此,应尽量利用新的布线工具相应的技术避免串扰导致的问题,例如为关键的走线增加屏蔽线隔离、增加走线的间距、加入驱动单元、改变驱动大小等。同时通过增量的金属层参数提取、时序分析、信号完整性的预防和纠正,以及时序优化,提供同时完成时序和信号完整性收敛的解决方案。针对纳米工艺技术,布线工具还需要考虑制造过程中的提高成品率的问题,如双过孔的插入、天线效应的修复等等。
如今的芯片设计规模越来越大、工作频率越来越高、复杂程度越来越高,新的布线工具采用基于图形的布线算法,使其成为高速度和高容量的布线器。同时采用超线程布线加速技术,超线程技术集合了多线程布线和分布式并行布线的优势。它不再仅仅通过传统的32/64bit计算机资源来提升600K门到400M门设计的布线性能,同时借助于LSF网络协议或者人力推动网络使其性能提升了10倍。例如,13M门设计访问一个CPU需要24小时,但是如果在一个拥有7对32bit双处理器的Linux网络中,使用超线程技术同时利用这14个 CPU,所需时间不到两个小时。另外,比如6M门设计,相对于单一CPU的网络中的7个小时来说,在有着20个CPU的网络中使用超线程技术完成布线只需不到34分钟。这使设计人员能以低成本的计算机技术快速实现硅质量(QoS)。
设计收敛
布线工作完成以后,我们还需要对真实的线提取参数进行sign-off 分析。由于采用纳米工艺技术,参数提取时需要考虑制造时带来的光学接近校正(OPC)、凹陷(dishing)、侵蚀(erosion)等问题。计算延时时需要考虑噪声和串扰对时序的影响,还要进行功耗分析,包括电迁移(EM)和压降等。 压降会对延时有影响,同样会使芯片的性能有明显的下降。
因此,对纳米设计而言,不仅仅需要考虑时序收敛还要考虑设计收敛,即时序收敛、功耗和信号完整性共同的收敛,才能确保设计人员在短的时间实现QoS。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。