何谓 SMP 我们为什么需要它
平时所说的双CPU系统,实际上是对称多处理机系统中常见的一种,通常称为2路对称多处理,它在普通的商业、家庭应用之中并没有太多实际用途,但在制作,如3DMaxStudio、Photoshop等软件应用中获得了非常良好的性能表现,是组建廉价工作站的良好伙伴。随着用户应用水平的提高,只使用单个的处理器确实已经很难满足实际应用的需求,因而各服务器厂商纷纷通过采用对称多处理系统来解决这一矛盾。在中国国内市场上这类机型的处理器一般以4个或8个为主,有少数是16个处理器。但是一般来讲,SMP结构的机器可扩展性较差,很难做到100个以上多处理器,常规的一般是8个到16个,不过这对于多数的用户来说已经够用了。这种机器的好处在于它的使用方式和微机或工作站的区别不大,编程的变化相对来说比较小,原来用微机工作站编写的程序如果要移植到SMP机器上使用,改动起来也相对比较容易。SMP结构的机型可用性比较差。因为4个或8个处理器共享一个操作系统和一个存储器,一旦操作系统出现了问题,整个机器就完全瘫痪掉了。而且由于这个机器的可扩展性较差,不容易保护用户的投资。但是这类机型技术比较成熟,相应的软件也比较多,因此现在中国国内市场上推出的并行机大量都是这一种。PC服务器中常见的对称多处理系统通常采用2路、4路、6路或8路处理器。
图 1:多重因素推动移动设备对 SMP 的需求不断增长SMP 将推动移动应用和设备不断发展进步,而这正是目前单核解决方案所无法实现的。SMP 能激活执行任务所需的某个特定内核或多个内核,从而使 OEM 厂商能够实现高度可扩展的性能与电源,充分满足当今业界的应用以及未来潜在的创新应用。无障碍 Web 浏览等大量新型应用对移动设备提出了更高的峰值计算性能要求。我们固然可通过增加单核解决方案的尺寸来满足性能需求,但若增加功耗则对移动设备来说是不可接受的。SMP 正是满足此类需求的架构技术。推动PC处理器不断发展的挑战也同样推动移动手持终端转向多内核架构。此外,在较大型的单内核解决方案上实现更高性能会使成本和复杂性直线上升,从而因更复杂的设计和验证过程终导致产品上市时间拖延。PC 市场是促进 SMP 技术推广的催化剂,目前许多 PC 都内置了双核乃至四核处理器。ARM Ltd. 一直积极推动 SMP 技术向手持终端市场发展,并推出了 Cortex-A9 MPCore 架构。只有根据不同的使用情况优化功耗和性能,才能限度地延长电池工作时间并实现性能。SMP 使智能电话能够集成 PC 以及传统电话的功能,让单部移动设备满足用户对功耗与性能的需求。ARM 目前在移动设备市场上占据主导地位,因而我们既需要支持传统代码,又需要支持功能丰富的工具。展望未来,SMP 将必须确保支持可实现正常工作的传统代码,同时还要节约功耗,提高性能。如果单内内核设备需要的高速缓存量为 N,那么多内核设备保持良好性能所需的缓存量就应为 4*N。此外,我们还要考虑数据一致性和系统存储器一致性等其他存储器设计问题,才能确保所有处理器都能在准确时间存取当时的数据。ARM Cortex-A9 MPCore。
图 2:ARM Cortex-A9 MPCore为移动设备实现可扩展的功率与性能为了满足移动手持设备市场对可扩展功率与性能的需求,ARM 推出了 Cortex-A9 MPCore 架构。该架构与 ARM Cortex-A8 相比,可将处理效率提高 20% (IPC),从而帮助设计人员以更低的频率完成更多的工作。Cortex-A9 MPCore 可在一个群集中支持多达 4 个内核,能够为客户设计产品、满足特定需求提供高度的灵活性。
NEON 媒体处理引擎可加速媒体处理功能;
比前代 ARM FPU 性能提高一倍的浮点单元;
优化的 1 级高速缓存可限度地降低时延与功耗;
Thumb-2 技术可将存储器要求降低 30%;
TrustZone 技术支持可靠的安全应用;
L2 高速缓存控制器支持低时延、高带宽存储器存取;
CoreSight 多内核调试与跟踪架构可在开发调试期间提高可视性。
Cortex-A9 MPCore 内核比 Cortex-A8 更小,在降低功耗的同时提高了处理效率。可扩展峰值性能与电源管理相结合,使 Cortex-A9 MPCore 性能超过了同类单内核架构,并可为多内核设计提供明显的优势。Cortex-A9 MPCore 不但能够实现可扩展至多个市场的统一平台,同时还可充分利用通用软件开发来降低研发成本,加速产品上的市进程。
SMP 赋予应用与产品的优势
目前,制造商希望投资于一款能够使其在不同级别产品中充分利用与扩展、并同时满足未来需求的平台。SMP 能够以真正的性能可扩展性全面满足这一需求。与只能提高单个内核速度的前代解决方案不同,SMP 将为整个多内核实现真正的可扩展性,为每一款产品实现性能与功耗的组合。SMP 将允许制造商在统一的平台上以更高的性能支持如上网本等未来产品。对称多处理机的系统结构,主要指处理器、存储器、输入输出(I/O)设备三者之间的连接,它对我们更好地理解多处理机操作系统是非常必要的。多处理器与存储器之间的连接:
SMP 软件的影响
SMP 可为各个层面的软件大幅提高性能。对于不支持 SMP 的软件,我们可使用操作系统任务管理器在每个内核上启动进程来实现并行工作。并行进程执行自然会提升性能,虽然其效率不如线程级处理那么高,但也不会对应用开发人员造成更多的设计麻烦。
图 3:SMP 可在软件的进程与线程层面上提高性能随着移动设备性能的不断提升,用户应用的复杂性也在不断增加,在此情况下,应用程序应更多地以并行方式进行编写(如采用线程方式),因此,我们便可充分发挥 SMP 的真正优势与增益。线程构成进程,不必反复返回操作系统寻求资源。应用开发人员不但要采用并行方式进行软件设计,而且还必须注意进程中线程的互动方式。 某些应用本身就是多线程的,从而使 SMP 能够实现更高的性能,更快的响应时间以及更出色的整体用户体验。预计这些 PC web 浏览器所使用的这种技术也将用于移动领域。 Symbian 和 Linux 移动操作系统均全面支持 SMP。这种支持针对移动环境进行了专门优化,将使所有处理器内核的单一操作系统内核映像以及调度器中的负载平衡能够帮助确定在哪个内核上运行哪个任务或线程。在处理原有软件时,我们必须注意正确的任务同步,以避免系统锁死。在SMP系统中,操作系统可在安排低优先级任务运行在一个不同内核上的同时,让一个具有较高优先级的任务运行在另一个内核上。如果软件包含不明确的同步,则会产生导致锁死情况的错误判断。
SMP 的电源管理
SMP 提供的可扩展电源优势可用来扩展内核频率与工作内核的数量。Cortex-A9 MPCore 能够分别启用与关闭不同的内核。如果内核处于开启状态,则必须运行在相同的时钟频率下。因此,为了高效使用 SMP 内核的电源管理,必须通过测试来确定以下两种选项的性能与功耗基准:一、在关闭其它内核的同时,以时钟频率在单个内核上全速运行进程;二、多内核同时运行进程,但运行的时钟频率降低。SMP 采用的其它电源管理技术还包括动态电压与频率缩放 (DVFS),可根据所需的性能来调节匹配系统的频率与电压。操作系统可实现负载平衡,这也有助于改善电源管理,并帮助设计人员针对功耗来优化系统。
图 4:TI 全新 OMAP 4 平台为移动设备带来 SMPOMAP 4 平台的主要特性包括:内核 ARM Cortex-A9 MPCore SMP 通用处理器,可提高性能与效率;
IVA 3 硬件加速器,可实现真正的 1080p 多标准高清录制与回放功能;
影像信号处理器 (ISP) 支持高质量影像与视频捕获,可实现堪比 SLR 的数字高性能,捕获 2000 万像素的静态影像;
Imagination Technologies POWERVR? SGX540 3D 影像内核支持 3D 用户界面,可实现更大的显示屏、逼真的图像以及直观易用的触摸屏等应用;
音频后端 (ABE) 处理器可为显着降低功耗提供虚拟低功耗音频芯片;
灵活的系统支持:
复合型 TV 输出
HDMI v1.3 输出可驱动高清显示屏
色彩丰富的更大显示屏支持
外设接口:MIPI 串行摄像机和串行显示屏接口、MIPI? SLIMbusSM、MMC/SD、USB 2.0 移动高速、UART 以及 SPI 等
支持各大操作系统:Linux(包括 Android 和 LiMo)、Microsoft Windows Mobile 和 Symbian;
45 纳米移动工艺技术可提高性能与电源效率;
优化的电源与音频管理配套芯片:TWL6030 和 TWL6040
TI 是一家可为 SMP 提供所有主要移动操作系统支持的公司,这些操作系统包括 Symbian、Linux 以及 Microsoft Windows Mobile 等。OMAP 4 平台是移动产业有关 SMP 转型的解决方案,其架构专为优化 SMP 性能而精心设计。例如,我们在设计时对存储器架构、高速缓存量以及存储器接口等给予了充分的考虑,能够以的延迟实现性能。OMAP 4 配套提供的 TI 综合软件套件专为 SMP 编写,可充分发挥 SMP 架构内在的处理性能增强与省电优势。OMAP 4 平台采用市场上高效的电源管理技术,可进一步节省电源。该处理器充分利用 TI SmartReflex? 2 的电源和性能管理技术,可提供各种智能、自适应性软硬件技术,能够根据器件工作情况、操作模式以及温度等动态控制电压、频率与电源,具体包括:动态电压与频率缩放 (DVFS);
自适应电压缩放 (AVS);
动态电源切换 (DPS);
静态漏电管理 (SLM);
自适应体偏压 (ABB);
针对速度较慢器件的顺向偏压 (FBB)
逆向偏压 (RBB),可为速度较快的器件减少漏电
OMAP 4 平台充分利用 TI 在移动设备领域的知识与丰富经验,可为当前及未来应用提供基于 SMP 的处理器解决方案。OMAP 4 SMP 的强大功能
OMAP 4 SMP 的强大功能
图 5:OMAP 4 SMP 可实现类似 PC 的 Web 浏览体验在第二个使用中,一位消费者正在使用手机欣赏 H.264 视频。这种多媒体应用通常不适用于多线程处理技术,因此采用单内核工作。在本例中,OMAP 4 将两个内核之中的一个关闭,并让另一个内核在更高频率下工作,从而可提供出色的多媒体内容。由于只有一个内核工作,因而可降低功耗。
图 6:OMAP 4 实现出色的多媒体内容结论
为了提高多处理机系统的可靠性,应使操作系统具有重构能力:当系统中某个处理机或存储块等资源发生故障时,系统自动切除故障资源并换上备份资源,使之能继续工作。如果没有备份资源,则重构系统使之降级运行。如果在故障的处理机上有进程亟待执行,操作系统应能安全地把它迁移到其他处理机上继续运行,处于故障处的其他可利用资源同样也予以安全转移。
SMP对满足新一代移动设备的高性能与低功耗需求将至关重要。SMP 具有可扩展的功率与性能,能够为单内核解决方案提供独特的优势。未来应用将更多地使用多线程技术,这将推动 SMP 成为我们的平台。TI 的 OMAP 4 平台是率先提供 SMP 技术的产品,不但能够实现可扩展的通用处理性能,同时还可提升多媒体处理领域(影像、图像、音频与视频)的功能。我们必须注意,SMP 不会吸收这些多媒体领域的功能,这些多媒体领域需要可在功耗下实现性能的专门引擎。OMAP 4 可提供 SMP 的优化组合,能够与非对称多处理技术 (AMP) 配合工作。TI OMAP 4 平台是在移动设备中推进 SMP 技术的解决方案,可支持未来奇妙的应用。
免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。