数据中心运维人员总是不断在寻求更高的服务器性能。目前,他们主要是通过易于编程的多核CPU 和GPU来开发应用,但
CPU 和 GPU 都遇到了单位功耗性能的瓶颈壁垒。从事海量数据中心应用开发(如密钥加速、图像识别、语音转录、加密和
文本搜索等)的设计人员既希望GPU 易于编程,同时又希望硬件具有低功耗、高吞吐量和时延功能。然而,多核CPU
和 GPU 加速器在可扩展性上存在严重的问题 :客户希望用简单的全高度插入式 PCIe 开发板作为数据中心服务器的应用加
速器。这种开发板经配置可运行高功率图形卡,但客户同时希望功耗不超过25W,以便化可扩展性并化总功耗。
最近赛灵思同瑞士苏黎世联邦理工学院(ETH Zurich)联合开展的一系列研究发现,基于 FPGA 的应用加速想比 CPU/GPU
实现方案,单位功耗性能可提升 25 倍,而时延则缩短了 50 到 75 倍,与此同时还能实现出色的 I/O 集成(PCIe、DDR4
SDRAM 接口、高速以太网等)。换言之,FPGA 能在单芯片上提供高能效硬件应用加速所需的功能,并同时提供每个
开发板目标功耗低于25W 的的解决方案。
中国网络服务企业百度公司在美国加州圣何塞举行的 2014 年热门芯片研讨会上介绍了支持性调查结果。百度的结论
如下 :
• 中端 FPGA能够实现 375 GFLOPS 的性能,功耗仅为10-20W
• 基于 FPGA 的加速器可部署在所有类型的服务器中。
• 和 CPU 和 GPU 相比, FPGA 在深度神经网络(DNN)预测系统中性能更加出色。DNN 系统用于语言识别、图像
搜索、OCR、面部识别、网页搜索以及自然语言处理等各种不同应用。
该信息来源于网络,如有侵权,请及时与我们联系