如今,人工智能(AI)不仅是一个学术课题,而且正在快速应用到真实世界当中,例如人脸识别、机器人技术、革新性分析、疾病预防、智能城市建设等领域。目前,众多突破性科技进步都要求加速机器学习(ML)和深度学习(DL),因此大量GPGPU的采用将满足对于巨大计算能力的迫切需求。
P90G4是一款专门构建的4U复合GPGPU服务器,包括1个基于最新英特尔® 至强®可扩展处理器的1U服务器节点和1个3U PCIe扩展盒,容量最多可支持8个最先进的GPGPU卡。为满足不同需求的不同工作负载,P90G4可以通过简单的线缆布线调整来支持GPGPU和CPU之间的多种拓扑和带宽。此外,对Infiniband网络的支持使其可以轻松扩展到多个GPGPU集群。
低延迟和高带宽且支持数据中心的平台
P90G4旨在加速高性能计算(HPC)和AI应用或框架。凭借基于英特尔® 至强®可扩展处理器的双插槽头节点和支持多达8个GPGPU的PCIe Gen3扩展交换机,可以实现GPGPU和CPU比率的动态平衡。此外,为了促进数据培训工作,并行计算的效率至关重要,具有高带宽PCIe互连的P90G4架构将推动高效的点对点通信,并最大限度地减少延迟。
变体AI应用的框架灵活性
P90G4系统可以支持单根和双根复合体。以ML案例为例,双根复合体可以在CPU中安排大型任务,在GPGPU中安排小型或分布式数据培训工作。P90G4的灵活性使其成为所有流行的DL/ML框架(如TensorFlow、Caffe等)的弹性AI平台。
为HPC构建的弹性系统
考虑到大型和超大规模数据中心的物理限制,GPGPU加速也是优化高性能计算(HPC)应用和远程虚拟化的解决方案之一。通过各种配置方法,P90G4不仅支持单头和多头节点,还允许根据各种应用生成的替代工作负载随机选择GPGPU数量。P90G4是一个支持HPC的平台,可提升云规模的灵活性和可替代性。
可靠性和可维护性设计
为了实现系统可靠性和降低运营成本,P90G4的大多数硬件结构都设计为可热交换,包括前置4+1冗余风扇模块和后置3+1电源。此外,服务器节点可以从4U机箱的前面卸下,在卸下顶盖后可以轻松安装GPGPU卡。P90G4在提供最佳性能的同时,提供高效的可维护性。