2018最新深度学习与神经网络的计算特点与硬件配置分析
2018最新深度学习与神经网络的计算特点与硬件配置分析
(一)深度学习训练平台现状与理想的计算架构分析
深度神经网络(DNN)计算数据模型繁多,结构复杂,主流模型含几十个隐含层,每层都在上千上万级的神经元,整个网络更多,其计算量巨大。市场上用于深度学习的训练计算机大致情况:
(1)服务器/工作站(支持2、4、8块GPU架构):普遍存在噪音大,无法放置于办公环境,必须放到专门的机房,维护成本高,另外数据存储带宽、延迟、容量也不尽如意。
(2)分布式集群架构:性能强大,但是开发成本太高,是大多数科研单位无法承受。那么问题来了,市场上是否有一个理想产品,弥补上述缺陷,让更多单位都能用的起~人工智能AI超级异构计算机。
UltraLAB GXM图灵系列工作站是2018年最新推出的、目前市场上一款集GPU超算、海量存储于一体、基于办公静音环境、应用于深度学习(机器学习、人工智能)的AI超级计算机系统。
和市面上深度学习计算机系统相比,显著优势:
· 完全处于办公环境(静音级)、不在被噪音所困扰
· 配备基于PCIe总线的海量高速并行存储(最大容量180TB),延迟低,支持最大15个并行读,硬盘io性能大幅提升,性能和管理远超传统的DAS/NAS存储系统
· 配备超级强大的计算能力,最大10个GPU卡,3.82万计算核,单精度浮点120Tflops
· 不需要专门的机房,不占过多空间,维护成本极低
· 不需要作业调度系统,管理难度大幅降低
(二)深度神经网络计算特点与硬件配置分析
市场上大部分GPU计算机(服务器/工作站),重点都放在GPU卡数量上,似乎只要配上足够GPU卡,就可以了,实际情况是,机器硬件配置还需要整体均衡,只有这样这台机器性能才能更好的发挥。
上述图示,深度神经网络计算大致流程,下面通过深度神经网络计算环节,分析核心硬件配置理想要求
常见计算机硬件配置上的低级错误:
1.为了省钱,硬盘用普通PC硬盘,寿命短,带宽低,或数量不够,
2. 为了节省,CPU用的最多的是Xeon E5 2620v(8核2.1GHz),频率太低,数据预处理太慢,成为整个计算的最大瓶颈,
3.为了把钱用到“刀刃上”—尽可能多配GPU卡,但是总显存比内存容量大,不合理,或者CPU核数低于GPU卡数,这些都会造成计算过程资源耗尽,数据来回从虚拟内存导入,计算变慢
(三)深度学习计算机、工作站最理想的硬件配置推荐
UltraLAB GX620M是一款集双Xeon可扩展处理器和多GPU超算、海量存储于一体、基于办公静音环境、是目前最强大的CPU+GPU混合计算模式的超级桌面计算机系统。
和市面上常规工作站硬件架构相比,显著特点:
(1)提供目前市场上,先进的低成本的桌面级异构超算架构
■支持最新Xeon Schalable(可扩展处理器) ,数量2颗,最大56核,支持AVX512指令集,较上一代Xeon E5v4性能提升显著
■具有强大GPU计算能力,最大10个GPU卡,
■配备基于PCIe总线的海量高速并行存储(最大容量180TB),延迟低,支持最大15个并行读,硬盘io性能大幅提升,性能和管理远超传统的DAS/NAS存储系统
(2)适合办公环境(静音级)、不在被噪音所困扰
(3)零维护成本
不需要专门的机房,不占过多空间,不需要专业维护工程师
不需要作业调度系统,管理难度大幅降低
(4)产品配置规格
典型应用分析与配置推荐
Ø 设计与仿真计算应用
借助2颗Xeon Schalable(可扩展)处理器,大幅提升结构、流体、多物理场耦合、电磁仿真等模拟计算求解速度
具备高io,显著降低隐式计算的密集回写等待时间,例如 结构静力仿真计算
配备高带宽的多GPU,满足支持GPU求解应用,例如CSTStudio
Ø 海量数据处理应用
主要是海量数据资料处理,例如地质资料处理、海洋资料处理、海量视频深度学习分析、大数据分析等
该机型支持单16盘位或双8盘位并行存储,提供最大到150TB存储容量,
配备先进2颗Xeon可扩展处理器和10块GPU计算卡,大大加速不同算法的多核并行计算
Ø 深度学习研究应用
这种应用计算三个环节需要加速:
(1) CPU单核计算模式的数据预处理,拥有Xeon可扩展处理器最高睿频到4.2GHz,非常理想,
(2) GPU海量并行数据处理,配备多大6/9块GPU计算卡,
(3) 海量数据需要一个理想的高io存储架构
Ø 生命科学计算、分子动力模拟等应用
传统算法还是需要更强大的CPU并行计算能力,另一方面,一些算法,借助GPU计算卡大大加速求解
Ø 大学科研桌面级超级计算系统应用
大学里科研应用的精度和深度越来越高,市场上可供选择的服务器/工作站都面临不断的更新换代淘汰,资金要用到合理,避免不必要的浪费,集群成本高,维护难度大,因此一种拥有全能混合计算能力、海量存储架构的微型超级计算系统,放到研究室、实验室里,是非常便利和实用,借助虚拟操作系统,满足更多学生共享使用,从事科学与工程仿真计算、海量图像处理、支持大型三维图形设计等。
UltraLAB GXM是一款静音级、真正高性能GPU超算的深度学习训练计算机,比市面上的机器,更安静,性能更强大,适合科研、研究部门在安静的办公环境下运行。
此外,该机型用途极广,扩展能力强, 调整配置后,可为电磁仿真计算(CST)、量子化学/分子动力学计算(VASP、AMBER等)、超大屏拼接(8X9=72路视频拼接合成)、视频剪辑合成、指纹识别等应用,提供强悍的计算、图形生成能力。
更多咨询交流,加我V信。