行业关键字
品牌专区评测 → 正文
旗舰工作站HP Z820 CAE深度测试报告
作者: 惠普 来源: 视觉同盟 时间: 2012年12月11日

随着制造业信息化应用的深入以及转型升级呼声的日渐高涨,由“中国制造”向“中国创造”的跨越将在未来很长一段时间内成为中国制造业发展的主旋律。传统粗放型加工生产模式将失去成长空间,拥有自主产品研发能力的企业将成为主流。在这一进程中,CAE作为产品设计过程的重要支撑,将在企业扮演着非常重要的角色。

利用CAE软件企业能大幅缩短产品的研发周期并提升产品质量,早期由于CAE技术性较强以及对硬件性能要求较高,一般的计算机无法满足企业的CAE计算需求,很多复杂的模型仿真分析需要依赖于高性能计算机才能完成,因此应用门槛较高。近年来,随着中国制造业自主研发能力的提升以及软硬件技术的飞速发展,这种基于硬件的性能瓶颈已不再是限制CAE发展的主要因素,高性能工作站已经能很好的满足绝大部分制造企业的CAE应用需求。同时,软件商也通过不断的推出功能更为强大的CAE软件并简化操作使得CAE应用得以发展,利用工作站对模型进行虚拟仿真分析不但能加速工程师的设计效果,也能提升企业的核心竞争力。

为展现CAE软件对于产品设计的重要价值,本文将从软件和硬件两个方面对CAE应用过程进行展现,并结合软件应用效果来分析硬件平台性能。本次测试选用的CAE软件是ANSYS Mechanical 14.0,硬件平台是惠普最新发布的HP Z820顶级图形工作站。
一、 评测思路
CAE分析主要有三个步骤,即:前处理、有限元求解计算、后处理。前处理中为产品建立合理的有限元分析模型,并进行单元属性定义、网格划分和载荷施加;有限元求解计算就是对有限元模型进行单元特性分析并求解的过程;后处理则根据工程或产品设计要求对有限元分析结果进行分析进而论证设计的合理性,以满足客户对产品的设计需求。本次评测主要划分为以下几个步骤:
1. 基本操作
一般在CAE软件中建立实体模型的方式有两种:
①利用CAE软件自带的实体建模功能创建实体建模。
②利用CAE软件与其他软件接口导入其他二维或三维软件所建立的实体模型。
2. 网格划分
在CAE分析中,网格划分是至关重要的一步,它直接影响到求解结果的精确度。要想对模型进行高效的网格划分,除了CAE软件本身必须具备强大的网格划分能力之外,工作站的计算性能也至关重要,所以评测小组将对锯床底座模型进行三个不同等级网格密度的划分,并记录三种网格密度下网格划分所耗时间、内存和CPU占用率,通过这些数据来分析CAE软件在工作站上运行时的网格划分性能。
3. 应力求解
作为整个CAE分析中计算强度最高的部分,有限元求解计算对工作站的计算性能要求很高,工作站的计算性能的强弱将直接影响到CAE软件的计算效率。在进行计算求解时,操作延迟、计算耗时过长是经常出现的问题,如果是多网格、高复杂度的计算模型,则更有可能导致死机、数据丢失。为了保证整个求解计算过程的稳定、高效,工作站需要具备与CAE软件良好的兼容性以及强大的计算能力。
二、 评测平台
1. 硬件平台
表 1 HP Z820工作站配置及软件环境


HP Z820工作站是惠普公司于2012年3月发布的新一代顶级图形工作站,搭配了英特尔刚推出的至强E5-2600系列处理器,该系列处理器用以替代之前的至强5600产品,主要定位于服务器和工作站。本次测试的HP Z820工作站搭配了2颗至强E5-2690处理器、32GB DDR3 ECC 1600MHz内存,以及NVIDIA公司的新一代Quadro 4000专业图形显卡。E5-2690处理器是E5-2600系列处理器中的顶级产品,拥有8颗核心以及16线程,主频为2.90GHz,最大可支持四通道频率为1600MHz的DDR3内存。英特尔官方测试数据显示,至强E5-2600系列较之前一代至强5600系列产品最高有80%的性能提升。


图 1 HP Z820图形工作站


2. 软件平台
表 2 软件及系统


ANSYS软件是融结构、流体、电场、磁场、声场分析于一体的大型通用有限元分析软件。它能与多数CAD软件接口实现数据的共享和交换,如Pro/Engineer, NASTRAN, Solidworks, AutoCAD等,是现代产品设计中的高级CAE工具之一。ANSYS Mechanical是ANSYS产品家族中的结构及热分析模块,除提供常规结构分析功能外,强劲稳健的非线性、独具特色的梁单元、高效可靠的并行求解、充满现代气息的前后处理是该软件的四大特色。


图 2 ANSYS 14.0


三、 CAE应用测试
1. 基本操作
本次测试选用了一个未经简化的锯床底座模型,线单元数为6409,面单元数为2501,属中等复杂模型。


图 3 未经简化的锯床底座模型

载入模型耗时25秒,缩放、旋转、拖动都相当流畅。通常工程师在前处理过程中为准确划分网格、施加载荷和约束都需要频繁的进行显示方式切换以及对模型进行缩放和拖动操作。


图 4 模型基本操作


2. 网格划分
在ANSYS中,网格划分有三个步骤:定义单元属性、网格划分控制、生成网格。网格划分是整个CAE分析中非常重要的一步,它直接影响着后续数值计算分析结果的精确性,但网格划分并非越细越好,理想情况下是以分析结果不再随网格划分密度的改变而改变为准。e-works测试人员对模型进行了三个等级的网格划分,均在16核全部调用的情况下进行。


图 5 HP Z820工作站网格划分耗时


图 6 HP Z820工作站网格划分处理器占用峰值


图 7 HP Z820工作站网格划分内存占用峰值

e-works测试人员记录下了不同网格密度下网格划分耗时、处理器和内存占用情况,这里需要提醒的是图表中所反应的数据信息均是峰值,即在整个计算过程中对处理器、内存的占用都没有超过图表中所反应的数据。


图 8 采用智能网格划分工具划分网格

图表数据表明,在节点数和网格数分别为299141和299808的划分密度下,整个计算过程耗时3分12秒,处理器占用峰值为3%,内存最高占用4.16G,划分采用的是ANSYS默认的智能网格划分,由于底座是薄壁型,我们选用了shell181单元,采用四边形网格面划分方式。ANSYS智能网格划分工具meshtool默认的网格密度能够满足一般的计算精度需求,但在工程设计中往往还需要对模型的特定区域进行重点分析,而智能网格划分工具默认的密度划分显然只调用了HP Z820工作站很小一部分性能,为此e-works评测人员对模型进行了局部细化,采用Refine功能对模型中需要重点分析的区域进行了更细密度的网格划分。


图9 在智能网格划分基础上进行局部细化

进行局部的细化后,模型的网格数和节点数分别为542126和541207,分析时间为9分04秒,处理器和内存占用峰值分别为5%和5.44G。从结果看,网格数和节点数在之前的基础上有将近两倍的增加,除耗时有所延长之外,对处理器和内存的性能需求并没有太大的增加。通常在以下情形时,我们需要考虑对局部区域进行网格细化:第一,已经将模型进行了网格划分,但想在模型的指定区域内得到更好的网格;第二,用户已经完成分析,同时根据结果想在感兴趣的区域得到更为精细的求解。本步骤我们细化了锯床底座孔径内壁,这些部位均为主要应力承载区。


图10 更细密度的网格划分

为了检验工作站性能,评测人员在前一步局部细化的基础上做了更进一步的网格细化,这次细化后的节点数和网格数分别达到了1377771和1379092,计算过程共耗时32分17秒,处理器和内存占用分别达到39%和6.67G。图9是根据应力分布进行局部细化的网格划分,在孔径边缘以及底座边缘内壁这些应力较为集中的地方采用较高阶次单元的网格划分,这样能得到更为精确的分析结果,测试结果表明工作站完全能够胜更高精度网格划分。

结论:随着网格密度的增大,数据计算量呈阶次增长,时间也大幅延长,这对处理器性能是一大考验。测试表明, HP Z820工作站完全能胜任更复杂精度更高的网格划分。

3. 应力求解
CAE分析主要有三个步骤,即:前处理、有限元分析、后处理。前处理就是为产品建立合理的有限元分析模型,包括单元属性定义、网格划分和载荷施加;有限元分析就是对前处理过程中划分好的有限元模型进行单元特性分析并求解的过程;后处理就是根据工程或产品设计要求对有限元分析结果进行分析进而论证设计的合理性,以满足客户对产品的设计需求。本次应力应变求解就是CAE分析的第二步,即有限元分析过程。

应力求解过程选用了轴承座模型, e-works测试人员将对比2核、4核、8核、16核计算环境下模型的应力求解过程,为使测试结果具有对比性,e-works测试人员将为不同核心的应力应变求解过程设定统一的参数。本次测试参数设定如下:

单元:solid185;弹性模量:200Gpa;泊松比:0.3;
定义好单元属性之后,评测人员对轴承底座进行了网格划分,划分的节点数为280334,网格数为1490770。考虑到应力应变求解需要,这次测试选用了比较规则的模型,为更为精确的得到分析结果,评测人员对四个底座孔和轴承孔部分进行了网格细化。


图11 轴承底座网格划分

载荷:约束四个安装孔,基座的底部位移约束 (UZ=0),轴承孔圆周上施加推力载荷,承孔的下半部分施加径向压力载荷。


图12 轴承底座应力施加


图13 轴承底座应力应变结果

针对前面的应力应变分析,e-works评测人员测试了相同参数下2核、4核、8核、16核情况下的耗时、内存占用以及处理器占用情况。应力应变分析结果如下图所示。


图14 2核心应力应变求解


图15 4核心应力应变求解


图16 8核心应力应变求解


图17 16核心应力应变求解


图18 应力应变分析中工作站性能


图19 轴承底座应力应变求解有效I/O率


图20 轴承底座应力应变求解计算率


图 21 测试生成文件截图


1) 高性能处理器缩短求解时间
ANSYS Mechanical 14.0默认求解器是Sparse Solver(稀疏矩阵求解器),本步骤是对100万自由度的线性静力分析,从统计数据观察,在16核心全部调用情况下分析时间最短为84秒,但总体而言,调用8核心时处理器的计算效率最高。在8核心全部开启的情况下,求解器的计算率为7899mflops,I/O率为30097MB/s,由于HP Z820工作站采用了2颗8核至强2690处理器,处理器以及内核之间都通过QPI总线互联,这里的I/O率指的是处理器内核以及处理器之间数据交换速率,HP Z820工作站处理器的QPI总线速度最大可达8GT/s,在之前针对HP Z800工作站的ANSYS评测中,搭配的是一颗英特尔至强E5600处理器和8G 1333MHZ内存,当时的I/O率最高为2818MB/s,仅从这点看,较之前的同级别工作站产品,HP Z820在计算性能上的确有着非常大的提升。

HP Z820工作站搭配了两颗英特尔至强E5-2690处理器,该处理器为8核心16线程,拥有20MB三级缓存和两条8GT/s QPI互联总线,总线频率为1600MHz。英特尔至强E5系列处理器是为替换至强5600系列而推出的,主要应用于工作站和服务器。英特尔官方测试数据显示,至强E5-2600系列相比于至强5600系列性能最多提升80%。

对比测试数据,可以发现在选择开启8核还是16核的问题上还是有所讲究,HP Z820工作站所搭配的英特尔至强E5-2690处理器能支持四通道DDR3 1600Mhz内存,如果选择单根为24GB的内存条,单个处理器就能支持96GB,96GB内存可应付1000万自由度的线性静力分析。HP Z820工作站搭配了两颗至强处理器和8条4GB内存,在开启8核心即单个处理器的条件下,处理器会优先调用其中4根内存即16G内存空间,这可以很好的应付200万自由度以下的计算需求。由于本次选用的模型为100万自由度,因此开启8颗处理器核心是最为理想运行状态。随着运算复杂度的提升,开启更多的核心将取得更好的效果。

结论:在CAE这类对计算性能要求较高的应用中,需要在短时间内对大量数据进行频繁的调用和处理。工作站平台所具备的强劲计算能力的在测试中发挥出了极大的优势。测试表明,HP Z820工作站搭配的多核处理器能很好的满足规模在500万到1000万自由度的CAE运算需求。如若加大内存容量,HP Z820工作站能实现对更为复杂模型的分析和处理。
2) 大内存高带宽提升计算效率


图22 轴承底座应力应变求解内存占用

在计算机中内存的作用是提升数据的运算效率,由于内存的读写速度要远高于硬盘,将需要处理的数据从硬盘调入到更快的内存,以便处理器能更快的读写数据将能大幅提升系统的运算效率,因此大内存的意义在于尽可能避免处理器与硬盘直接读写数据。CAE分析是数据密集型计算,更大的内存将大幅缩短运算时间并提升计算效率。


图23 HP Z820处理器与内存搭配

通过惠普工作站随机预装的HP performace advisor我们可以看到,测试的HP Z820工作站搭配了8条4GB DDR3 1600MHz容错内存,这种内存搭配形式是为了保持与处理器对内存的支持模式一致。英特尔至强E5-2690支持四通道内存,即每个处理器能同时保持与四条主频为1600MHz的DDR3内存进行数据通信,每条内存带宽为1600MHZ×64/8=12.8GB/s,四通道就是51.2GB/s。同时,按照保守的计算方法,处理器的计算能力为2.9GHz*64/8=23.2GB/s,如果不考虑数据调度问题,这意味着最理想的状态下处理器与内存之间最大的数据交互带宽可以达到23.2GB/s,尽管这只是一种理想状态,但从中却可以看出大内存对于大规模计算分析的重要性,内存越大,计算过程就可以将更多的数据预先放入内存,处理器通过51.2GB/s这样的“高速通道”与内存进行数据交互,从而尽量避免访问速度较低的硬盘。

在进行求解时,有两种内存调用模式:optimal out-of-core和in-Core,对于小容量内存,可选择optimal out-of-core模式,这种内存模式下求解器会按照一定比例将数据放到内存和硬盘;对于大容量内存,可选用in-core模式,求解器会直接将数据调入到内存中。显然,in-core模式会极大的提升求解器分析效率。在之前的测试中,评测人员选用的是in-core模式,100万自由度线性静力分析占用了超过10G以上的内存空间。由此估算,对于千万级自由度以上的线性静力分析,需要考虑采用更大的内存空间,这样能大幅提升分析效率。

结论:在CAE这类密集型计算应用中,处理器与内存的交互会非常频繁,而且数据量非常大。因此,将更多的预处理数据调入内存,尽量避免处理器直接从硬盘读写数据能大幅提升计算效率,缩短计算时间。HP Z820工作站最大可支持512GB内存,在实现对大模型的虚拟仿真分析中,如此大的内存容量将极大的缩短计算时间。

3) 高速磁盘增强工作站性能
磁盘是计算机数据存放的地方,也是计算机系统中读写速度较慢的部件,很容易成为限制计算机其它高速部件性能发挥的瓶颈。在HP Z系列工作站发布以前,工作站大多都选用SATA硬盘作为工作站标配,最明显的不足是读写速度慢。在诸如CAD这类对读写要求不高的应用中,SATA硬盘还不至于成为工作站性能瓶颈,但对于CAE这类计算和分析为主的应用,硬盘的选择至关重要。

HP Z820工作站搭配的是15K RPM的SAS硬盘,利用HTTune软件对硬盘进行测试后得到的读写速度为220M,这个与之前应力分析文档中记录的数据221MB/s相符合,同时也意味着硬盘的传输速率已经达到极限,成为限制工作站性能进一步发挥的瓶颈。

为加速求解过程,e-works评测人员为HP Z820工作站增加了一款同型号SAS硬盘组成了RAID O,并在前面的应力应变分析重新进行了求解,整个求解过程仅开启了8颗处理器核心,求解结果如下:


表3 单块磁盘与RAID O性能对比


对照求解结果可知,利用2块SAS硬盘组建的RAID 0系统较之单块SAS硬盘在求解性能上大概有30%的性能提升。e-works建议,对于购买HP Z820工作站的用户,如果所涉及的分析模型较大,可考虑为工作站搭配更快的SSD固态硬盘或是通过用多块硬盘来组建RAID系统以提升分析效率。HP Z820工作站可支持的硬盘类型包括SATA、SAS、SSD,并配有专门的RAID卡。

结论:磁盘较慢的读写速度往往成为限制计算机性能发挥的瓶颈,为尽可能减少由此带来的性能下降,工作站往往会通过搭配更大的内存或配备读写速度更快的高性能磁盘来提升整机性能。HP Z820搭配了15K的SAS硬盘,同时还支持RAID 0。本次测试,通过两块SAS硬盘组建的RAID 0系统大幅缩短了分析时间。
四、 评测小结
本次测试使用的是ANSYS Mechanical软件,通过对模型进行网格划分和应力应变求解,e-works评测人员结合HP Z820工作站进行了软硬结合的定性定量分析并得出了结论。在CAE这类数据密集型运算应用中,强劲的处理器、大容量内存、高速的磁盘读写速率和更高的传输带宽都非常重要。HP Z820工作站作为目前市场上最顶级的产品,在处理器、内存的选择上都非常讲究,能很好的满足CAE应用的需求。在考虑配件性能的同时,惠普还综合考虑了硬件的价格,从而为用户提供了高性价比的工作站产品。


关于惠普
惠普公司 (HP) 致力于激发科技的无限潜能,为个人、企业、政府和社会创造积极影响。作为全球最大的科技公司,惠普产品涵盖打印成像、个人计算、软件、服务和IT基础设施等领域,并以全面的产品组合有效地解决客户问题。关于惠普 (NYSE: HPQ) 的更多信息,请访问 http://www.hp.com

 

(责任编辑: 叶素雅

作品欣赏

欢迎关注视觉同盟微信公众号:
微信公众平台:搜索“vudn2004”或扫描下面二维码:
English | 关于我们 | 站点地图 | 联系热线 | 合作伙伴 | 艺术顾问 | 订阅 | 手机版
版权所有 © 2004-2024 视觉同盟 visionUnion.com)
Copyright © 2004-2024 VisionUnion.com Incorporated. All rights reserved
京ICP备09005192号
视觉同盟旗下子站:品牌专区 | 创意设计人才网 | 视觉同盟社区 | 视觉同盟论坛 | 英文版