当前位置：首页> 服务器> 厂商专区> 正文

浪潮桌面“万亿次超算中心”实测报告

作者：王渭巍

2009/3/19 8:22:00

大中小

本文关键字：浪潮服务器

　相关文章：浪潮推出桌面超算选择Telsa

一、测试目的

　　2009年3月2日，浪潮发布“倚天”桌面超级计算机(以下简称浪潮“倚天”)，单机计算能力最高可达每秒4万亿次，市场售价仅为5万元，真正实现了将超级计算机从庞大的机房和计算中心转移到了用户的桌面。

　　浪潮“倚天” 采用CPU-GPU协同计算加速架构，以CPU和GPU双计算核心实现协同计算加速。其中，CPU专职逻辑选择、判断跳转和IO通信计算，GPU专职计算密集型、高度并行的计算任务，使得计算资源得到合理分配，计算力被充分释放，计算性能实现几倍到几百倍的增长。浪潮“倚天”在相当于普通PC的体积上实现了万亿次的计算性能，为大量数据并行处理、计算密集型应用提供了一种全新的超高性价比的解决方案。

　　为了对其在实际高性能计算应用中的性能和产品特性进行评估，我们挑选了分子动力学和天体物理学领域的两个HPC应用进行了测试，对比浪潮“倚天”与X86架构集群在实际应用环境下的计算性能，以及它对单机应用的加速比，我们特地设计了两个测试场景(这里的浪潮“倚天”按照一万亿次计算能力配置)：

二、测试方案1：浪潮“倚天”VS 4节点X86集群

　　对比双方介绍：

　　浪潮“倚天”与4节点X86架构高性能计算集群的比较，集群节点采用了1U双路机架服务器，下表是对比双方的配置：

	浪潮倚天	4节点集群
Cpu	C-G协同计算架构 DDR3 4G SATA 250G	E5420 2.5GHz X2/ 每节点DDR2 16G SAS 146G
内存
硬盘
测试平台	CentOS 5.2	CentOS 5.2
铭牌功率	1000W	2000W

　　测试算例：

应用领域	分子动力学
对比算例	NAMD/VMD的纳米孔(Nanopore)算例
关注焦点	两个平台下的计算及显示性能
运行软件	NAMD(动力学计算), VMD(可视化)
程序语言	GPU环境下利用CUDA程序优化后的代码&CPU环境下开源原代码

　　分子动力学模拟是通过求解系统中所有粒子的运动方程来得到粒子的运动轨迹。在模拟中，粒子间相互作用的计算占用了大部分机时，不同的粒子间势能模型需要的计算时间是不同的，其中势能函数随距离衰减的速度是一个重要的影响因素。分子动力学模拟在新材料设计、蛋白质折叠、新药研发等领域中发挥着极为重要的作用，由于计算量大，这是一类非常典型的高性能计算应用。

　　Nanopore算例是通过分子动力学的方法，利用NAMD软件进行模拟计算，对硅纳米孔柱阵列的排列结构进行研究，并用可视化软件VMD将其显示出来。该算例既可以在集群上进行任务分发和并行计算，也可以在支持CUDA架构的NVIDIA GPU上进行单GPU运算或多GPU并行运算，具备比较可能和比较意义。

　　在运行机制上，NAMD基于Charm++并行支持库，高端硬件平台上可以保持较高并行效率直到数千个处理器规模。NAMD最有特色的地方是通过Charm++实现了动态负载平衡，能够很容易地扩展到数百乃至数千个处理器上运行，效率却不会下降太多。

　　VMD是分子可视化软件使用OpenGL提供高质量的3D分子图形，用于显示、动画演示和分析大的生物分子体系，原子、分子、残基的数量，以及动画画面的数量，在内存允许的范围内没有任何限制。

　测试过程

　　在集群上的NAMD采用charmrun软件进行任务分发，这里采用了VMD图形显示和NAMD计算同时进行的运行方式。即开启VMD进行图形化对算例的分子结构进行显示，之后connect进行计算，实时计算其每个时刻的各种状态。

　　此套测试程序中，namd2为namd的mpi程序，除namd自身的功能外，它还负责进行消息传递和任务分发等，namd_openmpi_gpu为用CUDA改写后的namd程序。测试命令为

　　mpirun ./namd2 namd_openmpi_gpu nanopore.namd

　　而对于集群上的namd程序，可以采用charmrun命令来进行并行计算，+p32代表用32个核来进行并行计算，测试命令为

　　charmrun +p32 ./namd nanopore.namd

　　为了方便操作，我们仅计算了1000个step下的计算时间作为对比。

　　测试结果

　　由测试结果截图可以看出，浪潮“倚天”所用的时间为65.9s (wallclock),而4节点集群同样的计算任务所用的时间为120.7s，可见在该算例下，浪潮“倚天”的运算效率大约是4节点集群的两倍。此外，利用VMD启动可视化分子模型时，浪潮“倚天”的VMD建模速度更是明显比集群快。

桌面“万亿次超算中心”实测报告
图1：浪潮“倚天”的测试成绩

桌面“万亿次超算中心”实测报告
图2：集群测试成绩

三、测试方案2 ：浪潮“倚天”VS 四路四核服务器

　　对比双方介绍：

	倚天	四路四核服务器
Cpu	C-G协同计算架构	Xeon E7420 2.13GHz X4
内存	DDR3 4G	DDR2 128G
硬盘	SATA 250G	SAS 700G
测试平台	Windows server 2003	Windows server 2003
铭牌功率	1000W	1570W

　　测试算例：

应用领域	天体物理学
对比算例	N-body问题(16384 bodies)
关注焦点	两个平台下的计算及显示性能
运行程序	GPU环境下利用CUDA程序优化后的N-body代码 & CPU环境下N-body代码

　　N-Body 问题是天体物理学的基本计算模型。在问题域中有N个天体,这些天体之间互相存在万有引力、以及其他作用力，使得这些天体发生运动. N-Body计算的目的是预测在未来某个时刻，这些天体所处的状态。

　　N-Body 问题在并行计算模型上，对数据并行和分治等并行算法设计方法、并行算法的复杂性分析、以及算法设计中伸缩性和效率等都有很高的研究价值。

　　测试过程

　　本次采用的算例规模为16384 bodies,分别在浪潮“倚天”和四路服务器上运行各自的计算及显示程序nbody_gpu(GPU环境下利用CUDA程序优化，用GPU进行运算)和nbody_comic(可利用单机上所有CPU资源进行运算)。

　　测试结果

桌面“万亿次超算中心”实测报告
图3：浪潮“倚天”运行结果截图

桌面“万亿次超算中心”实测报告
图4 ：四路服务器的测试截图

　　首先，从图形显示可以明显看出计算速度的快慢，由于计算速度快，浪潮“倚天”上显示的nbody画面流畅，而四路服务器上的nbody画面则顿感很强，实际测试数据如下：

桌面“万亿次超算中心”实测报告
图5：浪潮“倚天”的测试成绩

桌面“万亿次超算中心”实测报告
图6：四路服务器的测试成绩

　　其次，浪潮“倚天”在GPU环境下利用CUDA优化过的nbody程序可以达到235.4 GFlops的计算能力，而四路服务器仅发挥了11.1 GFlops的计算能力，浪潮“倚天”比四路服务器快了20倍!而且“倚天”超算的CPU 占用率仅仅为10%左右，四路服务器CPU 16个核的占用率却已经达到了100%。

　　四、测试结论及分析：

分子动力学集群对比方案	浪潮“倚天”	4节点集群
完成算例时间	65.9s	120.7s
部署时间	30分钟	2小时30分钟
空间	普通台式机大小	6U （包括交换机和KVM）
噪音	24－44db	62－65db
功耗	1000W	2000W
成本	5万	10万

天体物理学单机对比方案	浪潮“倚天”	四路四核服务器
实际计算力	235.4GFlops	11.1Gflops
CPU利用率	10%	100%
空间	普通台式机大小	5U
噪音	24－44db	45－63.5db
功耗	1000W	1570W
成本	5万	20万

通过从以上两个测试方案，我们可以得到以下结论：

　　1. 相比传统集群，万亿次浪潮“倚天”的计算性能是4节点集群性能的2倍，而相比一台四路服务器，它的加速比至少能提升1-2个数量级，而成本只有四路服务器的1/4。

　　2.部署更加便捷，同样部署一个分子动力学的应用，倚天只需30分钟,而在集群上部署则需要5倍的时间，而集群由于噪音太大，必须放在单独的机房里。

　　3. 从微观分子动力学研究到宏观的宇宙星体碰撞实验，反映了“倚天”超算在计算密集型、大规模数据并行处理的高性能应用中优势明显。

　　结语

　　浪潮“倚天”凭借创新的协同计算加速架构，出色的万亿次并行处理能力和小体积、低噪音、高性价比等特点，在生命科学(分子动力学、基因排序、蛋白质折叠、计算化学)、工程科学(CAD/CAM/CAE、天体物理、CFD、Mathematics、LabView)、国防科技(武器、图像处理、战地模拟)、医疗(MRI、CT、影像辅助治疗)、石油石化(地震资料处理、油藏模拟)、金融(风险分析，衍生性金融商品模拟交易算法)、可视化(渲染农场)、EDA(SPICE、Verilog、3D EM)等高性能计算领域有着广阔的应用前景，它的普及将为广大科研机构带来计算效率的巨大提升，同时也为我国高性能计算的普及开拓了新的路径。

责编：

微信扫一扫实时了解行业动态

微信扫一扫分享本文给好友

收藏到畅享打印全文复制链接添加到收藏投稿邮箱

分享到：新浪微博腾讯微博

著作权声明：kaiyun体育官方人口文章著作权分属kaiyun体育官方人口、网友和合作伙伴，部分非原创文章作者信息可能有所缺失，如需补充或修改请与我们联系，工作人员会在1个工作日内配合处理。

文章: 物资管理八百客润乾报表伟库网 Xtools 中服软件中机盛科

用友T系列知识管理 ERP
软件: 用友中服软件 SAP 源天软件 Xtools 中机盛科

浪潮桌面“万亿次超算中心”实测报告

通过咨询项目或年度顾问方式，帮助您架起业务和IT的桥梁，解决业务和IT创新融合、现有系统取舍难、IT架构、建设路径、IT治理、IT支出优化等IT策略问题。

与您签订总包或三方合同，帮您解决业务和IT规划落地走样、IT详细设计缺失、难以寻觅靠谱的技术供应商、多个供应商协调难、维护升级服务保障难等棘手问题。

与您签订监理合同，以里程碑专家评审、项目变更协调、风险控制研讨、供应商关系协调、CIO智力网络等为主要服务内容，与甲乙方一起实现上线成功。

畅享IT帮助寻找可靠的、性价比高的开发力量，签订外包合同或三方合同，为企业提供可信赖的开发量，为IT供应商解决开发力量不足的问题。

畅享IT帮助寻找靠谱的、性价比高的维护力量，签订外包合同，对客户满意度负责，为客户解决维护运营服务保障难的问题。

对IT系统、IT项目或IT管理进行评估，出具中立评估报告，解决IT评价难、取舍难的问题。