至强融核首曝 Intel揭百倍加速性能假象

来源: 驱动之家
2012/11/16 10:14:04
经过长达八年各种相关研究,Intel终于正式推出了MIC众核架构的Xeon Phi协处理器,为高性能计算带来了一股新鲜势力。



分享到: 新浪微博 腾讯微博
本文关键字: 至强融核 MIC Xeon Phi

经过长达八年各种相关研究,Intel终于正式推出了MIC众核架构的Xeon Phi协处理器,为高性能计算带来了一股新鲜势力。

Xeon Phi协处理器在很大程度上继承了流产的独立显卡项目Larrabee的遗志,外部造型看似显卡,其实是和Tesla类似的专用加速计算卡,其架构采用顺序、双发射x86,支持64位运算,每个核心支持最多四个线程,最多61个核心、244个线程,并且每个核心都搭配一个512-bit SIMD矢量引擎。

至强融核首曝 Intel揭百倍加速性能假象

MIC架构发展路线图(图片来自驱动之家,下同)

当然了,这里的“核心”跟Tesla里边的CUDA核心是没有直接可比性的,它们分别来自CPU、GPU的世界。

前后做了这么多纸面上的介绍,想不想看看Xeon Phi究竟是个什么样子呢?田纳西州大学的田纳西高级计算中心(TACC)正在他们的新超级计算机“Stampede”(惊跑)里安装Xeon Phi,也让我们得以一睹其真容:

至强融核首曝 Intel揭百倍加速性能假象

至强融核

不明说的话肯定会以为这是块标准的显卡吧?Tesla其实也是这个样子,标准的双插槽体积PCI-E x16扩展卡,而且是因为专用于计算的,都没有视频输出接口(AMD的还有)。

Xeon Phi也有主动散热、被动散热两种版本,这里用的是被动散热的,外壳下边是大量厚重的散热片和热管,尾部则能看到一个六针和一个八针辅助供电接口,最大供电能力300W。

只可惜人家不让拆,看不到里边的样子。

至于实际性能如何,很可能现在哪儿都不具备测试条件,毕竟这玩意儿因为架构的缘故要求操作系统、工具软件都得在一定程度上重新编写和优化,Intel也一再强调优化的重要性。

至强融核首曝 Intel揭百倍加速性能假象

性能提升幅度

Intel也没有一味夸大加速计算的优势,而是首先澄清了一个误解。Intel拿出了一段Fortran代码,先运行未优化的单线程代码,然后优化并以Xeon Phi运行,性能差异达到了恐怖的300倍。

NVIDIA Tesla宣称的性能提升差不多就是这样对比而来的,让加速计算的结果和单线程结果对比,几十乃至几百倍的提升就轻松得来。

至强融核首曝 Intel揭百倍加速性能假象

来自客户实际应用的性能提升

Intel则证明了其谬误:在双路Xeon E5上重新运行相同的代码,Xeon Phi只快了大约两倍而已。也就是说,如果代码本身就针对多核心处理器做过优化,加速计算的真实优势会小得多。

在另一个C++的例子中,109倍的提升被证明其实只有2-2.5倍。

至强融核首曝 Intel揭百倍加速性能假象

综合基准测试摘要

随后,Intel展示了Xeon Phi协处理加速计算所带来的真正性能提升,通过Intel MKL理论测试得到的幅度为最多2.2-2.9倍,实际应用中则普遍只有最多1.7-2.53倍,只有金融服务方面取得了10倍左右的突飞猛进(布莱克斯克尔斯期权定价模型和蒙特卡罗算法)。

Intel还请来了软件和技术供应商Altair的一名代表,让他证明把代码移植到Xeon Phi平台上是多么的简单,并证明崩溃测试模拟之类的应用一般可以带来2.5倍左右的性能提升。

责编:杨雪姣
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
IT系统一体化时代来了

2009年Oracle 用Exadata服务器告诉企业,数据中心的IT服务一体化解决方案才是大势所趋,而当前企业对大数据处理的..

高性能计算——企业未来发展的必备..

“天河二号”问鼎最新全球超级计算机500强,更新的Linpack值让世界认识到了“中国速度”。但超算不能只停留于追求..

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map