|
|
|
|
主题介绍最近,“天河二号”问鼎最新全球超级计算机500强,更新的Linpack值让世界认识到了“中国速度”。但超算不能只停留于追求更高的Linpack值,那不免沦为HPC界的“面子工程”。HPC需要有走向市场的需求。那我们的国产HPC在进行产业化道路的探索上遇到了那些困难呢? |
嘉宾介绍戴荣 曙光HPC产品总监 戴荣,博士,现任曙光信息产业(北京)有限公司 HPC 产品总监,为核心技术人员。戴博士曾参与了曙光5000 、 曙光6000等大型高性能机的研发测试工作,并主持了多个高性能中心和行业领域的方案设计,具有丰富的从业经验。 |
视频实录
主持人:倡导专业、畅享对话,观众朋友们大家好,欢迎收看本期的《畅享对话》,最近在国际超算大会上中国的天河二号问鼎了这次的TOP500,从而使超级计算机再次吸引了人们的目光,为此我们走进了国产HPC领军企业中科曙光,来和大家共同探讨关于国产HPC的产业化路程。本次我们请到了曙光计算机HPC产品线的产品总监戴荣博士。戴博士请跟大家介绍一下。 戴荣:你好,kaiyun体育官方人口 的各位网友,非常高兴有这样一个机会跟大家分享一下。关于国产HPC尤其是曙光高性能计算在产业化这样一个道路,我个人从毕业之后就一直在曙光这边做,负责HPC这方面的工作,从工程师到现在这样一个产品总监,所以我对曙光高性能计算的发展还是比较清楚的,所以也想借这么一个机会跟大家一起来分享、讨论一下,非常高兴有这个机会。 主持人:作为高性能计算,需要走进企业甚至走进个人,国产HPC终究要走的产业化道路,在这块我们曙光是如何做的? 戴荣:这里面可能要简单提一下曙光的一些历史的情况,因为曙光公司成立于1996年,当时我们就开始做高性能计算机,我们做的第一台高性能计算机曙光一号,后来我们又做了曙光1000,到现在我们做了曙光6000。因为曙光背景其实是从中科院的教研所成立的一所科研型的企业,我们的很多设备也走过了一条从专业化科研型向商业化产品转型的道路,刚开始我们做的很多工作是以科研型为主。 我们其实有很多创新的技术,在CPU、主板、操作系统上各个方面我们都有自己创新的东西。但是我们初期的创新产品在市场上很难推广,因为做出的这样一个产品是非常专业化、非常定制化的,这可能也是以前为什么我们觉得高性能计算机没有办法接触企业。因为你根本用不到,你的所有的东西没有办法在上面运行,一些通用的商用的操作软件,一些应用,都没有办法在上面运行。所以它离我们生活很远。这样的产品面临非常狭小、非常专业化的市场,是很难给它做大的。 曙光的高性能计算机产业化之路是从体系架构的改进着手的,采用更通用的商业化的产品部件,且使它的处理能力得到稳步的提升,同时考虑它的软件兼容性、适用性有着更好的处理。所以我们的高性能产品有了广大的用户基础,我们也能根据用户需求的规模来定制可大可小的产品。当前我们看到高性能产品分为高、中、低三个档次。高端一套设备可能几千万人民币,针对的是大型企业级市场,中小企业一般可采用价值几百万或几十万的中端和低端产品,这是用户都能够承受的这样一个范围了。 曙光高性能计算机要走产业化、通用化这样一个路,一定不能局限在特别专业、特别少量的用户,要面向最大众的用户、最多数的需求来做高性能计算机。 主持人:听您这么介绍我理解,HPC似乎不像其他类的产品,比如像手机是基于用户需求,然后做科研上的攻关。我们这好像是先有科研上的攻关,然后再重新回到用户需求再实现产业化。 戴荣:我们很多高端技术实际上有可能原来是军用的,有可能原来是特别高端的需求特别少量的定制化的需求,但它也是要求逐步的走向市场。比如说互联网,互联网原先是军用的这样一个网络,现在大家都在享受它带来的变化。HPC这个技术我们也一直在高端技术下移,我们高端计算研发这样的技术希望能够用到,服务于我们广大的人民群众。 主持人:我们曙光是如何来理解用户需求的呢?科研产品如何与市场需求相一致? 戴荣:我们看到,中国正在经历经济转型的阶段。以前我们依靠劳动力密集型的产业来做我们的产业化的道路走不通了,现在我们越来越需要我们要有自己的产品、我们要有自己的技术,我们要在整个的经济体系里面占据更高端的一个位置,走科技创新强国之路。 在面临经济转型走向技术密集型产业发展的阶段,我们认为高性能计算机会成为未来产业发展的必然需求,值得我们投入更多的研发的力量去做这个事情。我们需要自己来做设计,自己掌握核心的技术,我们需要高性能计算机后台来为我们的经济、企业提供最为核心的动力。 高性能计算机最开始确实比较专注于科研应用,自然对科研的推动作用毋庸置疑,而且现在广泛用于各个领域。能源、气象、娱乐等各个领域,都有高性能计算机的使用。从最初仅仅是用于做科研的设备,现在已经成为我们生活、工作离不开的一个基础支撑平台。 主持人:有权威机构做了统计,2013年第一季度全球HPC市场增幅达到5.3%,据分析师分心这得益于企业级服务器市场的需求提高,您认为在当前全球经济弱复苏的态势下,HPC市场的这种快速增长会是长期持续的么? 戴荣:我认为应该是一种长期的趋势,因为以前大型的高性能计算机系统主要是国家来主导的,国家需要投入很多的资源、资金来做这样的一套设备。但是后期高性能计算机逐渐走向市场,更多的用户有了高性能计算需求,所以才会有工作站、工作组级的中低端设备市场的向好。 当经济不景气的时候,大家对原来产品投入就会遇到问题,就需要找出路,需要投入更多的力量找到一个解决方案,此时对高性能计算机的投入反而会增加。正是因为我们看到了这样的一个现象,所以我觉得这样一个趋势应该是比较长期的,而且中小型企业应用HPC的趋势应会越来越广。 正是如此,我们现在有一些观点认为,可能我们每年不一定要做大设备、那些特别大的系统,因为特别大的系统是满足特殊应用需求的。反而应该更多的做中小型的,让更多中小企业的从我们原先的问题、原先的课题还有包括我们的企业中获益,应该更多的资助这方面的研究。 主持人:这种思考是否已经使曙光的研发力量产生了变化呢? 戴荣:从研发上来讲,我们一方面我们还是在继续研究高端的高性能计算机的产品和服务器。另外做高端技术的下移,我们需要更关注的,事实上我认为传统的高性能计算机可能更关注的是一些科研型的、需求满足的这样一些问题,其实它是很难处理的一些问题。但我们现在的高性能计算机,可能把我们研发的精力面向现在大数据,云计算,让我们高性能计算机为这些新兴的市场来提供服务,这是我们研究的一个新的方向,不完全局限于传统的科研这样一个范畴,我们认为应更多关注非传统产业、新兴产业,它发展非常快,实际上我认为这可能是一个更广泛的、更有潜力的市场,要做高性能计算机产业化,必须要关注非传统HPC的市场。 主持人:刚才您说到新兴产业,尤其是互联网产业,很多都在进行云计算建设,这对高性能计算有什么影响么? 戴荣:高性能计算与我们现在提的云计算概念可能还是有一定的类似。我们以前都是用PC,但后来我们做一台高性能计算机还可以把很多资源集中起来,同时能够提高更多的利用效率。而且在我们的机房设备里边可以采用很多节能的技术,比如水冷的技术、自然冷却的技术,实际上要获得相同的计算能力,把这些有效的资源集中起来之后,对能耗的消耗实际上是降低了。我们看到世界上有很多大型的数据中心,能源使用的效率都是一点零几,甚至于接近于1.0。但是要是把这些系统全部分布出去,利用的效率就很低,能耗实际上是增加的,大幅度增加的。所以这个我觉得这种集中化,我们把我们的很多资源集中起来,然后用户通过本地设备去访问后台的计算资源存储资源还有网络这样的一些资源。对于整体的节能、绿色都是有帮助的。 主持人:那您给我们举一些实例,高性能计算机确实改善了企业的节能状况,或者新兴互联网行业,确实能提高效率,举一些实例。 戴荣:行,技术创新我就不提了。如果在高性能计算机可以开发更新、更先进、更新颖这样一些技术,这个技术提升对于企业来讲都是能够促进生产力的。另外我们看对企业现在经营的分析,我们看到其实现在很多大型的企业,后台都有大的数据中心,比如数据库的应用,比如SAP的一些应用等等,实际上是需要每天都去处理大量的信息,包括我们的证券市场,后台也都是有大量的高性能计算机的集群在支撑,每天,每时每刻甚至包括我们的气象卫星等等这样的一些数据,上传、处理这样的一些数据。我们看到正是随着数据量的猛增,我们对这些信息有些要求实时处理,有些要求可能在海量数据集里面找到你需要的这样的一些数据,这样的需求是越来越多。 随着我们信息量的增长,我们对信息的处理能力、处理的速度提升要求非常多。所以我们看到,现在高性能计算机应用很多的领域,比如金融机构做一些股票的定价、分析,必须依赖于高性能计算。还有如影视传媒行业需要的多媒体的影音的一些处理,没有后台高性能服务器的支撑也是不可能的。包括现在一些大型的互联网公司比如搜索引擎,后台全部是高性能计算机服务器的集群。当然它上面跑的一些应用可能和传统的高性能计算机不太一样,但是这样都给我们提供了最直接的一个支撑。 主持人:现在HPC主要应用于哪些领域? 戴荣:传统的应用领域就是刚才我们前面提到过的石油、气象、还有航空航天,生物、物理材料、化学、还有其他的空气动力学,其他的一些计算机辅助设计。还有动漫渲染处理这些都是传统的应用的领域。 主持人:就是HPC应用于这些领域的时候,作为我们研发会不会考虑到它们的一些个性需求,比如说他们本身用的高性能计算机是有共同的需求,还是是针对某个行业有特殊的需求? 戴荣:从总体上来讲,因为各个行业的需求在计算机或者在IT会把需求共同提炼出来,最后我们可能就反映到一些具体的参数指标上,比如说处理的速度,带宽,通讯的速度这样一些共性的要求。但是我们每一套高性能计算机都是可以根据用户的需求来进行定制的,我们主要是从用户的应用来看,有的是计算密集型的,有的是网络密集型的,这样我们最后也会设计出来不同的系统,来满足他们的要求。所以会根据行业的要求,根据用户来做一定程度的定制。这个肯定能做到,现在我们的高性能计算机集群的架构为主,所以这方面扩展性和定制性相对来说还是比较灵活的。 主持人:像您刚刚谈到对这个行业我就有一个思考,在这行业下HPC对行业究竟是市场驱动力量,是他们本身行业特别需要这种HPC建设,还是HPC研发中首先就考虑了特别适合这几个专业,从而很容易走入了这几个行业。 戴荣:我觉得任何东西都应该是需求驱动的,没有这样的一个对大数据处理,大量海量数据处理科学计算的需求,是不会有高性能计算机的,高性能计算机不是玩的一个设备,是从需求驱动、需求牵引,而且只有将这个需求,我们的社会正好能满足这样的一个需求的话,才能引导出来更多的计算的要求。而且我们经常跟用户谈,刚开始他可能是想买一个小机器,但用着用着他马上发现不够,他会继续扩容,这就是非常明显的,是需求引导需求,需求和产品是相互引导,但是我认为原动力肯定还是在需求方。 主持人:还是回到这个行业,这个行业可能都是一些涉及到有可能是国家垄断性的企业,或者是一些大的公司,相对于中小企业HPC这种需求,如何能激发它们的需求,比如说他们有可能没有很多的资金来买这些东西,或者认为这对企业贡献不大。 戴荣:大企业我们现在看到高性能计算机建设模式也是不太一样的,如果是大型的企业,它可能比较有资金、有实力,他会自己采购自己购买,他自己在企业里面就会有一套数据中心,有这样的一个高性能计算机的中心。但中小型企业,它其实也有同样迫切的需求,但是它可能会通过租用,或者有公用的计算中心,它可以去租这个机时、租软件,甚至是请第三方给他来做这方面的一些设计和处理。是这样的一些方式,它同样能够享受到高性能计算机所带来的一个好处,所以可能有不同的方式,根据自己的要求、根据他的紧迫的程度,根据他们资金的实力。但是需求是同样,可能大企业多一些,中小型企业少一些。 主持人:从曙光来说,我们相较于国外的HPC优势在哪儿? 戴荣:其实我们现在看到,现在国内的高性能计算机尤其是自主的高性能计算机起步还是相对比较晚,尤其你刚刚提到一些核心的技术,在我们通用的市场里面,有些核心技术我们可能还在用国外的英特尔,X86处理器,硬盘、系统,但是我们发现随着国家在这个领域不断的投入,实际上在这个领域我们已经走到了世界前列。我不知道你有没有注意到,天河二号用的是国外的x86处理器,但实际上我们的国产处理器也是很强大的,而且一度是全球领先的,但是由于保密需要不太方便披露。所以在处理器这个基础上,我们已经能够做到全球领先,自主研发的产品。然后在网络的基础上,实际上中国已经做到全球领先,包括存储的技术,全部都是自主研发。这方面并不是说我们现在技术实力做不到,只是说我们要做到更成熟、更加价格性价比,因为现在基本上是研发完成的阶段,还要做市场化的推广,做到整体成本,能够满足所有用户,最后都能够用得到、都能够买得起的阶段,可能有一段的路要走,会有这么一段时间。但是未来我相信可能全国产的设备、全国产的从处理器到网络、到操作系统、到存储所有的全国产,这个为期并不远。 主持人:那您能介绍一下曙光系列这种产品国产化的脚步吗? 戴荣:我们现在通用的产品实际上还是以商业化的产品为主,我们刚才也提到为了使它有更好的通讯性和兼容性,我们是走这样的一个思路,包括曙光4000、5000、6000,基本上都是这样的一个思路。我们同时也在做自主处理器为核心的高性能计算机,但是目前成熟性还没有那么好,这也是我说这个产业化道路,并不是说研究出来这样的高性能计算机的硬件就完了,相应配套的环境,在上面能跑的应用软件的开发,而且现在很多应该说整个中国的软件开发的实力可能还是有所欠缺,不仅仅是指高性能计算,这方面上面能跑的一些应用,如果一台机器没有应用支持,可能用户数很少,没有用户,最后就没有这个需求来引导,可能能做一段时间,但最后也只能是玩具,因为没有人用。我们谈高性能计算机,一定要谈性能、指标定位,我们要谈应用,谈它上面能跑多少软件,有多少支持它的用户。这可能是一个更长期的路,而且不仅仅说我们再拿出一些先进的技术,资助几个项目,这样就能够解决的,需要一个全社会各个部门、各个行业,甚至是每一个人,比如现在你要用自己的国产的处理器,国产的软件、自己来开发国产的一些平台,这样的一些支持。实际上不是只是几个人的事,几个人、几个公司、或者几个研究所的事情。 主持人:曙光和一些其他的院校也联合建立了研究室,培养一些这种高端人才,可能就是补充您所说的产业链环节上的一些东西。 戴荣:如果从产业链上来加强这个是比较庞大一个系统工程,我认为难度是比较大。我们现在做局部的一个突破,先把技术上。而且Linpack可能并不是我们大家认为只是一个指标,只是一个测试的软件的东西,它实际上是用来解析方程组的,这个程序能够表示出我们高性能计算机至少是计算性能的,计算性能在很多应用里面是非常关键非常重要的一个部分。如果要做全产业链一个投入,需要做的工作非常庞大,刚才提到了,可能比较难。 另外本身提到高性能计算机在各个高校、各个研究所里面整个人才培养环节上来讲都是比较少的一个部分。可能很多人入学的时候就会学一个,我记得我们当时入学的时候会有一个计算机文化,会学Word,会学怎么输入法,会学一些简单的编程,但是你会学高性能计算机,你会学并行计算吗?不会的。所以它还是一个专业性很强的这样的一门课程,也是一个专业。所以对人才的缺乏,可能跟我们的投入、培养都还是有一些关系。而且我认为传统高性能计算机应用还是偏狭小的、偏科研的,当然现在我们可能更广泛的应用,所以我觉得会有更多的用户能够了解,能够去学习这方面的一个知识,这方面的一些课程和知识。 另外早期我们看到处理器,我们用的所有的设备其实都是串型行的,现在有多核、4核、8核、12核、16核,有众核,几十个核心。软件程序编程人员实际上已经在开始利用多核处理器、众核处理器,这样的一个处理能力,这方面人才实际上是在比以前有了很大的提升。所以这个环境只能说不断改善。 主持人:我们这块缺哪方面人才? 戴荣:我认为主要是两个方面,一方面是提到软件编程开发的人员,这个是直接影响到我们应用软件开发的水平,应用的一个水平。另外可能是系统的一些运维管理员,当然这个相对还简单一点,还比较好解决,但整个编程开发人员是比较欠缺的,尤其是高性能计算、并行计算,对综合人员的要求、涉及学科的要求可能会更多。你要非常精通数学的领域、你需要解决各个应用领域的一些问题,你是要非常精通这个领域,你要非常精通高性能计算编程和处理,你还要非常了解硬件的一些系统设备,这样才能把硬件的特性发挥得更充分。所以这样的要求对一个人来讲可能是很高了,所以我们现在看到很多行业是各行业专家联合来合作,我有应用的专家、我有计算机的专家,我有其他系统硬件的专家,大家配合合作才能把最终能开发出一套比较完整的一个系统、完善的一个系统,是多方合作配合,也需要这样的一些合作。 主持人:听您这么说,除了学生我们应该也缺老师。 戴荣:肯定也缺,没有学生就没有老师,老师最开始都是学生。 主持人:那再回到对企业最关心的问题,现在作为企业作为那种云部署,从云系统的布置上,云端的云计算建设上,对于我们高性能计算有什么帮助有什么影响。 戴荣:其实云计算刚开始在国内开始讨论的时候,这个云计算跟高性能计算有什么区别,云计算是不是代替高性能计算,这个我们也讨论过很长的时间。但是我们现在看得更清楚了,实际上云计算和高性能计算他们不是互相取代的关系,他们是互相支撑的一个东西。云计算里面应用了很多的技术,我们经常提到的一个云计算可能没有特殊的、特别先进的特殊的技术,应该说没有非常创新性的跨时代的技术,它是一种应用模式,是一种服务的方式一个创新,但是它需要的后台高性能计算机,需要高端存储的能力,数据处理的能力,这些都是我们在做高性能计算的时候就一直在研究,多少年来一直在研究的技术。所以高性能计算前期研究的成果,当然很多地方可以给云计算提供支撑,提供支持。 另外一方面,我们看到云计算对高性能计算其实也有影响,我们看高性能计算形式很多,长期以来我们就在做开发了很多公共的高性能计算中心,其实从应用模式上来讲,它也是把资源集中起来,通过远端去访问,本端地不需要这样的一个计算能力,所以云计算这个模式提出来之后,对高性能计算应用这样的一个模式,有更多的这样的一个借鉴的意义,他们互相的技术,而且我们看到互相可以借鉴这样的一些技术和思想。另外我们看到传统的高性能计算领域范围也在不断的扩展,实际上他们相互之间,大数据的处理,视频的监控,或者其他网络搜索引擎,都是高性能计算的问题,有瓶颈,我一直提有瓶颈的地方就有性能的需求,解决了这个性能的设备,我们就可以认为是一个高性能计算机,尽管它跑的是我们认为的云计算的一些应用,云计算也没有特别特殊的一些应用,它可能有它自己一套编程的方法,它开发的一套模式。但是从根本上来讲,我要这么大性能都是为了解决性能的问题,为了满足存储量的需求,可以从这个角度上来去理解高性能计算和云计算的关系,它们不是互相排斥的。 主持人:现在云计算也可能是来解决大数据这个问题,当前高性能计算为企业大数据带来了哪些支持,这方面您认为它们能切实解决大数据的问题,在采用传统的服务器,在采用高性能计算这块有明显的优势,比传统的服务器? 戴荣:高性能计算机和传统的服务器,其实我个人认为不是特别对立,因为它们有互相结合的一个地方,而且我们看到现在很多集群系统,所谓的集群系统我买很多台服务器,然后用更快速的网络,再给它配上高速的存储这样的一个高性能计算的设备,高性能处理的一个设备,所以它没有明显绝对的界限。高性能计算机的话,对大数据来讲,我们现在数据增长非常快,而且越来越快,我们提到,我记得有个定律提到数据量的增长肯定比摩尔定律增长要快的多,这个时候怎么来处理这些数据,现在大数据的时代,实际上我认为是给高性能带来了更多的机会,以后碰到越来越多瓶颈,就会有高性能计算的需求。 主持人:给人更多的高性能计算解决一种对计算资源的利用上的精益求精,如果在现实上,企业在选择高性能服务器的时候,你觉得企业应该关注哪些方面? 戴荣:我觉得要根据企业自己的需求来定制,你主要在上面跑的是什么样的应用,是传统的气象、生物这样一些应用,还是一些商业化的应用,比如数据库、HPC分析软件等等,可能要根据需求来选择不同的配置,是CPU密集型,还是要大内存的,所以并不是每一套系统,每个企业在应用系统上都会稍微有一些差别,会有不同的要求,根据需求出发来选择高性能计算机是非常必要的。可能不需要盲目的去上一些有多少处理能力,可能要跑多快的系统,不一定是最适合的系统。所以我们的工程师跟用户在做交流都会非常关注他们的应用,给他具体的配置。 主持人:尤其咱们互联网行业,对于大数据处理很重视,而对于传统行业,这块就不是那么重视。我们在设计曙光产品的时候,在了解用户需求的时候,我们怎么能去抓住用户切实的需求点,比如我自己有可能开了有很多各地区很多分店的东西,我该如何去考量我自己HPC需求呢? 戴荣:这个我觉得其实很多用户他很难提炼出来,这个可能需要更有经验的技术人员跟他交流,根据他的要求来看。因为我们可能做过很多的设计,很多的项目,可以把这个项目成功经验移植到另一个项目成功经验上,用户本身可能第一个,如果用户本身能记得更多的数据,自己能够记得一些数据、问题,能把问题反馈清楚,他的问题其实就是需求,这样我们就会有很大的帮助。我们可以把一些成熟的,因为曙光有很多这样成熟的解决方案,我们可以根据他的要求来设计合适的方案。 主持人:那就是说我们现在曙光自己来说,我们现在面向市场化的产品大致有多少呢? 戴荣:我们所有产品都是面向市场化的,我们现在有五条产品线,包括高性能计算机、服务器、存储、安全产品还有云计算的产品线,我们所有产品线,曙光还是一个市场化运作的公司,我们的产品都是要推向市场的,不是科研型的。 -完-
网友评论
更多
往期视频
|
主持人介绍
王珂玥kaiyun体育官方人口 编辑
现场图片
相关文章
栏目简介
致力于行业发展,关注企业信息化需求领域的实践和动态,kaiyun体育官方人口 推出《畅享视频》栏目,提供专业资讯与商务服务,共话企业信息化建设的成功之道。 《畅享视频》与知名专家、企业高层、成功客户代表等各类权威人士共同参与,分享权威人士的最新观点和体会,探讨企业经营真谛,与专家之家对话。锁定信息化领域,从不同的角度深入对话探讨,理论、实践、引导和执行的强力组合,以“共享”理念,与您分享! 幕后制作:
|
|