ag8亚洲

首页 > 环亚下载 > 凯发旗舰厅登陆下载-英伟达联手Arm迎战高性能计算!GPU加速卡将支持Arm架构CPU

凯发旗舰厅登陆下载-英伟达联手Arm迎战高性能计算!GPU加速卡将支持Arm架构CPU

来源:民航资源网 作者:未知  
2020-01-09 12:21:03

凯发旗舰厅登陆下载-英伟达联手Arm迎战高性能计算!GPU加速卡将支持Arm架构CPU

凯发旗舰厅登陆下载,智东西(公众号:zhidxcom)文 | 心缘

智东西6月17日消息,在今日于德国举行的isc 2019国际超算大会上,美国芯片巨头英伟达(nvidia)今天宣布其用于超级计算机的加速平台将对arm架构cpu支持,即计划利用其芯片与使用arm架构的cpu协作打造超级计算机。

这为高性能计算(hpc,high performance computing)行业开辟了一条全新的路径,为能够实现“exascale”性能的超级计算机铺平道路,有助于构建具有极高能效水平的百万兆级ai超级计算机。

nvidia表示,将于年底前向arm生态系统提供全堆栈的ai和hpc软件。堆栈优化完成后,nvidia将能为包括x86、power和arm在内的所有主流cpu架构提供加速。

此外,nvidia还于今日推出了全球排名第22快的超级计算机dgx superpod,据称可满足自动驾驶车辆部署计划的大量需求。

nvidia一直是数据中心市场的佼佼者,其gpu芯片被用于与英特尔、ibm等公司的中央处理器(cpu)协同工作,完成大规模并行计算的加速任务。

在超大规模数据中心和高性能计算的服务器市场,英特尔x86处理器长期占据主导地位,随后ibm power芯片则成为后起之秀,而ibm的power处理器在近年亦出现翻盘之势,主要在中低端服务器芯片市场分食x86的市场蛋糕,而arm则试图在中低端服务器市场赢得更多的市场份额。

英国arm公司是全球领先的半导体知识产权(ip)供应商, 于2016年被日本软银集团以234亿英镑(约合310亿美元)高价收购。

不同于英特尔和ibm,arm公司本身不直接从事芯片生产,而是依靠给芯片厂商们提供底层的处理器架构授权,从而获得授权费用和一定版税。

苹果、三星、高通、华为、飞利浦等各大芯片厂商们都从arm那里购买授权,全球绝大多数智能手机和平板电脑等便携式消费电子产品均采用arm架构。

和其他架构相比,arm的一大特色在于出色的能效,它能够为超级计算机提供开放式架构,因此用户可以添加各种有益于超级计算的有趣技术,例如紧密集成。

nvidia副总裁兼加速计算总经理ian buck称,通过将arm cpu与tesla gpu相结合,使用者可以完成大量的hpc仿真和ai所需的繁重计算,并且arm可以使用快速单线程来执行cpu。

arm已经在世界各地的许多hpc中心获得了越来越多的关注,此前采用arm架构的exascale系统没有gpu,如今nvidia新增对arm支持的举动并不令人意外。

buck表示,从技术角度来看,用arm制造超级计算机的项目将是一次“重举”。据他介绍,现在是nvidia宣布支持arm cpu的最佳时期,他们花了两年的时间来完成所有这些工作,希望在今年年底之前发布第一个完整版本。

nvidia支持arm cpu后,将为研发超算的研究人员们提供了除英特尔和ibm外的第三种选择,并使得研发者可以通过这种方式获得更多的自主控制能力。

hpc市场预计到2025年价值将达到596.5亿美元,nvidia一直是推动高性能计算发展的重要力量。今日发布的green500排行榜,在全球最节能的25款超级计算机中,有22款都得益于nvidia的支持。

之所以能有如此成绩,源自nvidia的多项核心技术。采用nvidia gpu的超级计算机,能够将繁重的处理作业卸载至更为节能的并行处理cuda gpu之上,另外nvidia与infiniband和以太网互连供应商mellanox合作优化整体超级计算集群的处理,nvidia还在sxm 3d封装技术和可实现极密集型扩展节点的nvidia nvlink互联技术方面投入大量研发。

nvidia对基于arm的hpc系统的支持建立在双方超过10年的合作基础之上。nvidia的几款用于便携式游戏、自动驾驶汽车、机器人和嵌入式ai计算的系统级芯片产品都采用了arm。

据悉,nvidia将于年底前向arm生态系统提供全堆栈的ai和hpc软件,该堆栈为600多个hpc应用程序和所有ai框架提供加速,其中包括所有nvidia cuda-x ai和hpc库、gpu加速的ai框架和软件开发工具,如支持openacc的pgi编译器和性能分析器。

nvidia创始人兼首席执行官黄仁勋表示:“超级计算机是促进科学发现的重要工具,建立百万兆级超级计算将能够极大地扩展人类知识的边界。随着传统计算规模扩展步伐的停止,功率也将成为所有超级计算机的限制因素。nvidia cuda加速的计算和arm的高能效cpu架构的相结合,将助力hpc社区实现大幅提升,以达到百万兆级。”

“arm正在与生态系统合作,为基于arm的soc带来前所未有的计算性能提升,并实现百万兆级功能,”arm首席执行官simon segars表示,“hpc社区已经部署了arm技术,以应对全球最复杂的研究挑战。通过与nvidia合作,将cuda加速引入arm架构,这一举措对于hpc社区来说,可谓是一大重要里程碑。”

ampere computing董事长兼首席执行官renee james认为,其客户正致力于寻求基于arm的高性能处理器,来运行其最苛刻的工作负载,因此很高兴nvidia正在将cuda和围绕nvidia所建立的丰富的生态系统引入arm。

arm生态系统另一位领导者——atos的高级执行副总裁、大数据和网络安全部门负责人pierre barnabé亦表示,这一重要发布将加速ai和模拟世界的融合,同时优化能效。

cray总裁兼首席执行官peter ungaro表示,其cray系统管理和编程环境(编译器、库和工具)已经能够在xc和未来的shasta超级计算机上支持arm处理器,将cuda和cuda-x hpc和ai软件堆栈用于arm平台,并将其与cray系统管理和编程环境紧密集成。

此外, csc、 epi、hpe、jülich超算中心、marvell等均表态称,看好将arm架构与nvidia gpu相结合,认为它将有助于优化hpc和ai工作负载,匹配未来百万兆级前(pre-exascale)解决方案的构建模块,助力hpc行业解决日益不可持续的功耗水平问题。

在高校与科研机构的一些专家也发表了看法,比如理化学研究所计算科学研究中心负责人、东京工业大学教授satoshi matsuoka。

“过去十年中,我们一直积极率先在大型超级计算机上采用nvidia gpu,包括日本最强大的abci超级计算机,”satoshi matsuoka说,“理化学研究所计算科学研究中心目前正在致力于开发下一代基于arm的百万兆级fugaku超级计算机,我们很高兴听到nvidia的gpu加速平台很快将能够用于基于arm的系统。”

今日,nvidia还推出了全球排名第22快的超级计算机:dgx superpod。据nvidia人工智能基础设施副总裁clement farabet表示,它提供的ai基础设施可满足公司自动驾驶车辆部署计划的大量需求。

据介绍,superpod包含96个dgx-2h单元和1536个v100 tensor core图形芯片,与mellanox和nvidia的nvswitch技术相互连接。

它比同等顶级超级计算系统小约400倍,组装只需三周,同时提供9.4 petaflops的计算性能。在实际测试中,它试图在不到两分钟的时间内训练基准ai模型resnet-50。

“很少有ai挑战与训练自动驾驶汽车一样苛刻,这需要对神经网络进行数万次重新训练,以满足极端的精确度需求,”farabet说,“没有像superpod那样的大规模处理能力的替代品。”

客户可以从nvidia的任何dgx-2合作伙伴处购买superpod的全部或部分内容。

如果nvidia按照预期,在年底前为arm生态系统提供全套的人工智能和高性能计算(hpc)软件,这将为超算研发者们提供除x86、power之外,另一种更具开放性的选择。

此外,从众多业内人士的表态来看,这一重要发布对于基于arm打造超级计算机的研发机构或企业而言,将是进一步扩展其超算性能,推动高性能计算提供更出色能效的重要推动力。


上一篇:“卖春博士”张竞生:让中国人的魂灵飞上了半天

下一篇:2018中国高校排名出炉,三峡大学等湖北省属高校表现亮眼!

延伸阅读:
© Copyright 2018-2019 etcreo.com ag8亚洲 Inc. All Rights Reserved.