案例研究高性能计算(HPC)英特尔Omni-Path架构构建世界一流的融合型多任务高性能计算集群英特尔Omni-Path架构为Bridges超级计算机提供了支持广泛工作负载所需的性能.
概览PSC将Bridges打造成可以执行多任务的超级计算资源.
该系统包含908个先进的计算节点:2台12TBHPEIntegritySuperdome*X,每台搭载16个英特尔至强处理器E7-8880v32台12TBHPEIntegritySuperdomeX,每台搭载16个英特尔至强处理器E7-8880v48台3TBHPEProLiant*DL580,每台搭载4个英特尔至强处理器E7-8860v334台3TBHPEProLiantDL580,每台搭载4个英特尔至强处理器E7-8870v4752台128GBHPEApollo*2000服务器,每台搭载2个英特尔至强处理器E5-2695v348台128GBHPEApollo2000服务器,每台搭载2个英特尔至强处理器E5-2695v3和2个GPU英特尔Omni-Path架构(英特尔OPA)48端口交换机以全对分带宽构建了由1,176个内核组成的紧密耦合分区倍受赞誉的设计放眼当下世界一流的高性能计算(HPC)装置,您会发现,越来越多对计算需求较高的机构(如匹兹堡超级计算中心(PSC))开始指定架构,以便为更广泛的用户服务,而不只为需要运行复杂仿真的传统科学服务.
更重要的是,这些系统旨在帮助那些本身不是计算机科学家(使用像R*和Python*这种更高级语言编程的研究人员)的用户获得更多发现.
PSC高级研究总监NickNystrom称,这种高度灵活性是PSC的Bridges超级计算机的一项强制设计要求,在实现这一设计目标的过程中,英特尔OPA发挥了重要作用.
挑战"如今,要接触大量人员并为他们提供所需的计算设施,最好的方法就是让资源变得可用,且不要求他们成为高性能计算程序员.
"Nystrom表示.
许多人都更愿意使用自己的工具在自己熟悉的桌面环境中工作,而不是被迫学习用C++和MPI编程.
而且,虽然有些用户需要使用这些高性能资源来进行模拟,但有些用户却需要在不同的范式中,利用跨高性能计算、大数据和其他领域组件来表达问题.
多年以来,传统的高性能计算架构一直只侧重一个领域,而这无法满足所有这些需求.
PSC需要采用更加灵活的系统设计,但又不能牺牲其性能.
解决方案HPE公司分两个阶段构建和安装Bridges-第1阶段,涵盖采用英特尔Omni-Path架构设计的822台服务器;第2阶段,添加86个额外节点(和126TB系统内存).
根据设计,Bridges将被划分为多组节点,分别用于不同的工作负载,以便资源能够同时满足多种计算需求.
但是,此举需要提供非常高的IO带宽.
PSC选择采用英特尔OPA架构来满足这些融合计算和IO需求.
英特尔OPA将Bridges连接在一起Bridges架构以846个先进的计算节点为基础构建,其中包括4台大内存HPEIntegritySuperdomeX服务器,每台具备12TBRAM;42台HPEProLiantDL580服务器,每台具备3TBRAM;842台HPEApollo2000服务器,每台具备128GBRAM.
此外,还有42台HPEApollo2000服务器,每台具备128GBRAM,提供持久型数据库、Web服务和系统管理功能.
此系统采用英特尔OPA交换机来构建增强型叶脊网络布局,并与支持Bridges各种工作负载的异构架构互连.
2结果英特尔OPA为Bridges提供了系统运行各种工作负载所需的性能.
其架构能够提供高带宽、极低的延迟,以及非常高的注入速率.
Nystrom的数据表明,PSC的首次基准测试显示带宽达到12.
37GB/s,延迟仅为930纳秒,这一数值远超预期,令人印象深刻.
英特尔OPA边缘交换机有助于为Bridges构建非常高效的架构.
英特尔OPA48端口边缘交换机使PSC能够在约1000个内核上运行紧密耦合的应用程序.
"这对于非传统社区和大部分传统高性能计算来说是非常理想的.
"Nystrom说.
这种48端口交换机让42节点(每个节点都具备28个英特尔至强处理器内核)孤岛互相连接,由此创建出包含1,176个内核且紧密耦合的分区,并通过100Gbps交换机以全对分带宽运行.
"如果只有36端口交换机,我们就必须构建更加复杂的网络,才能获得1000个内核所需的全对分带宽.
"Nystrom补充道.
Bridges也可以为需要更高水平计算资源且不受全对分带宽限制的项目提供高达22,400个内核(或者约27,000个内核,包括大内存节点在内).
"英特尔OPA让我们得以实现这些互补的目标.
"他总结道.
2016年2月,Bridges执行了它的首个任务:在MIDASMISSION公共健康黑客马拉松赛事上运行新奇和创新的虚拟化技术应用,当时它只使用了几个节点.
自此以后,按照设计目的,该系统被用于运行广泛的工作负载,助力多个科学领域取得了非凡的发现.
与Bridges赌博非常不明智2017年1月,在美国宾夕法尼亚州匹兹堡的大河赌场,举办了一场无限下注的德州扑克游戏竞赛,由人和芯片对阵,在这场比赛中,Bridges击败了4位世界顶尖的扑克玩家.
Libratus是由卡耐基梅隆大学计算机科学学院开发的一项人工智能(AI)程序,它使用Bridges的1900万个内核小时来首次计算其战略.
竞赛举办期间,该程序在Bridges的752个常规内存节点中的600个节点上运行.
此后,在每晚比赛之后,Libratus会根据玩家所做的战略改变来调整其自己的战略.
对于PSC和CMU,Bridges不负所望.
Bridges的出色表现——荣获高性能计算社区颁发的奖项Bridges在SC16上为PSC斩获了两个国际奖项:HPCwire读者和编辑推荐奖.
最好的数据密集型系统(以终端用户为导向):Bridges有一项强制性设计要求:能够支持更多的高性能计算用户,但不需要他们学习编程,也不用他们熟悉高性能计算编程模式.
4个MDS节点20个存储构建模块,用于实施并行的Pylon存储系统(10PB可用容量)4个HPEIntegritySuperdomeX(12TB)计算节点每个具有2个网关节点20个"叶片式"英特尔OPA边缘交换机42个HPEProLiantDL580(3TB)计算节点12个HPEProLiantDL380数据库节点6个HPEProLiantDL360Web服务器节点2个前端节点2个启动节点8个管理节点英特尔OPA电缆800个HPEApollo2000(128GB)计算节点面向数据密集型高性能计算的专用英特尔Omni-Path架构拓扑Bridges虚拟旅行:https://www.
psc.
edu/bvt6"核"英特尔OPA边缘交换机:全互连,每台交换机具备2条链路3此奖项旨在表彰该系统能够面向物理、社会和计算机科学领域的更多研究人员开放,让他们得以使用高性能计算的能力.
充分使用高性能数据分析:通过与哈佛大学和艾伦脑科学研究所协作,Bridges分析了约35TB的数据,借此重构老鼠大脑中视觉中枢的"线路图".
"这项工作会识别出对特定的视觉元素做出反应的神经细胞,以及这些细胞如何传递信号.
这项发现推动大脑连接的重构工作向前迈出了一大步,该工作有助于科学家了解大脑内的数百万个神经细胞是如何相互通信以及共同工作的.
"Bridges的大内存节点支持DeNovo基因排列组合在基因组学中,占用内存最多的工作就是基因排列组合,现在,Galaxy平台提供的denovo转录组基因排列组合使用Bridges的12TB大内存节点来快速排列组合大量RNA序列数据.
排列组合要求将整个定序器数据输出加载至内存,然后运行代码,从数百万条转录组中找到匹配项.
"Bridges的大内存节点非常适合执行此类工作.
"Nystrom表示.
解决方案摘要Bridges在为传统高性能计算科学家提供超级计算资源的同时,也让本身不是高性能计算程序员的用户获得超级计算能力,借此推动新的研究发现.
PSC系统的架构可以让更广泛的用户和科学家跨不同计算领域(传统型高性能计算、大数据、虚拟化技术,以及机器学习/人工智能)实施更广泛的研究.
英特尔OPA构建在HPESuperdome、ProLiant和Apollo服务器之上,将这些系统互相连接起来,形成强大的科学研究解决方案.
更多信息有关Bridges的更多信息,请访问www.
psc.
edu/resources/computing/bridges.
有关英特尔Omni-Path架构的更多信息,请访问https://www.
intel.
com/content/www/cn/zh/products/network-io/high-performance-fabrics.
html.
解决方案组成部分4台具有12TB内存的HPEIntegritySuperdomeX服务器——英特尔至强处理器E7-8880v3和v442台具有3TB内存的HPEProLiantDL580服务器——英特尔至强处理器E7-4800/8800/v4/v3848台具有128GB内存的HPEApollo2000服务器——英特尔至强处理器E5-2695v3英特尔Omni-Path主机架构适配器英特尔Omni-Path边缘交换机(48端口)1https://www.
psc.
edu/news-publications/2437-bridges-brain-reconstruction-win-hpcwire-awards英特尔技术的特性和优势取决于系统配置,并可能需要支持的硬件、软件或服务得以激活.
产品性能会基于系统配置有所变化.
没有计算机系统是绝对安全的.
更多信息,请见:http://www.
intel.
com/content/www/us/en/high-performance-computing-fabrics/omni-path-architecture-fabric-overview.
html,或从原始设备制造商或零售商处获得更多信息.
对于Megalayer云服务器提供商在之前也有对于他们家的美国服务器和香港服务器进行过评测和介绍,但是对于大部分网友来说需要独立服务器和站群服务器并不是特别的普及,我们很多网友使用较多的还是云服务器或者VPS主机比较多。在前面也有在"Megalayer新增香港VPS主机 1GB内存 50GB SSD 2M带宽 月59元"文章中有介绍到Megalayer商家有新增香港CN2优化VPS主机。那时候看这...
亚洲云Asiayun怎么样?亚洲云成立于2021年,隶属于上海玥悠悠云计算有限公司(Yyyisp),是一家新国人IDC商家,且正规持证IDC/ISP/CDN,商家主要提供数据中心基础服务、互联网业务解决方案,及专属服务器租用、云服务器、云虚拟主机、专属服务器托管、带宽租用等产品和服务。Asiayun提供源自大陆、香港、韩国和美国等地骨干级机房优质资源,包括BGP国际多线网络,CN2点对点直连带宽以...
百纵科技湖南百纵科技有限公司是一家具有ISP ICP 电信增值许可证的正规公司,多年不断转型探索现已颇具规模,公司成立于2009年 通过多年经营积累目前已独具一格,公司主要经营香港服务器,香港站群服务器,美国高防服务器,美国站群服务器,云服务器,母机租用托管!美国CN2云服务器,美国VPS,美国高防云主机,美国独立服务器,美国站群服务器,美国母机。美国原生IP支持大批量订货 合作 适用电商 亚马逊...