应用程序linpack
linpack 时间:2021-03-26 阅读:(
)
TESLAV100性能指南深度学习和HPC应用程序2017年11月应用程序性能指南TESLAV100性能指南现代高性能计算(HPC)数据中心是解决全球一些重大科学和工程挑战的关键.
NVIDIATesla加速计算平台让这些现代数据中心能够使用行业领先的应用>程序加速完成HPC和AI领域的工作.
TeslaV100GPU是现代数据中心的>引擎,能够以更少的服务器提供突破性性能,从而加快探索发现的步伐,>并大幅降低成本.
改进的性能和解决方案时间对提高收益和生产力也有显著的有利影响.
每个HPC数据中心都可从Tesla平台中受益.
多个领域超过500款HPC应用程序已经过GPU优化,其中包括全部15大常用HPC应用程序以及各主要的深度学习框架.
超过500款HPC应用程序和各主要深度学习框架已支持GPU加速.
>>要获取GPU加速应用程序的最新目录,请访问:www.
nvidia.
cn/object/gpu-applications-cn>>如要获取适用于各种加速应用程序的简单指令,以实现GPU上的快速启动和运行,请访问:>www.
nvidia.
com/gpu-ready-apps使用GPU加速应用程序的研究领域包括:深度学习分子动力学量子化学物理学地球科学工程学HPC基准测试深度学习正在解决几年前还看似遥不可及的科学、企业级的和消费者层面的>重要问题.
各主要深度学习框架均支持NVIDIAGPU优化,从而使数据科学家和研究人员可以在工作中利用人工智能.
数据中心配有TeslaV100GPU后,在运行深度学习训练和推理框架时可节省高达85%的服务器和基础架构购置>成本.
深度学习训练适用的TESLA平台和V100的主要特性>借助TeslaV100,Caffe、TensorFlow和CNTK的速度可提升至高达3倍(与P100相比)>所有常用深度学习框架均支持GPU加速>TensorFlow运算能力高达125TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cnTESLAV100性能指南深度学习应用程序性能指南|深度学习CAFFE加州大学伯克利分校开发的一种热门GPU加速深度学习框架版本1.
0加速特性全框架加速可扩展性多GPU更多信息caffe.
berkeleyvision.
org应用程序性能指南|深度学习分子动力学(MD)代表HPC数据中心的大部分工作负载.
所有常用MD应用程序均已支持GPU加速,科学家们先前无法借助这些应用程序的传统>纯CPU版本执行的模拟,现在都可运行.
数据中心配有TeslaV100GPU后,>在运行MD应用程序时可节省高达80%的服务器和基础架构购买成本.
MD适用的TESLA平台和V100的主要特性>对于HOOMD-Blue和Amber等应用程序,配有V100的服务器可以代替54台CPU服务器的对应性能>所有常用MD应用程序均支持GPU加速>支持主要数学库,例如FFT和BLAS>每个GPU的单精度浮点运算能力高达15.
7TFLOPS/s>每个GPU的带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/molecular_dynamics_cnTESLAV100性能指南分子动力学应用程序性能指南|分子动力学HOOMD-BLUE专为GPU编写的粒子动力学程序包版本2.
1.
6加速特性CPU和GPU版本可用可扩展性多GPU和多节点更多信息http://codeblue.
umich.
edu/hoomd-blue/index.
htmlAMBER一套模拟生物分子层面上分子动力学的程序版本16.
8加速特性PMEMD显式溶剂和GB;显式和隐式溶剂、REMD、aMD可扩展性多GPU和单节点更多信息http://ambermd.
org/gpus量子化学(QC)模拟是发现新药物和材料的关键,占用HPC数据中心工作负载的大部分.
目前,60%的常用QC应用程序已支持GPU加速.
数据中心配有TeslaV100GPU后,在运行QC应用程序时可节省高达30%的服务器和基础架构购买成本.
QC适用的TESLA平台和V100的主要特性>对于VASP等应用程序,配有V100的服务器可以代替多达5台CPU服务器的对应性能>60%的常用QC应用程序均支持GPU加速>支持主要数学库,例如FFT和BLAS>每个GPU的双精度浮点运算能力高达7.
8TFLOPS/s>适用于大型数据集的显存容量高达16GB如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/computational_chemistry_cnTESLAV100性能指南量子化学应用程序性能指南|量子化学VASP用于执行量子力学分子动力学(MD)从头计算模拟的程序包版本5.
4.
4加速特性RMM-DIIS、BlockedDavidson、K-points和精确交换可扩展性多GPU和多节点更多信息www.
nvidia.
com/vasp从聚变能到高能粒子,物理学模拟涵盖了HPC数据中心的各种应用程序.
许多常用物理学应用程序均已支持GPU加速,取得了之前不可能得到的宝贵见解.
>数据中心配有TeslaV100GPU后,运行GPU加速的物理学应用程序时可节省高达75%的服务器购买成本.
物理学适用的TESLA平台和V100的主要特性>对于GTC-P、QUDA和MILC等应用程序,配有V100的服务器可以代替>多达75台CPU服务器的对应性能>大多数常用物理学应用程序均支持GPU加速>双精度浮点运算能力高达7.
8TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cn(点击下拉菜单选择"物理学")TESLAV100性能指南物理学应用程序性能指南|物理学GTC-P用于优化等离子体物理学的开发代码版本2017加速特性推动、移动和碰撞可扩展性多GPU更多信息www.
nvidia.
com/gtc-pQUDA用于格点量子色动力学的GPU库版本2017加速特性全部可扩展性多GPU和多节点更多信息www.
nvidia.
com/quda应用程序性能指南|物理学MILC格点量子色动力学(LQCD)代码,用于模拟基本粒子如何通过"强相互作用"形成和束缚以生成更大的粒子(例如质子和中子)版本2017加速特性交错费米子、克里洛夫求解和链节增大可扩展性多GPU和多节点更多信息www.
nvidia.
com/milc地质科学模拟是发现石油和天然气以及执行地质建模的关键.
目前,许多常用地质科学应用程序均已支持GPU加速.
数据中心配有TeslaV100GPU后,在运行地球科学应用程序时可节省高达70%的服务器和基础架构购买成本.
地球科学适用的TESLA平台和V100的主要特性>对于RTM和SPECFEM3D等应用程序,配有V100的服务器可以代替>多达82台CPU服务器的对应性能>常用石油和天然气应用程序均支持GPU加速>单精度浮点运算能力高达15.
7TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cn(点击下拉菜单选择"石油天然气/地震")TESLAV100性能指南地球科学应用程序性能指南|地球科学RTM逆时偏移(RTM)建模是油气勘探地震数据处理工作流程中的关键组成部分版本2017加速特性批处理算法可扩展性多GPU和多节点SPECFEM3D模拟地震波传播版本7.
0.
0可扩展性多GPU和多节点更多信息https://geodynamics.
org/cig/software/specfem3d_globe工程模拟是通过建模流程、热传递和有限元分析等开发新产品的关键环节.
目前,许多常用工程应用程序均已支持GPU加速.
数据中心配有NVIDIATeslaV100GPU后,在运行工程应用程序时可节省高达20%的服务器和基础架构购买成本,以及高达50%的软件许可成本.
工程适用的TESLA平台和V100的主要特性>对于SIMULIAAbaqus和ANSYSFLUENT等应用程序,配有TeslaV100的服务器可以代替多达4台CPU服务器的对应性能>常用工程应用程序均支持GPU加速>显存容量高达16GB>显存带宽高达900GB/s>双精度浮点运算能力高达7.
8TFLOPS/sTESLAV100性能指南工程学应用程序性能指南|工程学SIMULIAABAQUS用于分析结构的模拟工具版本2017加速特性稀疏直接求解器AMSEigen求解器稳态动力学求解器可扩展性多GPU和多节点更多信息www.
nvidia.
com/simulia-abaqusANSYSFLUENT用于流体动力学模拟的通用软件版本18加速特性基于压力的耦合求解器和辐射热传递可扩展性多GPU和多节点更多信息www.
nvidia.
com/ansys-fluent基准测试提供了系统在一定生产规模下的表现的近似情况,有助于评估不同>系统的相对性能.
常用基准测试具有GPU加速版本,可以帮助您了解在数据>中心运行GPU的好处.
基准测试适用的TESLA平台和V100的主要特性>对于Cloverleaf、MiniFE、Linpack和HPCG等基准测试,配有TeslaV100的服务器可以代替多达67台CPU服务器的对应性能>常用基准测试均支持GPU加速>双精度浮点运算能力高达7.
8TFLOPS/s,显存容量高达16GB>显存带宽高达900GB/sTESLAV100性能指南HPC基准测试应用程序性能指南|HPC基准测试CLOVERLEAF基准测试–迷你应用流体动力学版本1.
3加速特性Lagrangian-Eulerian显式流体动力学迷你应用可扩展性多节点(MPI)更多信息http://uk-mac.
github.
io/CloverLeafMINIFE基准测试–迷你应用有限元分析版本0.
3加速特性全部可扩展性多GPU更多信息https://mantevo.
org/about/applications应用程序性能指南|HPC基准测试LINPACK基准测试–测量浮点运算能力版本2.
1加速特性全部可扩展性多节点和多节点更多信息www.
top500.
org/project/linpackHPCG基准测试–练习与各种重要HPC应用程序密切相符的计算和数据访问模式版本3加速特性全部可扩展性多GPU和多节点更多信息www.
hpcg-benchmark.
org/index.
html2017NVIDIACorporation.
保留所有权利.
NVIDIA、NVIDIA徽标和Tesla均为NVIDIACorporation在美国和其他国家/地区的商标和/或注册商标.
其他公司和产品名称可能是其各关联公司的商标.
2017年11月TESLAV100产品规格适用于PCIe服务器的NVIDIATeslaV100适用于经NVLink优化服务器的NVIDIATeslaV100双精度浮点运算能力高达7TFLOPS高达7.
8TFLOPS单精度浮点运算能力高达14TFLOPS高达15.
7TFLOPS深度学习高达112TFLOPS高达125TFLOPSNVIDIANVLink互联带宽-300GB/sPCIex16互联带宽32GB/s32GB/sCoWoSHBM2堆叠式显存容量16GB16GBCoWoSHBM2堆叠式显存带宽900GB/s900GB/s相关假设和免责声明常用应用程序中支持GPU加速的百分比数据来源于i360报告《HPCSupportforGPUComputing》(HPC对GPU计算的支持报告)中50大应用程序列表.
吞吐量和成本节约的相关计算数据,为应用程序在域中以相同的计算周期进行基准测试得到的假设工作负载概要:http://www.
intersect360.
com/industry/reports.
phpid=131匹配单个GPU节点所需的CPU节点数使用GPU节点应用程序加速的实验室性能结果和多CPU节点扩展性能进行计算.
例如,分子动力学应用程序HOOMD-Blue的GPU节点应用程序加速为37.
9倍.
将CPU节点扩展到8个节点集群时,总系统输出为7.
1倍.
因此,扩展系数为8除以7.
1(即1.
13).
要计算匹配单个GPU节点性能所需的CPU节点数,应将37.
9(GPU节点应用程序加速系数)乘以1.
13(CPU节点扩展系数),也就是需要43个节点.
物语云计算怎么样?物语云计算(MonogatariCloud)是一家成立于2016年的老牌国人商家,主营国内游戏高防独服业务,拥有多家机房资源,产品质量过硬,颇有一定口碑。本次带来的是特惠活动为美国洛杉矶Cera机房的不限流量大带宽VPS,去程直连回程4837,支持免费安装Windows系统。值得注意的是,物语云采用的虚拟化技术为Hyper-v,因此并不会超售超开。一、物语云官网点击此处进入物语云...
IonSwitch是一家2016年成立的国外VPS主机商,部落上一次分享的信息还停留在2019年,主机商提供基于KVM架构的VPS产品,数据中心之前在美国西雅图,目前是美国爱达荷州科德阿伦(美国西北部,西接华盛顿州和俄勒冈州),为新建的自营数据中心。商家针对新数据中心运行及4号独立日提供了一个5折优惠码,优惠后最低1GB内存套餐每月仅1.75美元起。下面列出部分套餐配置信息。CPU:1core内存...
捷锐数据官网商家介绍捷锐数据怎么样?捷锐数据好不好?捷锐数据是成立于2018年一家国人IDC商家,早期其主营虚拟主机CDN,现在主要有香港云服、国内物理机、腾讯轻量云代理、阿里轻量云代理,自营香港为CN2+BGP线路,采用KVM虚拟化而且单IP提供10G流量清洗并且免费配备天机盾可达到屏蔽UDP以及无视CC效果。这次捷锐数据给大家带来的活动是香港云促销,总共放量40台点击进入捷锐数据官网优惠活动内...
linpack为你推荐
.cn域名cn域名有什么用啊?商标注册流程及费用注册商标的程序及费用?access数据库Access数据库对象的操作包括哪五种?www.522av.com我的IE浏览器一打开就是这个网站http://www.522dh.com/?mu怎么改成百度啊 怎么用注册表改啊www.vtigu.com如图所示的RT三角形ABC中,角B=90°(初三二次根式)30 如图所示的RT三角形ABC中,角B=90°,点p从点B开始沿BA边以1厘米每秒的速度向A移动;同时,点Q也从点B开始沿BC边以2厘米每秒的速度向点C移动。问:几秒后三角形PBQ的面积为35平方厘米?PQ的距离是多少avtt4.comCOM1/COM3/COM4是什么意思??/杨丽晓博客杨丽晓今年高考了吗?yinrentangweichentang产品功效好不好?dpscycle寻求LR 高输出宏红玉头冠和田红玉皮越厚越好还是皮越薄越显示红玉,更加好,开窗后见红肉了,是不是代表红玉了,
网站空间商 虚拟主机排名 tightvnc 镇江联通宽带 java虚拟主机 太原联通测速平台 共享主机 微软服务器操作系统 香港新世界中心 中国电信宽带测速器 新睿云 网页提速 华为k3 winds 跟踪路由 byebyelove 瓦工技术 国外bt下载网站 腾讯空间登录首页 厦门电信网上营业厅 更多