应用程序linpack

linpack  时间:2021-03-26  阅读:()
TESLAV100性能指南深度学习和HPC应用程序2017年11月应用程序性能指南TESLAV100性能指南现代高性能计算(HPC)数据中心是解决全球一些重大科学和工程挑战的关键.
NVIDIATesla加速计算平台让这些现代数据中心能够使用行业领先的应用>程序加速完成HPC和AI领域的工作.
TeslaV100GPU是现代数据中心的>引擎,能够以更少的服务器提供突破性性能,从而加快探索发现的步伐,>并大幅降低成本.
改进的性能和解决方案时间对提高收益和生产力也有显著的有利影响.
每个HPC数据中心都可从Tesla平台中受益.
多个领域超过500款HPC应用程序已经过GPU优化,其中包括全部15大常用HPC应用程序以及各主要的深度学习框架.
超过500款HPC应用程序和各主要深度学习框架已支持GPU加速.
>>要获取GPU加速应用程序的最新目录,请访问:www.
nvidia.
cn/object/gpu-applications-cn>>如要获取适用于各种加速应用程序的简单指令,以实现GPU上的快速启动和运行,请访问:>www.
nvidia.
com/gpu-ready-apps使用GPU加速应用程序的研究领域包括:深度学习分子动力学量子化学物理学地球科学工程学HPC基准测试深度学习正在解决几年前还看似遥不可及的科学、企业级的和消费者层面的>重要问题.
各主要深度学习框架均支持NVIDIAGPU优化,从而使数据科学家和研究人员可以在工作中利用人工智能.
数据中心配有TeslaV100GPU后,在运行深度学习训练和推理框架时可节省高达85%的服务器和基础架构购置>成本.
深度学习训练适用的TESLA平台和V100的主要特性>借助TeslaV100,Caffe、TensorFlow和CNTK的速度可提升至高达3倍(与P100相比)>所有常用深度学习框架均支持GPU加速>TensorFlow运算能力高达125TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cnTESLAV100性能指南深度学习应用程序性能指南|深度学习CAFFE加州大学伯克利分校开发的一种热门GPU加速深度学习框架版本1.
0加速特性全框架加速可扩展性多GPU更多信息caffe.
berkeleyvision.
org应用程序性能指南|深度学习分子动力学(MD)代表HPC数据中心的大部分工作负载.
所有常用MD应用程序均已支持GPU加速,科学家们先前无法借助这些应用程序的传统>纯CPU版本执行的模拟,现在都可运行.
数据中心配有TeslaV100GPU后,>在运行MD应用程序时可节省高达80%的服务器和基础架构购买成本.
MD适用的TESLA平台和V100的主要特性>对于HOOMD-Blue和Amber等应用程序,配有V100的服务器可以代替54台CPU服务器的对应性能>所有常用MD应用程序均支持GPU加速>支持主要数学库,例如FFT和BLAS>每个GPU的单精度浮点运算能力高达15.
7TFLOPS/s>每个GPU的带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/molecular_dynamics_cnTESLAV100性能指南分子动力学应用程序性能指南|分子动力学HOOMD-BLUE专为GPU编写的粒子动力学程序包版本2.
1.
6加速特性CPU和GPU版本可用可扩展性多GPU和多节点更多信息http://codeblue.
umich.
edu/hoomd-blue/index.
htmlAMBER一套模拟生物分子层面上分子动力学的程序版本16.
8加速特性PMEMD显式溶剂和GB;显式和隐式溶剂、REMD、aMD可扩展性多GPU和单节点更多信息http://ambermd.
org/gpus量子化学(QC)模拟是发现新药物和材料的关键,占用HPC数据中心工作负载的大部分.
目前,60%的常用QC应用程序已支持GPU加速.
数据中心配有TeslaV100GPU后,在运行QC应用程序时可节省高达30%的服务器和基础架构购买成本.
QC适用的TESLA平台和V100的主要特性>对于VASP等应用程序,配有V100的服务器可以代替多达5台CPU服务器的对应性能>60%的常用QC应用程序均支持GPU加速>支持主要数学库,例如FFT和BLAS>每个GPU的双精度浮点运算能力高达7.
8TFLOPS/s>适用于大型数据集的显存容量高达16GB如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/computational_chemistry_cnTESLAV100性能指南量子化学应用程序性能指南|量子化学VASP用于执行量子力学分子动力学(MD)从头计算模拟的程序包版本5.
4.
4加速特性RMM-DIIS、BlockedDavidson、K-points和精确交换可扩展性多GPU和多节点更多信息www.
nvidia.
com/vasp从聚变能到高能粒子,物理学模拟涵盖了HPC数据中心的各种应用程序.
许多常用物理学应用程序均已支持GPU加速,取得了之前不可能得到的宝贵见解.
>数据中心配有TeslaV100GPU后,运行GPU加速的物理学应用程序时可节省高达75%的服务器购买成本.
物理学适用的TESLA平台和V100的主要特性>对于GTC-P、QUDA和MILC等应用程序,配有V100的服务器可以代替>多达75台CPU服务器的对应性能>大多数常用物理学应用程序均支持GPU加速>双精度浮点运算能力高达7.
8TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cn(点击下拉菜单选择"物理学")TESLAV100性能指南物理学应用程序性能指南|物理学GTC-P用于优化等离子体物理学的开发代码版本2017加速特性推动、移动和碰撞可扩展性多GPU更多信息www.
nvidia.
com/gtc-pQUDA用于格点量子色动力学的GPU库版本2017加速特性全部可扩展性多GPU和多节点更多信息www.
nvidia.
com/quda应用程序性能指南|物理学MILC格点量子色动力学(LQCD)代码,用于模拟基本粒子如何通过"强相互作用"形成和束缚以生成更大的粒子(例如质子和中子)版本2017加速特性交错费米子、克里洛夫求解和链节增大可扩展性多GPU和多节点更多信息www.
nvidia.
com/milc地质科学模拟是发现石油和天然气以及执行地质建模的关键.
目前,许多常用地质科学应用程序均已支持GPU加速.
数据中心配有TeslaV100GPU后,在运行地球科学应用程序时可节省高达70%的服务器和基础架构购买成本.
地球科学适用的TESLA平台和V100的主要特性>对于RTM和SPECFEM3D等应用程序,配有V100的服务器可以代替>多达82台CPU服务器的对应性能>常用石油和天然气应用程序均支持GPU加速>单精度浮点运算能力高达15.
7TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cn(点击下拉菜单选择"石油天然气/地震")TESLAV100性能指南地球科学应用程序性能指南|地球科学RTM逆时偏移(RTM)建模是油气勘探地震数据处理工作流程中的关键组成部分版本2017加速特性批处理算法可扩展性多GPU和多节点SPECFEM3D模拟地震波传播版本7.
0.
0可扩展性多GPU和多节点更多信息https://geodynamics.
org/cig/software/specfem3d_globe工程模拟是通过建模流程、热传递和有限元分析等开发新产品的关键环节.
目前,许多常用工程应用程序均已支持GPU加速.
数据中心配有NVIDIATeslaV100GPU后,在运行工程应用程序时可节省高达20%的服务器和基础架构购买成本,以及高达50%的软件许可成本.
工程适用的TESLA平台和V100的主要特性>对于SIMULIAAbaqus和ANSYSFLUENT等应用程序,配有TeslaV100的服务器可以代替多达4台CPU服务器的对应性能>常用工程应用程序均支持GPU加速>显存容量高达16GB>显存带宽高达900GB/s>双精度浮点运算能力高达7.
8TFLOPS/sTESLAV100性能指南工程学应用程序性能指南|工程学SIMULIAABAQUS用于分析结构的模拟工具版本2017加速特性稀疏直接求解器AMSEigen求解器稳态动力学求解器可扩展性多GPU和多节点更多信息www.
nvidia.
com/simulia-abaqusANSYSFLUENT用于流体动力学模拟的通用软件版本18加速特性基于压力的耦合求解器和辐射热传递可扩展性多GPU和多节点更多信息www.
nvidia.
com/ansys-fluent基准测试提供了系统在一定生产规模下的表现的近似情况,有助于评估不同>系统的相对性能.
常用基准测试具有GPU加速版本,可以帮助您了解在数据>中心运行GPU的好处.
基准测试适用的TESLA平台和V100的主要特性>对于Cloverleaf、MiniFE、Linpack和HPCG等基准测试,配有TeslaV100的服务器可以代替多达67台CPU服务器的对应性能>常用基准测试均支持GPU加速>双精度浮点运算能力高达7.
8TFLOPS/s,显存容量高达16GB>显存带宽高达900GB/sTESLAV100性能指南HPC基准测试应用程序性能指南|HPC基准测试CLOVERLEAF基准测试–迷你应用流体动力学版本1.
3加速特性Lagrangian-Eulerian显式流体动力学迷你应用可扩展性多节点(MPI)更多信息http://uk-mac.
github.
io/CloverLeafMINIFE基准测试–迷你应用有限元分析版本0.
3加速特性全部可扩展性多GPU更多信息https://mantevo.
org/about/applications应用程序性能指南|HPC基准测试LINPACK基准测试–测量浮点运算能力版本2.
1加速特性全部可扩展性多节点和多节点更多信息www.
top500.
org/project/linpackHPCG基准测试–练习与各种重要HPC应用程序密切相符的计算和数据访问模式版本3加速特性全部可扩展性多GPU和多节点更多信息www.
hpcg-benchmark.
org/index.
html2017NVIDIACorporation.
保留所有权利.
NVIDIA、NVIDIA徽标和Tesla均为NVIDIACorporation在美国和其他国家/地区的商标和/或注册商标.
其他公司和产品名称可能是其各关联公司的商标.
2017年11月TESLAV100产品规格适用于PCIe服务器的NVIDIATeslaV100适用于经NVLink优化服务器的NVIDIATeslaV100双精度浮点运算能力高达7TFLOPS高达7.
8TFLOPS单精度浮点运算能力高达14TFLOPS高达15.
7TFLOPS深度学习高达112TFLOPS高达125TFLOPSNVIDIANVLink互联带宽-300GB/sPCIex16互联带宽32GB/s32GB/sCoWoSHBM2堆叠式显存容量16GB16GBCoWoSHBM2堆叠式显存带宽900GB/s900GB/s相关假设和免责声明常用应用程序中支持GPU加速的百分比数据来源于i360报告《HPCSupportforGPUComputing》(HPC对GPU计算的支持报告)中50大应用程序列表.
吞吐量和成本节约的相关计算数据,为应用程序在域中以相同的计算周期进行基准测试得到的假设工作负载概要:http://www.
intersect360.
com/industry/reports.
phpid=131匹配单个GPU节点所需的CPU节点数使用GPU节点应用程序加速的实验室性能结果和多CPU节点扩展性能进行计算.
例如,分子动力学应用程序HOOMD-Blue的GPU节点应用程序加速为37.
9倍.
将CPU节点扩展到8个节点集群时,总系统输出为7.
1倍.
因此,扩展系数为8除以7.
1(即1.
13).
要计算匹配单个GPU节点性能所需的CPU节点数,应将37.
9(GPU节点应用程序加速系数)乘以1.
13(CPU节点扩展系数),也就是需要43个节点.

hostyun评测香港原生IPVPS

hostyun新上了香港cloudie机房的香港原生IP的VPS,写的是默认接入200Mbps带宽(共享),基于KVM虚拟,纯SSD RAID10,三网直连,混合超售的CN2网络,商家对VPS的I/O有大致100MB/S的限制。由于是原生香港IP,所以这个VPS还是有一定的看头的,这里给大家弄个测评,数据仅供参考!9折优惠码:hostyun,循环优惠内存CPUSSD流量带宽价格购买1G1核10G3...

打开海外主机域名商出现"Attention Required"原因和解决

最近发现一个比较怪异的事情,在访问和登录大部分国外主机商和域名商的时候都需要二次验证。常见的就是需要我们勾选判断是不是真人。以及比如在刚才要访问Namecheap检查前几天送给网友域名的账户域名是否转出的,再次登录网站的时候又需要人机验证。这里有看到"Attention Required"的提示。我们只能手工选择按钮,然后根据验证码进行选择合适的标记。这次我要选择的是船的标识,每次需要选择三个,一...

georgedatacenter:美国VPS可选洛杉矶/芝加哥/纽约/达拉斯机房,$20/年;洛杉矶独立服务器39美元/月

georgedatacenter怎么样?georgedatacenter这次其实是两个促销,一是促销一款特价洛杉矶E3-1220 V5独服,性价比其实最高;另外还促销三款特价vps,大家可以根据自己的需要入手。georgedatacenter是一家成立于2019年的美国vps商家,主营美国洛杉矶、芝加哥、达拉斯、新泽西、西雅图机房的VPS、邮件服务器和托管独立服务器业务。georgedatacen...

linpack为你推荐
美国互联网瘫痪美国掐断中国互联网怎么办,我们如何解决?是否有后招?对对塔今儿老师给推荐了一个叫对对塔的学习网站,看起来挺不错的,有用过的人吗?管不管用?哪些功能比较好啊?lunwenjiancepaperrater论文检测准确吗rawtoolsTF卡被写保护了怎么办?haokandianyingwang谁给个好看的电影网站看看。www.e12.com.cn有什么好的高中学习网?www.55125.cnwww95599cn余额查询百度指数词什么是百度指数www.585ccc.com手机ccc认证查询,求网址partnersonline电脑内一切浏览器无法打开
过期域名查询 如何注销域名备案 七牛优惠码 lamp安装 enom asp.net主机 外国服务器 美国仿牌空间 godaddy 服务器怎么绑定域名 促正网秒杀 什么是刀片服务器 免费防火墙 腾讯实名认证中心 福建铁通 申请网站 免费asp空间 腾讯网盘 windowssever2008 htaccess 更多