应用程序linpack
linpack 时间:2021-03-26 阅读:(
)
TESLAV100性能指南深度学习和HPC应用程序2017年11月应用程序性能指南TESLAV100性能指南现代高性能计算(HPC)数据中心是解决全球一些重大科学和工程挑战的关键.
NVIDIATesla加速计算平台让这些现代数据中心能够使用行业领先的应用>程序加速完成HPC和AI领域的工作.
TeslaV100GPU是现代数据中心的>引擎,能够以更少的服务器提供突破性性能,从而加快探索发现的步伐,>并大幅降低成本.
改进的性能和解决方案时间对提高收益和生产力也有显著的有利影响.
每个HPC数据中心都可从Tesla平台中受益.
多个领域超过500款HPC应用程序已经过GPU优化,其中包括全部15大常用HPC应用程序以及各主要的深度学习框架.
超过500款HPC应用程序和各主要深度学习框架已支持GPU加速.
>>要获取GPU加速应用程序的最新目录,请访问:www.
nvidia.
cn/object/gpu-applications-cn>>如要获取适用于各种加速应用程序的简单指令,以实现GPU上的快速启动和运行,请访问:>www.
nvidia.
com/gpu-ready-apps使用GPU加速应用程序的研究领域包括:深度学习分子动力学量子化学物理学地球科学工程学HPC基准测试深度学习正在解决几年前还看似遥不可及的科学、企业级的和消费者层面的>重要问题.
各主要深度学习框架均支持NVIDIAGPU优化,从而使数据科学家和研究人员可以在工作中利用人工智能.
数据中心配有TeslaV100GPU后,在运行深度学习训练和推理框架时可节省高达85%的服务器和基础架构购置>成本.
深度学习训练适用的TESLA平台和V100的主要特性>借助TeslaV100,Caffe、TensorFlow和CNTK的速度可提升至高达3倍(与P100相比)>所有常用深度学习框架均支持GPU加速>TensorFlow运算能力高达125TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cnTESLAV100性能指南深度学习应用程序性能指南|深度学习CAFFE加州大学伯克利分校开发的一种热门GPU加速深度学习框架版本1.
0加速特性全框架加速可扩展性多GPU更多信息caffe.
berkeleyvision.
org应用程序性能指南|深度学习分子动力学(MD)代表HPC数据中心的大部分工作负载.
所有常用MD应用程序均已支持GPU加速,科学家们先前无法借助这些应用程序的传统>纯CPU版本执行的模拟,现在都可运行.
数据中心配有TeslaV100GPU后,>在运行MD应用程序时可节省高达80%的服务器和基础架构购买成本.
MD适用的TESLA平台和V100的主要特性>对于HOOMD-Blue和Amber等应用程序,配有V100的服务器可以代替54台CPU服务器的对应性能>所有常用MD应用程序均支持GPU加速>支持主要数学库,例如FFT和BLAS>每个GPU的单精度浮点运算能力高达15.
7TFLOPS/s>每个GPU的带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/molecular_dynamics_cnTESLAV100性能指南分子动力学应用程序性能指南|分子动力学HOOMD-BLUE专为GPU编写的粒子动力学程序包版本2.
1.
6加速特性CPU和GPU版本可用可扩展性多GPU和多节点更多信息http://codeblue.
umich.
edu/hoomd-blue/index.
htmlAMBER一套模拟生物分子层面上分子动力学的程序版本16.
8加速特性PMEMD显式溶剂和GB;显式和隐式溶剂、REMD、aMD可扩展性多GPU和单节点更多信息http://ambermd.
org/gpus量子化学(QC)模拟是发现新药物和材料的关键,占用HPC数据中心工作负载的大部分.
目前,60%的常用QC应用程序已支持GPU加速.
数据中心配有TeslaV100GPU后,在运行QC应用程序时可节省高达30%的服务器和基础架构购买成本.
QC适用的TESLA平台和V100的主要特性>对于VASP等应用程序,配有V100的服务器可以代替多达5台CPU服务器的对应性能>60%的常用QC应用程序均支持GPU加速>支持主要数学库,例如FFT和BLAS>每个GPU的双精度浮点运算能力高达7.
8TFLOPS/s>适用于大型数据集的显存容量高达16GB如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/computational_chemistry_cnTESLAV100性能指南量子化学应用程序性能指南|量子化学VASP用于执行量子力学分子动力学(MD)从头计算模拟的程序包版本5.
4.
4加速特性RMM-DIIS、BlockedDavidson、K-points和精确交换可扩展性多GPU和多节点更多信息www.
nvidia.
com/vasp从聚变能到高能粒子,物理学模拟涵盖了HPC数据中心的各种应用程序.
许多常用物理学应用程序均已支持GPU加速,取得了之前不可能得到的宝贵见解.
>数据中心配有TeslaV100GPU后,运行GPU加速的物理学应用程序时可节省高达75%的服务器购买成本.
物理学适用的TESLA平台和V100的主要特性>对于GTC-P、QUDA和MILC等应用程序,配有V100的服务器可以代替>多达75台CPU服务器的对应性能>大多数常用物理学应用程序均支持GPU加速>双精度浮点运算能力高达7.
8TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cn(点击下拉菜单选择"物理学")TESLAV100性能指南物理学应用程序性能指南|物理学GTC-P用于优化等离子体物理学的开发代码版本2017加速特性推动、移动和碰撞可扩展性多GPU更多信息www.
nvidia.
com/gtc-pQUDA用于格点量子色动力学的GPU库版本2017加速特性全部可扩展性多GPU和多节点更多信息www.
nvidia.
com/quda应用程序性能指南|物理学MILC格点量子色动力学(LQCD)代码,用于模拟基本粒子如何通过"强相互作用"形成和束缚以生成更大的粒子(例如质子和中子)版本2017加速特性交错费米子、克里洛夫求解和链节增大可扩展性多GPU和多节点更多信息www.
nvidia.
com/milc地质科学模拟是发现石油和天然气以及执行地质建模的关键.
目前,许多常用地质科学应用程序均已支持GPU加速.
数据中心配有TeslaV100GPU后,在运行地球科学应用程序时可节省高达70%的服务器和基础架构购买成本.
地球科学适用的TESLA平台和V100的主要特性>对于RTM和SPECFEM3D等应用程序,配有V100的服务器可以代替>多达82台CPU服务器的对应性能>常用石油和天然气应用程序均支持GPU加速>单精度浮点运算能力高达15.
7TFLOPS/s>显存容量高达16GB,显存带宽高达900GB/s如要查看所有相关应用程序,请访问:www.
nvidia.
cn/object/gpu-applications-cn(点击下拉菜单选择"石油天然气/地震")TESLAV100性能指南地球科学应用程序性能指南|地球科学RTM逆时偏移(RTM)建模是油气勘探地震数据处理工作流程中的关键组成部分版本2017加速特性批处理算法可扩展性多GPU和多节点SPECFEM3D模拟地震波传播版本7.
0.
0可扩展性多GPU和多节点更多信息https://geodynamics.
org/cig/software/specfem3d_globe工程模拟是通过建模流程、热传递和有限元分析等开发新产品的关键环节.
目前,许多常用工程应用程序均已支持GPU加速.
数据中心配有NVIDIATeslaV100GPU后,在运行工程应用程序时可节省高达20%的服务器和基础架构购买成本,以及高达50%的软件许可成本.
工程适用的TESLA平台和V100的主要特性>对于SIMULIAAbaqus和ANSYSFLUENT等应用程序,配有TeslaV100的服务器可以代替多达4台CPU服务器的对应性能>常用工程应用程序均支持GPU加速>显存容量高达16GB>显存带宽高达900GB/s>双精度浮点运算能力高达7.
8TFLOPS/sTESLAV100性能指南工程学应用程序性能指南|工程学SIMULIAABAQUS用于分析结构的模拟工具版本2017加速特性稀疏直接求解器AMSEigen求解器稳态动力学求解器可扩展性多GPU和多节点更多信息www.
nvidia.
com/simulia-abaqusANSYSFLUENT用于流体动力学模拟的通用软件版本18加速特性基于压力的耦合求解器和辐射热传递可扩展性多GPU和多节点更多信息www.
nvidia.
com/ansys-fluent基准测试提供了系统在一定生产规模下的表现的近似情况,有助于评估不同>系统的相对性能.
常用基准测试具有GPU加速版本,可以帮助您了解在数据>中心运行GPU的好处.
基准测试适用的TESLA平台和V100的主要特性>对于Cloverleaf、MiniFE、Linpack和HPCG等基准测试,配有TeslaV100的服务器可以代替多达67台CPU服务器的对应性能>常用基准测试均支持GPU加速>双精度浮点运算能力高达7.
8TFLOPS/s,显存容量高达16GB>显存带宽高达900GB/sTESLAV100性能指南HPC基准测试应用程序性能指南|HPC基准测试CLOVERLEAF基准测试–迷你应用流体动力学版本1.
3加速特性Lagrangian-Eulerian显式流体动力学迷你应用可扩展性多节点(MPI)更多信息http://uk-mac.
github.
io/CloverLeafMINIFE基准测试–迷你应用有限元分析版本0.
3加速特性全部可扩展性多GPU更多信息https://mantevo.
org/about/applications应用程序性能指南|HPC基准测试LINPACK基准测试–测量浮点运算能力版本2.
1加速特性全部可扩展性多节点和多节点更多信息www.
top500.
org/project/linpackHPCG基准测试–练习与各种重要HPC应用程序密切相符的计算和数据访问模式版本3加速特性全部可扩展性多GPU和多节点更多信息www.
hpcg-benchmark.
org/index.
html2017NVIDIACorporation.
保留所有权利.
NVIDIA、NVIDIA徽标和Tesla均为NVIDIACorporation在美国和其他国家/地区的商标和/或注册商标.
其他公司和产品名称可能是其各关联公司的商标.
2017年11月TESLAV100产品规格适用于PCIe服务器的NVIDIATeslaV100适用于经NVLink优化服务器的NVIDIATeslaV100双精度浮点运算能力高达7TFLOPS高达7.
8TFLOPS单精度浮点运算能力高达14TFLOPS高达15.
7TFLOPS深度学习高达112TFLOPS高达125TFLOPSNVIDIANVLink互联带宽-300GB/sPCIex16互联带宽32GB/s32GB/sCoWoSHBM2堆叠式显存容量16GB16GBCoWoSHBM2堆叠式显存带宽900GB/s900GB/s相关假设和免责声明常用应用程序中支持GPU加速的百分比数据来源于i360报告《HPCSupportforGPUComputing》(HPC对GPU计算的支持报告)中50大应用程序列表.
吞吐量和成本节约的相关计算数据,为应用程序在域中以相同的计算周期进行基准测试得到的假设工作负载概要:http://www.
intersect360.
com/industry/reports.
phpid=131匹配单个GPU节点所需的CPU节点数使用GPU节点应用程序加速的实验室性能结果和多CPU节点扩展性能进行计算.
例如,分子动力学应用程序HOOMD-Blue的GPU节点应用程序加速为37.
9倍.
将CPU节点扩展到8个节点集群时,总系统输出为7.
1倍.
因此,扩展系数为8除以7.
1(即1.
13).
要计算匹配单个GPU节点性能所需的CPU节点数,应将37.
9(GPU节点应用程序加速系数)乘以1.
13(CPU节点扩展系数),也就是需要43个节点.
hostwinds怎么样?2021年7月最新 hostwinds 优惠码整理,Hostwinds 优惠套餐整理,Hostwinds 西雅图机房直连线路 VPS 推荐,目前最低仅需 $4.99 月付,并且可以免费更换 IP 地址。本文分享整理一下最新的 Hostwinds 优惠套餐,包括托管型 VPS、无托管型 VPS、Linux VPS、Windows VPS 等多种套餐。目前 Hostwinds...
关于Linode,这是一家运营超过18年的VPS云主机商家,产品支持随时删除(按小时计费),可选包括美国、英国、新加坡、日本、印度、加拿大、德国等全球十多个数据中心,最低每月费用5美元($0.0075/小时)起。目前,注册Linode的新用户添加付款方式后可以获得100美元赠送,有效期为60天,让更多新朋友可以体验Linode的产品和服务。Linode的云主机产品分为几类,下面分别列出几款套餐配置...
IT狗为用户提供 在线ping、在线tcping、在线路由追踪、域名被墙检测、域名被污染检测 等实用工具。【工具地址】https://www.itdog.cn/【工具特色】1、目前同类网站中,在线ping 仅支持1次或少量次数的测试,无法客观的展现目标服务器一段时间的网络状况,IT狗Ping工具可持续的进行一段时间的ping测试,并生成更为直观的网络质量柱状图,让用户更容易掌握服务器在各地区、各线...
linpack为你推荐
brandoff国际大牌包包都有哪些呐?急救知识纳入考试应急救护知识应该由哪个部门培训12306崩溃12306网站显示异常,什么原因啊同ip网站查询服务器禁PING 是不是就可以解决同IP网站查询问题刘祚天DJ是什么职业?rawtools佳能单反照相机的RAW、5.0M 是什么意思?月神谭求男变女类的变身小说巫正刚阿迪三叶草彩虹板鞋的鞋带怎么穿?详细点,最后有图解。高分求se9999se.comexol.smtown.comdadi.tvApple TV是干嘛的?怎么用?多少钱?
万网虚拟主机 郑州服务器租用 3322动态域名 cybermonday sugarsync 优key NetSpeeder 申请空间 骨干网络 圣诞促销 日本bb瘦 免费测手机号 t云 国外ip加速器 无限流量 空间租赁 带宽租赁 东莞主机托管 htaccess restart 更多