批量计算产品简介产品简介产品概述什么是批量计算批量计算(BatchCompute)是一种适用于大规模并行批处理作业的分布式云服务.
BatchCompute可支持海量作业并发规模,系统自动完成资源管理、作业调度和数据加载,并按实际使用量计费.
通俗的讲,就是您可以提交一个任意的计算机程序,让它在阿里云的多个VM实例上同时运行,然后把结果写入到指定的持久化存储位置(如阿里云对象存储OSS或者文件存储NAS),然后您可以去指定的位置查看结果.
产品架构BatchCompute整体架构,包括:批量计算产品简介1qq-qqBatchCompute入口批量计算服务提供基于RESTful风格的API.
在API之上,用户可以通过SDK,命令行工具,控制台等方式使用批量计算.
您可以使用这些工具向BatchCompute提交作业,查询作业运行状态,并管理作业生命周期(比如停止已提交的作业,释放已完成的作业等).
运行环境BatchCompute允许用户通过自定义虚拟机镜像或者Docker的方式对运行环境进行高度定制,可以支持Windows和Linux操作系统.
用户程序运行在隔离的虚拟化环境中,确保用户环境和用户数据的安全性.
持久化存储BatchCompute可以使用对象存储OSS或者文件存储NAS作为输入输出数据的持久化存储.
用户的程序、自定义Docker镜像、作业的运行日志存储在OSS中.
功能特性1.
提交作业批量计算产品简介2用户使用工具(如SDK,命令行工具等)向BatchCompute提交作业,BatchCompute使用用户指定的镜像(如:ubuntu)启动虚拟机(VM),在虚拟机中运行用户程序,运行完成后释放虚拟机(VM).
BatchCompute中使用OSS作为持久化存储.
您可以在程序运行完成时将结果数据保存到OSS中.
在批量计算中,也可以通过文件接口的方式访问OSS上的数据,请参阅OSS挂载功能.
BatchCompute程序默认运行在VM中,也支持Docker容器.
也就是说,您可以自定义ECS镜像或者使用Docker,在镜像中安装自己需要的任何软件,用来运行您的任何程序.
作业描述用户需要提交一个作业(Job)描述JSON文件到批量计算服务,该JSON文件中详细描述了需要执行哪些程序(支持多个程序),运行哪些程序需要启动多少台机器,机器的规格(内存和CPU等),运行日志打印到哪里,完成后结果输出到哪里等.
一个作业(Job)包含多个任务(Task),按照您指定DAG描述的顺序执行.
每个任务定义了使用哪个镜像,使用什么实例规格,运行哪个程序,需要多少台机器运行,还有结果存储在哪里等.
批量计算产品简介32.
管理我的作业您可以使用工具(控制台,命令行工具等),查看我提交的作业,可以停止,重启,或删除作业.
查看各个任务的情况,各个实例(VM实例)的情况和日志.
下图是控制台的作业管理界面:3.
使用集群由于每次运行程序前需要启动虚拟机,会占用一定的时间(一般几分钟左右),遇到忙时有可能申请不到资源(虚拟机被其他客户使用了),您提交作业后可能需要等待一段时间才能运行.
如果您想要提高运行效率,可以先创建好集群,指定需要的虚拟机数量(比如:5台)和镜像ID,BatchCompute会为您分配好机器并启动,这些机器会一直处于运行状态,一旦您提交作业上来,就可以批量计算产品简介4直接运行,效率较高.
4.
自定义镜像您提交作业或者创建集群时,可以使用批量计算官方提供的镜像,也可以使用自定义镜像.
自定义镜像的好处是,可以自己安装需要的软件.
详情可以看这里名词解释作业用户的每个特定的计算需求在BatchCompute中被描述为一个作业(Job).
在BatchCompute系统中,用户可以通过命令行工具、管理控制台或SDK提交、管理和查询作业.
任务一个作业由一组任务(Task)及其依赖关系组成.
批量计算支持能以有向无环图DAG(directedacyclicgraph)形式描述的作业.
任务间的依赖关系只能在作业提交时指定,提交完成后不能修改.
实例每个任务可以有一个或多个执行实例(Instance).
同一任务的各个实例并行处理各自的输入数据.
实例是BatchCompute调度与执行的最小单元,这些实例会动态的运行在系统分配的虚拟服务器节点上.
集群一系列的VM实例组在BatchCompute中被定义为一个集群(Cluster).
一个集群可以由多个实例组(Group)组成,一个组中的实例共享同样的实例类型定义(如指定的CPU核数和内存大小组合),多个组之间共享镜像(Image).
有关集群的使用方式请参考使用集群.
镜像镜像(Image)是集群资源创建或者作业运行环境的模板.
它是一个标准的或者自定义的ECS镜像,需要安装BatchComputeAgent,然后授权给BatchCompute服务使用.
关于镜像的具体使用方法请参考使用镜像以及自定义镜像.
批量计算产品简介5qqqqqqqqqDocker镜像使用官方提供的ubuntu镜像(内置Docker容器支持),可以支持自定义Docker镜像.
自定义Docker镜像像普通镜像一样,可以自己安装运行作业的各种程序.
具体方法请看这里:使用Docker.
产品优势产品优势海量并发支持十万核级别并发规模.
自动高效完成数据分发和计算调度.
弹性伸缩根据作业需求动态分配计算资源.
支持任务依赖关系(DAG),轻松组建工作流.
I/O优化独有数据分布式缓存技术,极大加速大规模共享数据分发.
直接挂载对象存储,透明处理I/O访问异常.
易用安全无需特殊编程实现已有流程上云.
支持OpenAPI,易于集成.
通过VPC网络隔离以及存储访问授权实现严格安全控制.
按量付费:按照计算资源实际使用量付费.
应用场景BatchCompute广泛应用于电影动画渲染、生物数据分析、多媒体转码、金融保险分析等领域.
快云科技怎么样?快云科技是一家成立于2020年的新起国内主机商,资质齐全 持有IDC ICP ISP等正规商家。我们秉承着服务于客户服务于大众的理念运营,机器线路优价格低。目前已注册用户达到5000+!主营产品有:香港弹性云服务器,美国vps和日本vps,香港物理机,国内高防物理机以及美国日本高防物理机!产品特色:全配置均20M带宽,架构采用KVM虚拟化技术,全盘SSD硬盘,RAID10阵列, 国...
美国高防服务器提速啦专业提供美国高防服务器,美国高防服务器租用,美国抗攻击服务器,高防御美国服务器租用等。我们的海外高防服务器带给您坚不可摧的DDoS防护,保障您的业务不受攻击影响。HostEase美国高防服务器位于加州和洛杉矶数据中心,均为国内访问速度最快最稳定的美国抗攻击机房,带给您快速的访问体验。我们的高防服务器配有最高层级的DDoS防护系统,每款抗攻击服务器均拥有免费DDoS防护额度,让您...
修罗云怎么样?修罗云是一家国内老牌商家,修罗云商家以销售NAT机器起家,国内的中转机相当不错,给的带宽都非常高,此前推荐的也都是国内NAT VPS机器。今天,云服务器网(www.yuntue.com)小编主要介绍一下修罗云的香港云服务器,适合建站,香港沙田cn2云服务器,2核2G,5M带宽仅70元/月起,同时香港香港大带宽NAT VPS低至50元/月起,性价比不错,可以尝试一下!点击进入:修罗云官...