hivehive的适用场景

hive  时间:2021-08-10  阅读:()

Hive是什么?

此外,hive也支持熟悉map-reduce的开发者使用map-reduce程序对数据做更加复杂的分析。

hive可以很好的结合thrift和控制分隔符,也支持用户自定义分隔符。

hive基于hadoop,hadoop是批处理系统,不能保存低延迟,因此,hive的查询也不能保证低延迟。

hive的工作模式是:提交一个任务,等到任务结束时被通知,而不是实时查询。

相对应的是,类似于Oracle这样的系统当运行于小数据集的时候,响应非常快,可当处理的数据集非常大的时候,可能需要数小时。

需要说明的是,hive即使在很小的数据集上运行,也可能需要数分钟才能完成。

低延迟不是hive追求的首要目标。

Hadoop,Hive,Spark 之间是什么关系

hadoop包含以下组件:hdfs,mapreduce,yarn。

hive是数据仓库:用于管理结构化数据,数据存于hdfs上。

spark是一个分布式计算框架:区别于hadoop的另一种mapreduce的计算框架。

基于RDD的分布式内存计算引擎。

hive的适用场景

Hive 构建在基于静态批处理的Hadoop 之上,Hadoop 通常都有较高的延迟并且在作业提交和调度的时候需要大量的开销。

因此,Hive 并不能够在大规模数据集上实现低延迟快速的查询,例如,Hive 在几百MB 的数据集上执行查询一般有分钟级的时间延迟。

因此, Hive 并不适合那些需要低延迟的应用,例如,联机事务处理(OLTP)。

Hive 查询操作过程严格遵守Hadoop MapReduce 的作业执行模型,Hive 将用户的HiveQL 语句通过解释器转换为MapReduce 作业提交到Hadoop 集群上,Hadoop 监控作业执行过程,然后返回作业执行结果给用户。

Hive 并非为联机事务处理而设计,Hive 并不提供实时的查询和基于行级的数据更新操作。

Hive 的最佳使用场合是大数据集的批处理作业,例如,网络日志分析。

Friendhosting四五折促销,VPS半年付7.5欧元起

Friendhosting发布了针对“系统管理日”(每年7月的最后一个星期五)的优惠活动,针对VPS主机提供55%的优惠(相当于四五折),支持1-6个月付款使用,首付折扣非永久,优惠后最低套餐首半年7.18欧元起。这是一家保加利亚主机商,成立于2009年4月,商家提供VDS和独立服务器租用等,数据中心目前可选美国洛杉矶、保加利亚、乌克兰、荷兰、拉脱维亚、捷克和波兰等8个地区机房。下面以最低套餐为例...

华为云(69元)828促销活动 2G1M云服务器

华为云818上云活动活动截止到8月31日。1、秒杀限时区优惠仅限一单!云服务器秒杀价低至0.59折,每日9点开抢秒杀抢购活动仅限早上9点开始,有限量库存的。2G1M云服务器低至首年69元。2、新用户折扣区优惠仅限一单!购云服务器享3折起加购主机安全及数据库。企业和个人的优惠力度和方案是不同的。比如还有.CN域名首年8元。华为云服务器CPU资源正常没有扣量。3、抽奖活动在8.4-8.31日期间注册并...

台湾CN2云服务器 2核2G 5M 5IP 台湾物理服务器 E5x2 64G 20M 5IP

提速啦(www.tisula.com)是赣州王成璟网络科技有限公司旗下云服务器品牌,目前拥有在籍员工40人左右,社保在籍员工30人+,是正规的国内拥有IDC ICP ISP CDN 云牌照资质商家,2018-2021年连续4年获得CTG机房顶级金牌代理商荣誉 2021年赣州市于都县创业大赛三等奖,2020年于都电子商务示范企业,2021年于都县电子商务融合推广大使。资源优势介绍:Ceranetwo...

hive为你推荐
sap是什么SAP是用来做什么的?app退款app退款怎样才算恶意退款?scanf返回值scanf的返回值163登陆163邮箱登陆电脑版linux安装教程linux怎么安装啊实数的定义数学中的“实数”是什么?系统登录界面谁知道XP系统的登录界面。和启动界面怎么更改的 急比特币官方客户端比特币钱包官方客户端地址是什么?3d规则福彩3d有几种玩法 详细介绍一下3d规则福利彩票3D的中奖规则
域名备案查询 免费com域名申请 新加坡主机 westhost 老鹰主机 googleapps 丹弗 qq数据库下载 移动服务器托管 web服务器是什么 789 监控服务器 免费网络 广东主机托管 97rb 免备案jsp空间 酷锐 塔式服务器 alexa世界排名 电信测速器在线测网速 更多