hivehive的适用场景

hive  时间:2021-08-10  阅读:()

Hive是什么?

此外,hive也支持熟悉map-reduce的开发者使用map-reduce程序对数据做更加复杂的分析。

hive可以很好的结合thrift和控制分隔符,也支持用户自定义分隔符。

hive基于hadoop,hadoop是批处理系统,不能保存低延迟,因此,hive的查询也不能保证低延迟。

hive的工作模式是:提交一个任务,等到任务结束时被通知,而不是实时查询。

相对应的是,类似于Oracle这样的系统当运行于小数据集的时候,响应非常快,可当处理的数据集非常大的时候,可能需要数小时。

需要说明的是,hive即使在很小的数据集上运行,也可能需要数分钟才能完成。

低延迟不是hive追求的首要目标。

Hadoop,Hive,Spark 之间是什么关系

hadoop包含以下组件:hdfs,mapreduce,yarn。

hive是数据仓库:用于管理结构化数据,数据存于hdfs上。

spark是一个分布式计算框架:区别于hadoop的另一种mapreduce的计算框架。

基于RDD的分布式内存计算引擎。

hive的适用场景

Hive 构建在基于静态批处理的Hadoop 之上,Hadoop 通常都有较高的延迟并且在作业提交和调度的时候需要大量的开销。

因此,Hive 并不能够在大规模数据集上实现低延迟快速的查询,例如,Hive 在几百MB 的数据集上执行查询一般有分钟级的时间延迟。

因此, Hive 并不适合那些需要低延迟的应用,例如,联机事务处理(OLTP)。

Hive 查询操作过程严格遵守Hadoop MapReduce 的作业执行模型,Hive 将用户的HiveQL 语句通过解释器转换为MapReduce 作业提交到Hadoop 集群上,Hadoop 监控作业执行过程,然后返回作业执行结果给用户。

Hive 并非为联机事务处理而设计,Hive 并不提供实时的查询和基于行级的数据更新操作。

Hive 的最佳使用场合是大数据集的批处理作业,例如,网络日志分析。

妮妮云(100元/月)阿里云香港BGP专线 2核 4G

妮妮云的来历妮妮云是 789 陈总 张总 三方共同投资建立的网站 本着“良心 便宜 稳定”的初衷 为小白用户避免被坑妮妮云的市场定位妮妮云主要代理市场稳定速度的云服务器产品,避免新手购买云服务器的时候众多商家不知道如何选择,妮妮云就帮你选择好了产品,无需承担购买风险,不用担心出现被跑路 被诈骗的情况。妮妮云的售后保证妮妮云退款 通过于合作商的友好协商,云服务器提供2天内全额退款,超过2天不退款 物...

快云科技,美国VPS 2H5G独享20M 仅售19.8/月  年付仅需148

快云科技已稳步运行进两年了 期间没出现过线路不稳 客户不满意等一系列问题 本司资质齐全 持有IDC ICP ISP等正规手续 有独特的网站设计理念 在前几天刚是参加过魔方系统举行的设计大赛拿获最佳设计奖第一名 本公司主营产品 香港弹性云服务器,美国vps和日本vps,香港物理机,国内高防物理机以及美国日本高防物理机 2020年的国庆推出过一款香港的回馈用户特惠机 已作为传家宝 稳定运行 马上又到了...

半月湾($59.99/年),升级带宽至200M起步 三网CN2 GIA线路

在前面的文章中就有介绍到半月湾Half Moon Bay Cloud服务商有提供洛杉矶DC5数据中心云服务器,这个堪比我们可能熟悉的某服务商,如果我们有用过的话会发现这个服务商的价格比较贵,而且一直缺货。这里,于是半月湾服务商看到机会来了,于是有新增同机房的CN2 GIA优化线路。在之前的文章中介绍到Half Moon Bay Cloud DC5机房且进行过测评。这次的变化是从原来基础的年付49....

hive为你推荐
通达oa精灵通达oa精灵系统密码忘了怎么找回微信红包图片怎么发微信要红包图片微信红包图片怎么在微信上发发红包才能看的照片战棋类推荐几个好玩的战棋类的游戏wizardryHogwarts for pikeys是什么意思???系统登录界面怎么样将系统登陆界面设置为可以切换到窗口登陆?讯飞tts有用过科大讯飞TTS语音合成系统的吗充值卡充值买完充值卡了,怎么充值邮件服务器软件给我推荐个邮件服务器软件?内详没有nvidia控制面板电脑没有nvidia显卡控制面板是怎么回事
双线vps 日本软银 联通c套餐 justhost 韩国空间 国外服务器网站 42u机柜尺寸 租空间 anylink 数字域名 中国电信测网速 129邮箱 t云 in域名 视频服务器是什么 阿里云官方网站 阿里云免费邮箱 石家庄服务器托管 工信部网站备案查询 浙江服务器 更多