Hive:简单查询不启用Mapreduce

5sing打不开  时间:2021-01-26  阅读:()
job而启用Fetchtask写在前面的话,学Hive这么久了,发现目前国内还没有一本完整的介绍Hive的书籍,而且互联网上面的资料很乱,于是我决定写一些关于《Hive的那些事》序列文章,分享给大家.
我会在接下来的时间整理有关Hive的资料,如果对Hive的东西感兴趣,请关注本博客.
https://www.
iteblog.
com/archives/tag/hive-technology/如果你想查询某个表的某一列,Hive默认是会启用MapReduceJob来完成这个任务,如下:hive>SELECTid,moneyFROMmlimit10;TotalMapReducejobs=1LaunchingJob1outof1Numberofreducetasksissetto0sincethere'snoreduceoperatorCannotrunjoblocally:InputSize(=235105473)islargerthanhive.
exec.
mode.
local.
auto.
inputbytes.
max(=134217728)StartingJob=job_1384246387966_0229,TrackingURL=http://l-datalogm1.
data.
cn1:9981/proxy/application_1384246387966_0229/KillCommand=/home/q/hadoop-2.
2.
0/bin/hadoopjob-killjob_1384246387966_0229hadoopjobinformationforStage-1:numberofmappers:1;numberofreducers:02013-11-1311:35:16,167Stage-1map=0%,reduce=0%2013-11-1311:35:21,327Stage-1map=100%,reduce=0%,CumulativeCPU1.
26sec2013-11-1311:35:22,377Stage-1map=100%,reduce=0%,CumulativeCPU1.
26secMapReduceTotalcumulativeCPUtime:1seconds260msecEndedJob=job_1384246387966_0229MapReduceJobsLaunched:Job0:Map:1CumulativeCPU:1.
26secHDFSRead:8388865HDFSWrite:60SUCCESSTotalMapReduceCPUTimeSpent:1seconds260msecOK1122118512311292131613291355135613621/31364Timetaken:16.
802seconds,Fetched:10row(s)我们都知道,启用MapReduceJob是会消耗系统开销的.
对于这个问题,从Hive0.
10.
0版本开始,对于简单的不需要聚合的类似SELECTfromLIMITn语句,不需要起MapReducejob,直接通过Fetchtask获取数据,可以通过下面几种方法实现:方法一:hive>sethive.
fetch.
task.
conversion=more;hive>SELECTid,moneyFROMmlimit10;OK1122118512311292131613291355135613621364Timetaken:0.
138seconds,Fetched:10row(s)上面sethive.
fetch.
task.
conversion=more;开启了Fetch任务,所以对于上述简单的列查询不在启用MapReducejob!
方法二:bin/hive--hiveconfhive.
fetch.
task.
conversion=more方法三:上面的两种方法都可以开启了Fetch任务,但是都是临时起作用的;如果你想一直启用这个功能,可以在${HIVE_HOME}/conf/hive-site.
xml里面加入以下配置:hive.
fetch.
task.
conversionmore2/3SomeselectqueriescanbeconvertedtosingleFETCHtaskminimizinglatency.
Currentlythequeryshouldbesinglesourcednothavinganysubqueryandshouldnothaveanyaggregationsordistincts(whichincurrsRS),lateralviewsandjoins.
1.
minimal:SELECTSTAR,FILTERonpartitioncolumns,LIMITonly2.
more:SELECT,FILTER,LIMITonly(+TABLESAMPLE,virtualcolumns)这样就可以长期启用Fetch任务了,很不错吧,也赶紧去试试吧!
本博客文章除特别声明,全部都是原创!
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载.
本文链接:【】()PoweredbyTCPDF(www.
tcpdf.
org)3/

CloudCone:洛杉矶MC机房KVM月付1.99美元起,支持支付宝/PayPal

CloudCone是一家成立于2017年的国外VPS主机商,提供独立服务器租用和VPS主机,其中VPS基于KVM架构,多个不同系列,譬如常规VPS、大硬盘VPS等等,数据中心在洛杉矶MC机房。商家2021年Flash Sale活动继续,最低每月1.99美元,支持7天退款到账户,支持使用PayPal或者支付宝付款,先充值后下单的方式。下面列出几款VPS主机配置信息。CPU:1core内存:768MB...

牦牛云(3.5USD/月 )阿里云国际版云服务器 1核1G40G

收到好多消息,让我聊一下阿里云国际版本,作为一个阿里云死忠粉,之前用的服务器都是阿里云国内版的VPS主机,对于现在火热的阿里云国际版,这段时间了解了下,觉得还是有很多部分可以聊的,毕竟,实名制的服务器规则导致国际版无需实名这一特点被无限放大。以前也写过几篇综合性的阿里云国际版vps的分析,其中有一点得到很多人的认同,那句是阿里云不管国内版还是国际版的IO读写速度实在不敢恭维,相对意义上的,如果在这...

Hostiger 16G大内存特价VPS:伊斯坦布尔机房,1核50G SSD硬盘200Mbps带宽不限流量$59/年

国外主机测评昨天接到Hostigger(现Hostiger)商家邮件推送,称其又推出了一款特价大内存VPS,机房位于土耳其的亚欧交界城市伊斯坦布尔,核50G SSD硬盘200Mbps带宽不限月流量只要$59/年。 最近一次分享的促销信息还是5月底,当时商家推出的是同机房同配置的大内存VPS,价格是$59.99/年,不过内存只有10G,虽然同样是大内存,但想必这次商家给出16G,价格却是$59/年,...

5sing打不开为你推荐
法兰绒和珊瑚绒哪个好珊瑚绒和法莱绒哪种不容易掉毛小说软件哪个好用免费有什么好用的免费小说软件等额本息等额本金哪个好等额本息和等额本金哪个好?等额本息等额本金哪个好等额本金和等额本息的区别哪个好网页传奇哪个好玩有什么好玩的传奇类网页游戏?电陶炉和电磁炉哪个好电磁炉和电陶炉哪个好? 电磁炉和电陶炉的具体区别播放器哪个好播放器哪个好用云盘哪个好免费的网盘哪个好?更大、更安全、更实用?yy空间登录怎么进入YY音乐空间考生个人空间登录湖南高等教育自学考试 考生个人空间登录密码忘记了怎么办
美国虚拟主机购买 广西虚拟主机 域名服务器的作用 淘宝抢红包攻略 空间出租 速度云 万网注册 789电视剧网 小夜博客 密钥索引 海外加速 phpwind论坛 建站论坛 zencart安装 美国服务器 超低价 vim 29美元 国外bt网站 usb大容量存储设备 更多