Hive:简单查询不启用Mapreduce
5sing打不开 时间:2021-01-26 阅读:(
)
job而启用Fetchtask写在前面的话,学Hive这么久了,发现目前国内还没有一本完整的介绍Hive的书籍,而且互联网上面的资料很乱,于是我决定写一些关于《Hive的那些事》序列文章,分享给大家.
我会在接下来的时间整理有关Hive的资料,如果对Hive的东西感兴趣,请关注本博客.
https://www.
iteblog.
com/archives/tag/hive-technology/如果你想查询某个表的某一列,Hive默认是会启用MapReduceJob来完成这个任务,如下:hive>SELECTid,moneyFROMmlimit10;TotalMapReducejobs=1LaunchingJob1outof1Numberofreducetasksissetto0sincethere'snoreduceoperatorCannotrunjoblocally:InputSize(=235105473)islargerthanhive.
exec.
mode.
local.
auto.
inputbytes.
max(=134217728)StartingJob=job_1384246387966_0229,TrackingURL=http://l-datalogm1.
data.
cn1:9981/proxy/application_1384246387966_0229/KillCommand=/home/q/hadoop-2.
2.
0/bin/hadoopjob-killjob_1384246387966_0229hadoopjobinformationforStage-1:numberofmappers:1;numberofreducers:02013-11-1311:35:16,167Stage-1map=0%,reduce=0%2013-11-1311:35:21,327Stage-1map=100%,reduce=0%,CumulativeCPU1.
26sec2013-11-1311:35:22,377Stage-1map=100%,reduce=0%,CumulativeCPU1.
26secMapReduceTotalcumulativeCPUtime:1seconds260msecEndedJob=job_1384246387966_0229MapReduceJobsLaunched:Job0:Map:1CumulativeCPU:1.
26secHDFSRead:8388865HDFSWrite:60SUCCESSTotalMapReduceCPUTimeSpent:1seconds260msecOK1122118512311292131613291355135613621/31364Timetaken:16.
802seconds,Fetched:10row(s)我们都知道,启用MapReduceJob是会消耗系统开销的.
对于这个问题,从Hive0.
10.
0版本开始,对于简单的不需要聚合的类似SELECTfromLIMITn语句,不需要起MapReducejob,直接通过Fetchtask获取数据,可以通过下面几种方法实现:方法一:hive>sethive.
fetch.
task.
conversion=more;hive>SELECTid,moneyFROMmlimit10;OK1122118512311292131613291355135613621364Timetaken:0.
138seconds,Fetched:10row(s)上面sethive.
fetch.
task.
conversion=more;开启了Fetch任务,所以对于上述简单的列查询不在启用MapReducejob!
方法二:bin/hive--hiveconfhive.
fetch.
task.
conversion=more方法三:上面的两种方法都可以开启了Fetch任务,但是都是临时起作用的;如果你想一直启用这个功能,可以在${HIVE_HOME}/conf/hive-site.
xml里面加入以下配置:hive.
fetch.
task.
conversionmore2/3SomeselectqueriescanbeconvertedtosingleFETCHtaskminimizinglatency.
Currentlythequeryshouldbesinglesourcednothavinganysubqueryandshouldnothaveanyaggregationsordistincts(whichincurrsRS),lateralviewsandjoins.
1.
minimal:SELECTSTAR,FILTERonpartitioncolumns,LIMITonly2.
more:SELECT,FILTER,LIMITonly(+TABLESAMPLE,virtualcolumns)这样就可以长期启用Fetch任务了,很不错吧,也赶紧去试试吧!
本博客文章除特别声明,全部都是原创!
原创文章版权归过往记忆大数据(过往记忆)所有,未经许可不得转载.
本文链接:【】()PoweredbyTCPDF(www.
tcpdf.
org)3/
2021年各大云服务商竞争尤为激烈,因为云服务商家的竞争我们可以选择更加便宜的VPS或云服务器,这样成本更低,选择空间更大。但是,如果我们是建站用途或者是稳定项目的,不要太过于追求便宜VPS或便宜云服务器,更需要追求稳定和服务。不同的商家有不同的特点,而且任何商家和线路不可能一直稳定,我们需要做的就是定期观察和数据定期备份。下面,请跟云服务器网(yuntue.com)小编来看一下2021年国内/国...
digital-vm怎么样?digital-vm在今年1月份就新增了日本、新加坡独立服务器业务,但是不知为何,期间终止了销售日本服务器和新加坡服务器,今天无意中在webhostingtalk论坛看到Digital-VM在发日本和新加坡独立服务器销售信息。服务器硬件是 Supermicro、采用最新一代 Intel CPU、DDR4 RAM 和 Enterprise Samsung SSD内存,默认...
说明一下:gcorelabs的俄罗斯远东机房“伯力”既有“Virtual servers”也有“CLOUD SERVICES”,前者是VPS,后者是云服务器,不是一回事;由于平日大家习惯把VPS和云服务器当做一回事儿,所以这里要特别说明一下。本次测评的是gcorelabs的cloud,也就是云服务器。 官方网站:https://gcorelabs.com 支持:数字加密货币、信用卡、PayPal...
5sing打不开为你推荐
天玑1000plus和骁龙865哪个好天玑1000plus相当于骁龙多少视频制作软件哪个好什么视频编辑软件比较适合小白的聚酯纤维和棉哪个好纯棉和聚酯纤维的最佳比例手机浏览器哪个好手机什么浏览器最好用?无纺布和熔喷布口罩哪个好表层水刺布,中间层pp无纺布+熔喷布,里层pp无纺布口罩好吗?牡丹江教育云空间登录牡丹江教育云平台学生注册错了怎么办?qq空间登录电脑怎么用电脑登陆手机版QQ空间qq空间登录界面强行进入别人qq空间willyunlee生化女战士主要讲的什么dns服务器设置DNS服务器怎么设置??
花生壳域名 免费com域名申请 备案域名出售 webhostingpad php主机 gitcafe 512m 网通代理服务器 共享主机 河南移动网 如何安装服务器系统 www789 服务器防火墙 域名和主机 godaddyssl phpinfo 机柜尺寸 饭桶 性能测试工具 域名商城 更多