修改16种常见的Hadoop错误整理(大讲台内部资料)

内部错误  时间:2021-04-07  阅读:()

16个hadoop常见问题及处理方法

这个是刚发的大讲台教学资料特地分享给hadoop爱好者们。mysql版本必须是MYSQL51。

查询办法mysqladmin version

在建立hive数据库的时候最好是:create database hive;oozie的数据库同样 create database oozie;

1 hadoop采集的字符集问题

修改/etc/sysconfig/i18n更改字符集为en_US UTF-8

重启机器生效。

重启机器的指令为在root下敲入如下指令 sync;sync;init 6

2修改mapreduce

在gateway/性能下修改MapReduce子Java基础选项、 Map任务Java选项库、 Reduce任务Java选项库全部配置成-X m x4294967296

在TASKTRACKER/性能下修改:MapReduce子Java基础选项、 Map任务Java选项库、 Reduce任务Java选项库全部配置成-X m x4294967296

3必须关注各个任务的详细情况

当出现如下的错误的时候请及时的将下载的进程数调小。vi /home/boco/oozie_wy/config/lte/mro/ftp/807101 xml将max_thread由原来的6个调整为3个,或者协调厂家加大FTP的最大线程数。stderr logs orgapachecommons netftp FTPConnectionClosedException: FTP response 421 received Server closed connectionat orgapachecommons netftp FTP__getReply(FTPjava:363)at orgapachecommons netftp FTP__getReply(FTPjava:290)

at orgapachecommons netftp FTPconnectAction(FTPjava:396)at orgapachecommons netftp FTPCl ientconnectAction(FTPCl ientjava:796)at orgapachecommons netSocketCl ientconnect(SocketCl ientjava:172)at orgapachecommons netSocketCl ientconnect(SocketCl ientjava:192)at orgapachecommons netSocketCl ientconnect(SocketCl ientjava:285)at com bocowangyou uti ls FtpconnectServer(Ftpjava:550)at combocowangyoultemroftptools FindFi leThreadrun(FindFi leThreadjava:67)

登录ft p服务器【10140177149】失败 FT P服务器无法打开orgapachecommons netftp FTPConnectionClosedException: FTP response 421 received Server closed connectionat orgapachecommons netftp FTP__getReply(FTPjava:363)at orgapachecommons netftp FTP__getReply(FTPjava:290)at orgapachecommons netftp FTPconnectAction(FTPjava:396)at orgapachecommons netftp FTPCl ientconnectAction(FTPCl ientjava:796)at orgapachecommons netSocketCl ientconnect(SocketCl ientjava:172)at orgapachecommons netSocketCl ientconnect(SocketCl ientjava:192)at orgapachecommons netSocketCl ientconnect(SocketCl ientjava:285)at com bocowangyou uti ls FtpconnectServer(Ftpjava:550)at combocowangyoultemroftptools FindFi leThreadrun(FindFi leThreadjava:67)

登录ft p服务器【10140177149】失败 FT P服务器无法打开orgapachecommons netftp FTPConnectionClosedException: FTP response 421 received Server closed connectionat orgapachecommonsnetftp FTP__getReply(FTPjava:363)at orgapachecommons netftp FTP__getReply(FTPjava:290)at orgapachecommons netftp FTPconnectAction(FTPjava:396)at orgapachecommons netftp FTPCl ientconnectAction(FTPCl ientjava:796)at orgapachecommons netSocketCl ientconnect(SocketCl ientjava:172)at orgapachecommons netSocketCl ientconnect(SocketCl ientjava:192)

4TASKTRACKER和HDFS组的问题

发现部分地方在安装的时候将所有的机器分组的问题。

如果分组需要将每个组的参数都要修改。

目前发现很多的地方TASKTRACKER和HDFS都分了组但是只修改一组的参数造成系统大量出问题。java heap size以及tasktracker被拉黑名单的问题。

5  namenode和datanode的内存配置问题。

建议将使用的内存修改为4G左右。

6建议将H IVE 2服务放到一个辅节点上。hive2放到辅节点上经常出现add_partation挂起报错。

7解决H IVE经常挂死的问题

修改zookeeper的最大客户端连接数maxClientCnxns修改为3600或者修改成0丌限制

自劢清空时间间隔 autopurge purgeInterval修改为1小时

8厂家XML配置的问题。

如果厂家是这样的/data/dataservice/mr/ltemro/huawei/20140815/01/362323/TD-LTE_MRO_HUAWEI_010133150144_362323_20140815011500xml gz

建议配置成这样的

路径/data/dataservice/mr/ltemro/huawei/$TIME$/$ENODEB$

时间格式yymmdd/hh

9在/home/boco/oozie_wy/config/lte/mro/ftp下禁止存放bak文件

有一个省份的mapper数超多导致解析很长时间没有完成。

进一步发现FTP在合并文件的时候报错再进一步发现同一个IP地址同一个OMC启劢了三个mapper进程去下载数据导致文件合并失败。

发现是修改了ftpxml文件没有删除原来的文件而是以一个bak文件存放。

删除这些bak文件mapper数量正常。

原mapper数1731个删除之后mapper数41个,采集正常。

打开50030看FT P的日志存在如下的报错java io Fi leNotFoundException: Fi le does not exist: /user/boco/cache/wy/ltemro/1411032293348/xml/155/2014-09-18_11/TD-LTE_MRO_ERICSSON_OMC1_303024_20140918111500xmlzipat orgapache hadoop hdfs servernamenodeINodeFi levalueOf(INodeFi lejava:39)at orgapache hadoop hdfs server namenode FSNamesystemgetBlockLocationsUpdateTimes(FSNamesystemjava:1

341)at orgapache hadoop hdfs server namenode FSNamesystemgetBlockLocationsInt(FSNamesystemjava:1293)at orgapache hadoop hdfs server namenode FSNamesystemgetBlockLocations(FSNamesystemjava:1269)at orgapache hadoop hdfs server namenode FSNamesystemgetBlockLocations(FSNamesystemjava:1242)at orgapache hadoop hdfs server namenode NameNodeRpcServergetBlockLocations(NameNodeRpcServerjava:39

2)at orgapache hadoop hdfs protocolPBCl ientNamenodeProtocolServerSideTranslatorPBgetBlockLocations(Cl ientNamenodeProtocolServerSideTranslatorPBjava:172)at org apache hadoop hdfs protocol proto Cl ientNamenodeProtocolProtos$Cl ientNamenodeProtocol$2 cal lBlockingMethod(Cl ientNamenodeProtocolProtosjava:44938)at orgapache hadoop ipc ProtobufRpcEngine$Server$ProtoBufRpcInvokercal l(ProtobufRpcEnginejava:453)at orgapache hadoop ipcRPC$Servercal l(RPCjava:1002)at orgapache hadoop ipcServer$Handler$1 run(Serverjava:1701)at orgapache hadoop ipc Server$Handler$1 run(Serverjava:1697)at java securityAccessControl lerdoPrivi leged(Native Method)

或者orgapache hadoopipc RemoteException(orgapache hadoop hdfs server namenode LeaseExpiredException):Lease mismatch on /user/boco/cache/wy/ltemro/1411032293348/xml/155/2014-09-18_11/TD-LTE_MRO_ERICSSON_OMC1_3030_20140918xml owned by DFSCl ient_NONMAPREDUCE_

-1274827212_1 but is accessed by DFSCl ient_NONMAPREDUCE_-216613905_1at orgapache hadoop hdfs servernamenode FSNamesystemcheckLease(FSNamesystemjava:2459)at orgapache hadoop hdfs servernamenode FSNamesystemcheckLease(FSNamesystemjava:2437)at orgapache hadoop hdfs servernamenode FSNamesystemcompleteFi leInternal(FSNamesystemjava:2503)at orgapache hadoop hdfs servernamenode FSNamesystemcompleteFi le(FSNamesystemjava:2480)

at orgapache hadoop hdfs servernamenode NameNodeRpcServercomplete(NameNodeRpcServerjava:535)at orgapache hadoop hdfs protocolPBCl ientNamenodeProtocolServerSideTranslatorPBcomplete(Cl ientNamenodeProtocolServerSideTranslatorPBjava:337)at org apache hadoop hdfs protocol proto Cl ientNamenodeProtocolProtos$Cl ientNamenodeProtocol$2 cal lBlockingMethod(Cl ientNamenodeProtocolProtosjava:44958)at orgapache hadoop ipc ProtobufRpcEngine$Server$ProtoBufRpcInvokercal l(ProtobufRpcEnginejava:453)at orgapache hadoop ipcRPC$Servercal l(RPCjava:1002)

解析时候报错错误如下rediscl ientsjedisexceptionsJedisConnectionException:Could not get a resource from the poolat redis cl ients uti l Pool getResource(Pooljava:22)at combocowangyouuti lsJedisUti lsgetJedis(JedisUti lsjava:47)at combocowangyou uti lsJedisUti lsgetTableValues(JedisUti lsjava:119)at com bocowangyou lte mro tdl tools LteMroXMLParser

此问题一般是因为REDIS没有启劢导致。

10克隆机器安装的问题

把一个节点的第二步都装好了把它克隆到其它主机上再把克隆到的主机的IP

(注意在修改IP配置文件的时候将HWaddr也改了一般是这种格式00:50:56:80:4E:D6

否则在连接时会找丌到硬盘)和主机名改下。

此种情况主要出现在使用vmvare vsphere克隆导致的。

注意

克隆之后的机器要修改IP地址主机名MAC地址。

11 redis挂死导致无法采集

#现象redis.clients.jedis.exceptions.JedisDataException:

MISCONF Redis is configured to save RDB snapshots,but is currently not able to persist on disk

启动客户端

/usr/local/redis/redis-cl i

输入config set stop-writes-on-bgsave-error no

12主节点7180无法访问

1)检查主节点是丌是日志空间满了如果满了需要删除/va r/l og/h ive下面日志

2)删除浏览器的cooki e访问记录hadoop相关服务启劢命令sudo service cloudera-scm-server stopsudo service cloudera-scm-server-db stopsudo service cloudera-scm-server startsudo service cloudera-scm-server-db start

13 LTEMRO采集报错

主要是在这一步报错CREATE_EXTERNAL_TABLE_NODE

有效的采样点数据是如下的八个字段必须有值

MR LteScEarfcn主小区频点

MR LteScPci主小区PCI

MR LteScRSRP主小区的RSRP

MR LteScRSRQ主小区RSRQ

MR LteNcEarfcn邻小区频点

MR LteNcPci邻小区PCI

MR LteNcRSRP邻小区的RSRP

MR LteNcRSRQ邻小区RSRQ

只要有有效数据就丌会报这个错。

14查看日志

H IVE的日志主要是在:/va r/l og/h ive/oozie的日志主要在: /va r/l og/oozie/

HDFS的日志主要在: /var/log/hadoop-hdfs/zookeeper的日志主要在:/var/log/zookeeper/

在出现问题的时候可以看看这些日志。

15 zookeeper无法启劢

处理办法到master主机的/var/lib/zookeeper 删除所有的文件重启zookeeper即可。sudo mkdir version-2sudo chown -R zookeeper:zookeeper version-2

16 loudera-manager-instal lerbin安装报错

报错如下

Loaded plugins: al iases, changelog, downloadonly, fastestmirror, kabi, presto,

: refresh-packagekit, security, tmprepo, verify, versionlock

Loading support for CentOS kernel ABI

Loading mirror speeds from cached hostfi lehttp://10233963/cdh430/cdh43/repodata/repomdxml : [Errno 14] PYCURL ERROR 22 - "The requested URL returned error:403"

Trying other mirror

Error:Cannot retrieve repository metadata (repomdxml) for repository: cloudera-cdh4 Please verify its path and try again

处理办法

删除集群中每一台机器上原有的repo文件 rm-rf/etc/yum repos d/*

然后修改cloudera-chd4 repo、 cloudera-impala repo和cloudera-manager repo文件将文件中的地址换成主节点的地址。

将cloudera-chd4 repo、 cloudera-impala repo和cloudera-manager repo文件上传到集群中每一台机器的/etc/yum repos d/目录下。

美国高防云服务器 1核 1G 26元/月 香港/日本站群服务器 E5 16G 1600元/月 触摸云

触摸云国内IDC/ISP资质齐全商家,与香港公司联合运营, 已超8年运营 。本次为大家带来的是双12特惠活动,美国高防|美国大宽带买就可申请配置升档一级[CPU内存宽带流量选一]升档方式:CPU内存宽带流量任选其一,工单申请免费升级一档珠海触摸云科技有限公司官方网站:https://cmzi.com/可新购免费升档配置套餐:地区CPU内存带宽数据盘价格购买地址美国高防 1核 1G10M20G 26...

火数云 55元/月BGP限时三折,独立服务器及站群限时8折,新乡、安徽、香港、美国

火数云怎么样?火数云主要提供数据中心基础服务、互联网业务解决方案,及专属服务器租用、云服务器、专属服务器托管、带宽租用等产品和服务。火数云提供洛阳、新乡、安徽、香港、美国等地骨干级机房优质资源,包括BGP国际多线网络,CN2点对点直连带宽以及国际顶尖品牌硬件。专注为个人开发者用户,中小型,大型企业用户提供一站式核心网络云端服务部署,促使用户云端部署化简为零,轻松快捷运用云计算!多年云计算领域服务经...

ftlcloud(超云)9元/月,1G内存/1核/20g硬盘/10M带宽不限/10G防御,美国云服务器

ftlcloud怎么样?ftlcloud(超云)目前正在搞暑假促销,美国圣何塞数据中心的云服务器低至9元/月,系统盘与数据盘分离,支持Windows和Linux,免费防御CC攻击,自带10Gbps的DDoS防御。FTL-超云服务器的主要特色:稳定、安全、弹性、高性能的云端计算服务,快速部署,并且可根据业务需要扩展计算能力,按需付费,节约成本,提高资源的有效利用率。点击进入:ftlcloud官方网站...

内部错误为你推荐
支持ipad空间文章空间里一些比较好的文章。。access数据库修复编程怎样实现access中对数据库的修复功能。字节跳动回应TikTok易主每天每夜要结束了主持人问关于抄袭的问题,权志龙很认真的回答不想说的,想在以后做好的那段话的音乐叫什flashfxp下载我想下载一个FlashFXP 4.0.0 Build 1510 简体中文版的软件,可是不知道下载地址,希望大家帮帮我?flashfxp注册码谁知道 FlashFXP.rar的注册码?邮件eset本公司www腾讯公司电话腾讯总公司服务热线是多少12306.com注册12306邮箱地址怎么写
美国和欧洲vps 希网动态域名 西安服务器 息壤备案 163网 优key permitrootlogin 国外网站代理服务器 蜗牛魔方 phpmyadmin配置 如何建立邮箱 防cc攻击 cdn网站加速 工信部icp备案查询 江苏徐州移动 阿里云邮箱个人版 七十九刀 美国主机 侦探online byebyelove 更多