[HADOOP] Standby NN无法启动

发布时间:2019-11-17 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了[HADOOP] Standby NN无法启动脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。

博客原文:hackershell

前段时间,standby的NN挂掉了,并且怎么起也起不来,如下日志:

2016-01-03 14:04:19,293 FATAL org.apache.hadoop.hDFs.server.namenode.ha.EdITLOGTailer: Unknown error encountered while tailing edits. Shutting down standby NN. java.io.IOException: Failed to apply edit log operation ReassignLeaseOp [leaseHolder=DFSClient_NONMAPredUCE_854707399_1, path=/tmp/jrdw/kafka2hdfs/log_mobile_gateway-21-1443245603647--6536501137915724876, newHolde r=HDFS_NameNode, opCode=OP_REASSIGN_LEASE, txid=20790808505]: error File is not under construction: /tmp/jrdw/kafka2hdfs/log_mobile_gateway-21-1443245603647--6536501137915724876        at org.apache.hadoop.hdfs.server.namenode.MetaRecoveryContext.editLogLoaderPrompt(MetaRecoveryContext.java:94)        at org.apache.hadoop.hdfs.server.namenode.FSEditLogLoader.loadEditRecords(FSEditLogLoader.java:205)        at org.apache.hadoop.hdfs.server.namenode.FSEditLogLoader.loadFSEdits(FSEditLogLoader.java:112)        at org.apache.hadoop.hdfs.server.namenode.FSImage.loadEdits(FSImage.java:771)        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer.doTailEdits(EditLogTailer.java:227)        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.doWork(EditLogTailer.java:321)        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.access$200(EditLogTailer.java:279)        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread$1.run(EditLogTailer.java:296)        at org.apache.hadoop.security.SecurityUtil.doAsLoginUserOrFatal(SecurityUtil.java:456)        at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.run(EditLogTailer.java:292)  

开始怀疑是不是editlog的下载有问题,后来发现editlog是可以解析出来的,但是不排除editlog的顺序存在bug

我们采取的方案是:

因为每次启动都需要加载editlog,所以为了跳过此操作,我们将Active进入安全模式,并进行savenamespace将dump出来的fsimage和txid拷贝到Standby NN上,重启就可以避免加载editlog了。

如果两个NN都挂掉了,那就要做相对麻烦的操作了,而且相对对数据不安全

以下是参考案例:

Namenode异常停止后无法正常启动

脚本宝典总结

以上是脚本宝典为你收集整理的[HADOOP] Standby NN无法启动全部内容,希望文章能够帮你解决[HADOOP] Standby NN无法启动所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。