1.问题:namenode怎么不知不觉挂掉了。。。。无语之前还好好的
hadoop102:9870页面打不开
如下图所示:
不能加载FSImage文件,
2.如何解决?
首先遇到问题要学会查日志错误信息,到hadoop根目录的logs查看namenode的错误信息、
格式化namenode :hdfs namenode -format 格式化之前要关闭集群,并且删除根目录下hdfs下的文件,并删除hadoop的logs和data,可能还要删别的,我只删除了这俩。
然后重启集群,发现datanode没有日志记录,但是没有起起来,重新关闭重启集群
假设是clusterID不一致,则修改clusterID
到根目录下的data1中的cdh中(还有一个current文件夹下面有个VERSION的文件中)将日志信息中提示的namenode 地址copy 替换各个data文件夹中的clusterID即可,其他节点也要根据各个hadoop日志中报错信息相应替换ID 即可
最后重启jps,解决