hadoop常用服务管理命令

2022-02-06 12:42:17

这几天正好在做cdh4.6.0到cdh5.2.0的升级测试，经常需要启动/关闭各种服务，简单看了下各个服务管理脚本，这里简单记录下：

主要的服务管理脚本如下

hdfs相关

1）hadoop-daemon.sh，可用于启动单一的服务

依次调用hadoop-config.sh和hadoop-env.sh
加载相关的配置和环境变量，比如nn的jvm配置等（hadoop-env.sh）
在这里可以设置

export HADOOP_ROOT_LOGGER=DEBUG,console

来控制观察hadoop启动时的debug日志
以start为例，最终通过nohup的方式来启动服务

 case $command in

      namenode|secondarynamenode|datanode|journalnode|dfs|dfsadmin|fsck|balancer|zkfc)

        if [ -z "$HADOOP_HDFS_HOME" ]; then

          hdfsScript="$HADOOP_PREFIX"/bin/hdfs

        else

          hdfsScript="$HADOOP_HDFS_HOME"/bin/hdfs

        fi

        nohup nice -n $HADOOP_NICENESS $hdfsScript --config $HADOOP_CONF_DIR $command "$@" > "$log" 2>&1 < /dev/null &

      ;;

 (*)

        nohup nice -n $HADOOP_NICENESS $hadoopScript --config $HADOOP_CONF_DIR $command "$@" > "$log" 2>&1 < /dev/null &

      ;;

比如以rollback的形式启动dn，最终为hdfs --config /home/vipshop/conf datanode -rollback
所以，如果要单独启动服务，可以使用hadoop-daemon.sh start xxxx这种形式。
hdfs脚本会调用具体的类，比如namenode会调用org.apache.hadoop.hdfs.server.namenode.NameNode类，最终的命令java xxxx org.apache.hadoop.hdfs.server.namenode.NameNode xxxx

2）hadoop-daemons.sh，hadoop-daemon.sh的复数类型，可用于启动多个服务器的服务，比如dn,nm

调用slaves.sh和

hadoop-daemon.sh --config /home/vipshop/conf --script hdfs start namenode

等命令

3)refresh-namenodes.sh

#refreshes all namenodes(hdfs dfsadmin -fs hdfs://xxxx -refreshNodes)

4)slaves.sh 解析slaves文件，并循环ssh调用命令，比如循环start datanode

if [ "$HADOOP_SLAVE_NAMES" != '' ] ; then

  SLAVE_NAMES=$HADOOP_SLAVE_NAMES
else

  SLAVE_FILE=${HADOOP_SLAVES:-${HADOOP_CONF_DIR}/slaves}

  SLAVE_NAMES=$(cat "$SLAVE_FILE" | sed  's/#.*$//;/^$/d')
fi
# start the daemons

for slave in $SLAVE_NAMES ; do

ssh $HADOOP_SSH_OPTS $slave $"${@// /\\ }" \

   2>&1 | sed "s/^/$slave: /" &

if [ "$HADOOP_SLAVE_SLEEP" != "" ]; then

   sleep $HADOOP_SLAVE_SLEEP
fi
done

5)start-dfs.sh #启动nn,dn,jn,snn （相反关闭为stop-dfs.sh）

启动时调用的命令分布如下

#hadoop-daemons.sh --config xxx --script  hdfs start namenode xxx
#hadoop-daemons.sh --config xxx --script  hdfs start datanode  xxx
#hadoop-daemons.sh --config xxx --script  hdfs start journalnode
#hadoop-daemons.sh --config xxx --script  hdfs start secondarynamenode

其中nn,dn的启动时，可以带入-upgrade或者-rollback参数，控制升级和回滚操作
(snn和jn在升级或者回滚时不需要做特殊操作)
nn，jn，snn的启动都需要带入hostname
比如nn:

NAMENODES=$($HADOOP_PREFIX/bin/hdfs getconf -namenodes)

echo "Starting namenodes on [$NAMENODES]"

"$HADOOP_PREFIX/sbin/hadoop-daemons.sh" \

  --config "$HADOOP_CONF_DIR" \

  --hostnames "$NAMENODES" \

  --script "$bin/hdfs" start namenode $nameStartOpt

jn:

SHARED_EDITS_DIR=$($HADOOP_PREFIX/bin/hdfs getconf -confKey dfs.namenode.shared.edits.dir 2>&-)

#通过获取dfs.namenode.shared.edits.dir的设置

case "$SHARED_EDITS_DIR" in

qjournal://*)

  JOURNAL_NODES=$(echo "$SHARED_EDITS_DIR" | sed 's,qjournal://\([^/]*\)/.*,\1,g; s/;/ /g; s/:[0-9]*//g')  

  echo "Starting journal nodes [$JOURNAL_NODES]"

  "$HADOOP_PREFIX/sbin/hadoop-daemons.sh" \

      --config "$HADOOP_CONF_DIR" \

--hostnames "$JOURNAL_NODES" \

      --script "$bin/hdfs" start journalnode ;;
esac

hdfs解析传入的参数，并最终调用对应的java实现类的main方法。比如
hdfs getconf -namenodes调用java xxx org.apache.hadoop.hdfs.tools.GetConf -namenodes
hdfs getconf -confKey dfs.namenode.shared.edits.dir调用java xxx org.apache.hadoop.hdfs.tools.GetConf -confKey dfs.namenode.shared.edits.dir

6)start-secure-dns.sh #kerberos环境下启动dn的脚本

7)start-balancer.sh #启动balance服务（相反关闭为stop-balancer.sh）

#调用hdfs start balancer （org.apache.hadoop.hdfs.server.balancer.Balancer类）

8）start-all.sh ##start-dfs.sh + start-yarn.sh （相反关闭为stop-all.sh）

yarn相关

1)yarn-daemon.sh

最终调用yarn xxx，比如yarn start nodemanager

2)yarn-daemons.sh

会调用slaves.sh和yarn-daemon.sh

3)start-yarn.sh,（相反关闭为stop-yarn.sh）

#yarn-daemon.sh start resourcemanager
yarn-daemons.sh start nodemanager

综上：

以要启动dn为例

hadoop-daemons.sh-->hadoop-daemon.sh-->hdfs namenode start---->org.apache.hadoop.hdfs.server.namenode.NameNode类的main方法

本文转自菜菜光 51CTO博客，原文链接：http://blog.51cto.com/caiguangguang/1579849，如需转载请自行联系原作者

码农公寓

相关文章