Hadoop0.20.2集群如何配置

这篇文章主要介绍Hadoop0.20.2集群如何配置,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

一、hadoop启动

先格式化一个新的分布式文件系统
$cdhadoop-0.20.2
$bin/hadoopnamenode-format
查看输出保证分布式文件系统格式化成功。
Hadoop0.20.2集群配置过程中在主节点master上面启动hadoop,主节点会启动所有从节点的hadoop。
$bin/start-all.sh
从主节点master关闭hadoop,主节点会关闭所有从节点的hadoop。
$bin/stop-all.sh
Hadoop守护进程的日志写入到${HADOOP_LOG_DIR}目录(默认是${HADOOP_HOME}/logs).

浏览NameNode和JobTracker的网络接口,它们的地址默认为:
NameNode-http://master:50070/
JobTracker-http://master:50030/

将输入文件拷贝到分布式文件系统:$bin/hadoopfs-putconfinput

运行发行版提供的示例程序:$bin/hadoopjarhadoop-0.20.2-examples.jargrepinputoutput'dfs[a-z.]+'

查看输出文件:
将输出文件从分布式文件系统拷贝到本地文件系统查看:
$bin/hadoopfs-getoutputoutput
$catoutput/*
或者
在分布式文件系统上查看输出文件:$bin/hadoopfs-catoutput/*


启动运行成功后,可以多熟悉熟悉hadoopdfs命令,例如:
hadoopdfs–ls查看/usr/root目录下的内容,默认如果不填路径这就是当前用户路径;
hadoopdfs–rmrxxxxxx就是删除目录;
hadoopdfsadmin-report这个命令可以全局的查看DataNode的情况;
hadoopjob-list后面增加参数是对于当前运行的Job的操作,例如list,kill等;
hadoopbalancer均衡磁盘负载的命令。

以上是“Hadoop0.20.2集群如何配置”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注行业资讯频道!