hdfs命令行和客户端的区别是什么

hdfs命令行和客户端的区别是什么

这篇文章主要介绍“ hdfs命令行和客户端的区别是什么”,在日常操作中,相信很多人在 hdfs命令行和客户端的区别是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答” hdfs命令行和客户端的区别是什么”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

一直都没有发现,原理hdfs的命令行和客户端api的使用还是有很大差别的


现象:

将dfs.block.size设置成128M

hdfs命令行和客户端的区别是什么


现有28G的数据,理论上讲map的总数应该是224个,但是map数量却翻倍成448个

hdfs命令行和客户端的区别是什么


一直都找不出原因,使用hdfs命令行查看需要进行mapreduce的文件的block大小

hdfs命令行和客户端的区别是什么


然后通过hdfs fs -put 命令放进去的文件block大小就是128M

hdfs命令行和客户端的区别是什么


最后猜测应该是客户端API没有读到在构造Configuration对象时没有读到服务器上的*-site.xml导致的,将服务器上的*-site.xml放到客户端的根目录下实验了一下,果然OK了

到此,关于“ hdfs命令行和客户端的区别是什么”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!