hadoop 3.2 安装

hadoop 3.x版本出来已经很久了，之前应为工作需求的原因是安装并使用了spark 3.2.1的版本，现在将之前安装使用过程中遇到的问题总结记录一下。

主要是以下的安装过程：

hadoop user以及相关文件权限配置

GPU的支持

因为GPU的调度支持依赖cgroups,所以要确保cgroups的root=/sys/fs/cgroup
配置container-executor.cfg 中的yarn-hierarchy, 这个很重要，而且要确保以下两个路径存在：/sys/fs/cgroup/cpu,cpuacct/hadoop-yarn/和/sys/fs/cgroup/devices/hadoop-yarn

docker容器的支持

yarn运行docker容器的时候，是按照host user运行docker 容器的程序的，所以必须确保docker容器中也存在同样的用户，不然会报错，这里使用的方案是直接在的docker 容器中mount hosts的/etc/passed以及/etc/group。