HDFS

分布式文件系统;用来干嘛?

你需要存文件的时候,就可以用HDFS

HDFS的一些关键点:

HDFS中存储的文件是会被切成一个一个的block存储的

block存储在datanode服务器的磁盘上

block的位置信息(元数据)存储在namenode服务器(内存里,持久化到磁盘)上

每一个block都可以有多个副本(由上传这个文件的客户端决定:dfs.replication=3

每一个block的切块规格是由上传这个文件的客户端决定:dfs.blocksize=128M

 

HDFS的客户端读写数据的流程:HDFSHDFS