HDFS读写数据流程_尚硅谷

HDFS读写数据流程_尚硅谷
(1)客户端通过Distributed FileSystem向NameNode请求下载文件,NameNode通过查询元数据,找到文件块所在的DataNode地址。
(2)挑选一台DataNode(就近原则,然后随机)服务器,请求读取数据。
(3)DataNode开始传输数据给客户端(从磁盘里面读取数据输入流,以Packet为单位来做校验)。
(4)客户端以Packet为单位接收,先在本地缓存,然后写入目标文件。

HDFS读写数据流程_尚硅谷
PS:1.下载的块是按照顺序来的,先下载第一块,完成后,再下载第二块。
2.所有的下载块,公用一个输出流。