HDFS上传文件和读文件的流程

HDFS上传文件和读文件的流程:


流程图:

HDFS上传文件和读文件的流程

过程解析:


这里描述的 是一个256M的文件上传过程 
① 由客户端 向 NameNode节点节点 发出请求
②NameNode 向Client返回可以可以存数据的 DataNode 这里遵循  机架感应  原则
③客户端 首先 根据返回的信息 先将 文件分块(Hadoop2.X版本 每一个block为 128M 而之前的版本为 64M)
④然后通过NameNode返回的DataNode信息 直接发送给DataNode 并且是 流式写入  同时 会复制到其他两台机器
⑤dataNode 向 Client通信 表示已经传完 数据块 同时向NameNode报告
⑥依照上面(④到⑤)的原理将 所有的数据块都上传结束 向 NameNode 报告 表明 已经传完所有的数据块 


转载地址:http://www.aboutyun.com/thread-21404-1-1.html