Hadoop复制因子是3.如何存储多少数据?

问题描述:

Hadoop的行业标准复制因子是3.那么这是否意味着如果有100 GB的数据,那么在HDFS中它将被存储为300 GB?Hadoop复制因子是3.如何存储多少数据?

+0

请记住,在对该数据进行操作期间,还会创建其他临时文件 –

是的。

还有其他因素,例如块大小(默认为128MB),当文件非常小或略大于块大小时可能会引入碎片,但通常HDFS中的100GB等于磁盘上的300GB。