副本数为3,每一个block都要存3份,那多的2份都是冗余的啦
只有一个节点,所有block以及其备份全都存在该节点上,若那个节点数据盘只使用一块硬盘,所有数据都在一块硬盘上,硬盘坏了,数据也就全丢了,多副本完全起不到备份的作用,而且HDFS的性能肯定也奇差无比,甚至存的数据量稍微大一点,DataNode就挂了。
HDFS作为分布式文件系统在数据管理方面可借鉴点:
文件块的放置:一个Block会有三份备份,一份在NameNode指定的DateNode上,一份放在与指定的DataNode不在同一台机器的DataNode上,一根在于指定的DataNode在同一Rack上的DataNode上。简单来说就是 1/3 的冗余数据在一个机柜里面,2/3 的冗余数据在另外一个机柜里面。备份的目的是为了数据安全,采用这种方式是为了考虑到同一Rack失败的情况,以及不同数据拷贝带来的性能的问题。