hdfs的数据实际上是存储在本地文件系统中的。在配置hadoop时你需要配置hdfs的存储文件夹,如果你的用户名为root,文件夹位置是/root/tmp。那么你的hdfs的数据存储在/root/tmp/dfs/data/current中。其中block是块文件,也就是数据文件,.meta是元数据。hadoop是java写的,因此hadoop存储的数据的方式使用的也是java的方式。
hdfs先把要存储的文件分片,然后通过网络传给hadoop集群上的机器,在不同的机器上存储不同的分片,为了提高系统的容错能力,每个分片都有3个副本(replication默认是3,可以在hadoop配置文件中配置),与操作系统的文件系统没有直接的关系。有一篇hdfs与linux文件系统比较的论文可以去相关的数据库检索到
基于操作系统的文件系统之上构件的。它是虚拟分布式文件系统,实际内容也是存在操作系统的文件上。
hadoop的hdfs文件系统
本地windows文件系统'
linux文件系统
都是系统。只是应用不同而已。
linux文件系统因为没有图形界面,所以安全性高一点