HDFS是Hadoop应用程序使用的主要分布式存储。 HDFS集群主要由管理文件系统元数据的NameNode和存储实际数据的DataNode组成。 “HDFS体系结构指南”详细介绍了HDFS。HDFS体系结构图描述了NameNode,DataNode和客户端之间的基本交互。 客户联系NameNode文件元数据或文件修改,并直接与DataNode执行实际的文件I / O。 以下是许多用户可能感兴趣的一些显着特性。 Hadoop,包括HDFS,非常适合使用商品硬件的分布式存储和分布式处理。 它具有容错性,可扩展性,并且…