DistributedFileSystem:代码位于hadoop-hdfs-project\hadoop-hdfs-client\src\main\java\org\apache\hadoop\hdfs\DistributedFileSystem.java(hadoop3.2.1)
FSDataOutputStream:代码位于hadoop-common-project\hadoop-common\src\main\java\org\apache\hadoop\fs\FSDataOutputStream.java
NameNode:存储文件的元数据。作用:管理HDFS的名称空间;配置副本策略;管理数据块(Block)映射信息;处理客户端读写请求
DataNode:在本地文件系统存储文件块数据,以及块数据的校验和。作用:存储实际的数据块;执行数据块的读/写操作。
Block:HDFS中的文件在物理上是分块存储 (Block) , 块的大小可以通过配置参数( dfs.blocksize)来规定,默认大小在Hadoop2.x/3.x版本中是128M
节点距离:两个节点到达最近的共同祖先的距离总和。
例如,假设有数据中心 d1 机架 r1 中的节点 n1。 该节点可以表示为/d1/r1/n1。 利用这种标记,这里给出四种距离描述。