1、Namenode Namenode主要是用来保存HDFS的元数据信息,比如命名空间信息,块信息等。是Hadoop的主服务器,管理文件系统名称空间和集群存储的文件访问。 2、Datanode Datanode负责管理连接到节点的存储。每个存储数据的节点运行一个datanode守护进程。 3、secondaryNameNode secondaryNameNode不是 namenode 的冗余守护进程,该进程提供周期检查点和清理任务。出于扩展性和容错性的考虑,一般将SecondaryNameNode运行在一台非NameNode的机器上。 4、ResourceManager ResourceManager是Yarn集群主控节点,负责协调和管理整个集群(所有NodeManager)的资源。 5、NodeManager NodeManager管理一个YARN集群中的每一个节点。比如监视资源使用情况( CPU,内存,硬盘,网络),跟踪节点健康等。