温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
本节课我们来讨论一下HDFS的体系架构。首先了解一下哈多普的基本知识。哈多普主要用于离线数据存储和离线数据计算,是一个可以更容易开发和运行处理大规模数据的软件平台。这里展示了哈多普生态圈中的主要组件,下面重点讨论下HDFS的体系架构。那么漏的是HFS的主节点,它负责管理和维护集群,并且接收客户端的读写请求。A load是HDFS的重节点,它负责以数据的形式存储数据文件。Data load会将自己的跳信息发送给number no, 从而在那no上便可以监控data load的运行状态,客户端会根据那no返回的原信息直接访问data loadde进行数据的读写操作。从这里可以看出,HDFS集群整体是一个组成架构,如果整个集群中只存在一个,那么no的当它出现。
01:00
问题时,会造成整个集群无法正常工作,这一便是主从架构的单点故障问题。因此在实际的生产中需要进一步实现HDFS联邦和HDFS的ha。我们将会在后续的课程单独介绍他们。HDFS集群中还包含secondary的第二名称节点。注意,Second不是热,它的主要作用是进行HTFA日志的合并,从而优化那么的性能。那么Not和second number么的默认运行在同一台主机之上。因此要搭建一个HDFS的全分布机群,至少需要三台主机,分别是这里的主机A、主机B和主机C。现在你已经知道HDFS的体系架构了,那你知道哈都普生态圈中其他组织的架构吗?欢迎评论区你们讨论好了,记得点加号关注赵玉强老师。
我来说两句