首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

hadoop集群为什么要奇数台

Hadoop集群为什么要奇数台?

Hadoop是一个开源的分布式计算平台,用于存储和处理大规模数据集。在Hadoop集群中,节点的数量通常建议是奇数台,而不是偶数台。以下是解释为什么要选择奇数台Hadoop集群的原因:

  1. 解决主节点选举问题:Hadoop集群中有一个主节点(NameNode),负责管理和控制整个集群。当集群中的节点数量是奇数时,可以避免出现主节点选举的死锁问题。如果节点数量是偶数,可能会出现选举过程中的平局情况,导致无法决定谁应该成为主节点。
  2. 高可用性:奇数台的节点数量可以提供更高的系统可用性。当节点数量是奇数时,集群可以容忍某些节点的故障,仍然能够维持正常的运行。如果节点数量是偶数,当一半节点发生故障时,集群将无法正常工作。
  3. 数据均衡:Hadoop集群中的数据通常会被划分成多个块,并存储在不同的节点上。当节点数量是奇数时,数据块的分布更均衡,每个节点上存储的数据量相对较少,读取和写入操作可以更高效。
  4. 故障恢复:奇数台的节点数量可以更好地支持故障恢复。当某个节点出现故障时,可以使用其他节点上的备份数据进行恢复操作。如果节点数量是偶数,可能会出现数据恢复时的冲突,增加了故障恢复的复杂性。

总结起来,选择奇数台Hadoop集群可以解决主节点选举问题、提供更高的系统可用性、实现数据均衡以及支持故障恢复。在腾讯云的产品中,适用于Hadoop集群的产品有腾讯云数据工场(https://cloud.tencent.com/product/df)、弹性MapReduce(https://cloud.tencent.com/product/emr)等。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

Zookeeper集群节点数量为什么要是奇数个?

而考虑到zookeeper的时候,不得不说一下搭建集群时为神马要做到用奇数个节点。原先接触的不多,只需要知道这个事情就好,今天好奇研究了一下。...这样我们举个例子:生产环境有一个hbase集群,含有6个节点,有一天我发现生产环境mysql的数据格式单一,而且关系比较简单,查询条件基本上都是用主键来做的,那这种数据就很符合nosql数据库的胃口了。...这六个哥们呢关系比较好都是好朋友,彼此都加着微信,而且呢有什么事情都是通过微信来通知的,比如他们出去郊游,就会安排路人甲开车,路人乙带喝的,路人丙带吃的等等。...都不可用,当然也有可能会出现网络隔离的情况: a系的能联系上,b系的能联系上,那就b的工作吧,a的放假 相当于大家制定一个规则,好好干,有饭吃 今天的第二篇文章讲了一些脑裂的产生原因和解决办法,不只是针对集群和...zookeeper的,欢迎点开 如果大家听明白了脑裂和集群奇数的原理,不如就点个好看

1.5K20

3hadoop集群部署计划---安装系列一

在文件最后添加 export JAVA_HOME=/usr/java/jdk1.7.0_55 export PATH=PATH:JAVA_HOME/bin #刷新配置 source /etc/profile 3虚拟机的...hadoop的HA集群部署计划 hadoop01 zookeeper journalnode nodemanager datanode resourcemanager namenode zkfc hadoop02...通常配置奇数个JournalNode 这里还配置了一个zookeeper集群,用于ZKFC(DFSZKFailoverController)故障转移,当Active NameNode挂掉了,会自动切换Standby...hadoop集群(在hadoop01上操作) 2.1解压 tar -zxvf hadoop-2.6.0.tar.gz -C /itcast/ 2.2配置HDFS(hadoop2.0所有的配置文件都在$HADOOP_HOME...scp -r /itcast/hadoop-2.6.0/  hadoop03:/itcast/ ###注意:严格按照下面的步骤 2.5启动zookeeper集群(分别在hadoop01、hadoop02

27920
  • 大数据和Hadoop什么关系?为什么大数据学习Hadoop

    3、实现大数据平台的框架除了Hadoop之外,还有其他更多的平台。 由于Hadoop是一个开源的大数据系统平台,所以你们听得最多。除了Hadoop平台外,还有其他系统平台。...所以,大数据不等于Hadoop,大数据与Hadoop也不是包含关系。...学习大数据肯定需要学习Hadoop技术,Hadoop在大数据技术体系中的地位至关重要,Hadoop是大数据技术的基础,对Hadoop基础知识的掌握的扎实程度,会决定在大数据技术道路上走多远。...目前很多商用大数据平台也是基于Hadoop构建的,所以Hadoop是大数据开发的一个重要内容。...Hadoop学习之后,还得学习Spark,它是一种与 Hadoop 相似的开源集群计算环境,拥有Hadoop MapReduce所具有的优点,Spark是MapReduce的替代方案,而且兼容HDFS、

    2K30

    数据中为什么建标签体系,分类它不香吗?

    数据中为什么建标签体系,分类它不香吗? 在众多的数据中的解决方案中,一个叫做“标签中心”或“标签体系”的应用,几乎成了数据中的“标配”。 乍一看,标签体系就像一个树状的分类。...04 数据中为什么需要标签体系 上文中我们说过,传统企业的信息化使用更多的是分类体系,而标签体系是互联网企业的“致胜法宝”。 随着数字化时代的到来,掀起了传统企业数字化转型的浪潮。...来源:36氪研究院《2020年中国服装行业数据中研究报告》 关于数据中的文章,笔者也写了很多了,我们再回顾一下它的概念:数据中是数据+技术+产品+组织的有机组合,是快、准、全、统、通的智能大数据体系...如果你的数据中定位的是企业数字化转型的运营中枢系统,实现对前端业务的支持和赋能,那“标签体系”就是数据中一个标配。...05 数据中生产数据标签的四个步骤 在经历过“追捧”和“质疑”等种种考验后,数据中在基于业务驱动的标签体系助力下,正在用事实验证其价值。

    1.4K23

    京东万规模Hadoop集群 | 分布式资源管理与作业调度

    目前专注于以万分布式调度系统及深度学习平台的开发与建设。 > 京东为什么要做万规模的Hadoop? 随着京东的业务增长,原有的Hadoop集群已经无法满足高速增长的存储与计算需求。...回想过去我们使用MPI、OpenMP去实现一个分布式处理程序,那时我们需要自己控制程序的远程启动与停止,同时自己编写容错代码。...在Hadoop 2.0 YARN 架构下,主要有以下几个组件: ResourceManager:主节点服务,负责维护节点信息和负责资源管理与作业调度, 可以部暑两并利用Zookeeper 实现高可用...后来为了更好的支持异地多活和跨地域扩展能力,我们再次改造升级实现了万Hadoop集群分布式资源管理与调度系统,解决了之前单集群扩展瓶颈和无法有效支撑跨机房调度与灾备的问题。...其中最主要的是性能问题,为此我们自研了一个基于队列镜像的多路分配策略,大大提升了ResourceManager调度器的性能,让我们单个YARN子集群拥有了超过万规模资源管理与调度能力。

    1.5K32

    一脸懵逼学习Hadoop分布式集群HA模式部署(七机器跑集群

    通常配置奇数个JournalNode       这里还配置了一个zookeeper集群,用于ZKFC(DFSZKFailoverController)故障转移,当Active NameNode挂掉了,...解决了这个问题,有两个ResourceManager,一个是Active,一个是Standby,状态由zookeeper进行协调 1:hadoop分布式集群HA模式部署,七机器跑集群:   第一机器...通常配置奇数个JournalNode,这里还配置了一个zookeeper集群,用于ZKFC(DFSZKFailoverController)故障转移,当Active NameNode挂掉了,会自动切换Standby...之前,master,slaver1,slaver2配置过三机器的集群,这里因为需要,由slaver3配置好的hadoop复制到剩余的六机器,这里删除之前的集群,这里先不删除home/hadoop/...hadoop-2.4.1,先将这个名称改了,万一七台机器的集群搭建失败,还可以使用三机器的集群; 如: [root@slaver1 hadoop]# mv hadoop-2.4.1 hadoop-2.4.1

    1.9K90

    一脸懵逼学习基于CentOs的Hadoop集群安装与配置(三机器跑集群

    基于它写出来的程序能够运行在由上千商用机器组成的大型集群上,并以一种可靠容错的方式并行处理T级别的数据集,实现了Haddoop在集群上的数据和任务的并行计算与处理。     ...JobTracker(一个集群中只能有一)是用于管理和调度工作的,TaskTracker是用于执行工作的。...Hadoop集群简介:   1)HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起   2)HDFS集群:     负责海量数据的存储,即负责数据文件的读写操作...,这里使用centOs虚拟机(本实验只搭建一个有三主机的小集群。...-2.4.1.tar.gz 三hadoop文件配置相同,所以配置完一后,可以把整个hadoop复制过去就行了,现在开始配置master主机的hadoop文件。

    1.6K60

    HBase和Zookeeper的安装和部署

    数据量巨大无容置疑,面向普通用户的请求必然即时响应。  容量的优雅扩展。  大数据的驱使,动态扩展系统容量的必须的。例如:webPage DB。...,值为0 (5)用scp命令分发zk文件夹到集群 3.3启动/验证 启动zk的服务:zkServer.sh start 验证zk的启动状态:zkServer.sh status 4奇数选举 zookeeper...的集群数推荐配置奇数,Leader选举算法采用了Paxos协议,该协议的核心思想是当多数Server写成功时,则任务数据写成功,如: 有3个Server,则两个写成功即可; 有4或5个Server,则三个写成功即可...; 如果有3个Server,则最多运行1个Server挂掉 如果有4个Server,则同样最多运行1个Server挂掉 由此,我们可以看出3服务器和4服务器的容灾能力是一样的,所以为了节约服务器资源...,一般我们采用奇数个数,作为服务器部署个数。

    27410

    第六章 zookeeper 原理,安装步骤,数据同步演示

    下面我们通过图例来说一下Zookeeper在数据同步方面的作用,Zookeeper集群的搭建有个特点就是设备的数量必须是奇数,像下图就有5设备作为Zookeeper的集群,之所以搞这么多台机器组成集群来对外提供服务是考虑到了数据的高可靠性...在奇数设备当中只有一设备是“Leader”即领导身份,其它设备都是”Follower”即从属者的身份。...Zookeeper集群只要有一半以上的机器正常运行就可以正常提供服务,也就是说,集群允许宕机的数量不能达到机器总量的一半,比如我们拿一个最小的Zookeeper集群来说,从高可靠性还有奇数两个方面考虑...,我们知道集群最少的机器数量是3,那么这3组成的集群最大允许的宕机数量是1,同理,5组成的集群最大允许的宕机数量是2,7组成的集群最大允许的宕机数量是3等等。...接下来说一下为什么要用到Zookeeper,下图第一条所说的意思,我举个例子,比如我们有个好几百设备组成的集群,现在我们更改一下配置,那么我们的去改吗?

    85520

    云桌面一服务器带多少终端?为什么叫云桌面?

    那么云桌面一服务器带多少终端?为什么叫云桌面?下面就让小编给大家说一下! 为什么叫云桌面?...云桌面一服务器带多少终端?...云桌面的服务器性能是有强弱之分的,所以当您准备咨询云桌面一服务器带多少终端这个问题的时候,需要先了解一下已有的服务器配置,我们都知道如果CPU过高的话,只要服务器的运营稳定,完全可以带20左右终端。...云桌面一服务器带多少终端?为什么叫云桌面?任何一款服务器都有其上限,如果您选择的服务器配置高,可以让您轻松开启多个终端,而且不会出现卡顿的现象,欢迎大家到腾讯云了解!

    5.1K30

    Zookeeper工作原理

    5、Zookeeper leader 选举    • 半数通过     – 3机器 挂一 2>3/2     – 4机器 挂2 2!>4/2   • A提案说,我选自己,B你同意吗?...任何一个节点挂掉都不会影响整个集群的数据一致性(总2n+1,除非挂掉大于n)。  ...总结   • Zookeeper 作为 Hadoop 项目中的一个子项目,是 Hadoop 集群管理的一个必不可少的模块,它主要用来控制集群中的数据,    如它管理 Hadoop 集群中的 NameNode...zookeeper集群的数目,一般为奇数个?   ...•Server数目一般为奇数(3、5、7)如果有3个Server,则最多允许1个Server挂掉;如果有4个Server,则同样最多允许1个Server挂掉由此,    我们看出3服务器和4服务器的的容灾能力是一样的

    41320

    几句话了解Zookeeper工作原理

    5、Zookeeper leader 选举  • 半数通过 – 3机器 挂一 2>3/2 – 4机器 挂2 2!>4/2 • A提案说,我选自己,B你同意吗?C你同意吗?...任何一个节点挂掉都不会影响整个集群的数据一致性(总2n+1,除非挂掉大于n)。...总结 Zookeeper 作为 Hadoop 项目中的一个子项目,是 Hadoop 集群管理的一个必不可少的模块,它主要用来控制集群中的数据,如它管理 Hadoop 集群中的 NameNode,还有...zookeeper集群的数目,一般为奇数个?...•Server数目一般为奇数(3、5、7)如果有3个Server,则最多允许1个Server挂掉;如果有4个Server,则同样最多允许1个Server挂掉由此, 我们看出3服务器和4服务器的的容灾能力是一样的

    48440

    Hadoop HA 完全分布式工作机制

    图1-1-1:Zookeeper 工作机制 Zookeeper 集群可以用来保证 Hadoop 集群的高可用,其原理是(HDFS HA 中会作详细讲解): Hadoop 集群中有两个 NameNode...选举的流程是:集群中处于启动的任意一机器发现集群中没有 Leader 时,就会推荐自己为 Leader,其他机器来同意,当超过半数的机器同意它为 Leader 时,选举结束。...因此,Zookeeper 集群适合安装奇数台机器,这样就算当 Leader 机器宕机后,也能很快选举出新的 Leader,保证了 Zookeeper 集群本身的高可用,同时也能避免资源浪费。...共享存储系统的一般类型有:Shared NAS+NFS、BookKeeper、BackupNode 和 Quorum Journal Manager(QJM),目前用得较多的是 QJM 共享存储组件,通过搭建奇数...图2-2-1:QJM 内部实现框架 2.3 主备故障自动切换机制 完成 HA,除了元数据同步外,还得有一个完备的主备故障自动切换机制,这个机制就是依赖于 Zookeeper 集群的主备选举机制,而整个切换的过程由

    52621

    技术人解读企业为什么平台化,关于数据中你不知道的事...

    本文阐述了什么是数据中、建立的原因和原则。和大家一起全面解读中,包括企业为什么平台化,目前中都有哪些形式,实施中系统的优势、面临的问题以及建议都有哪些?...中是平台化的自然演进,这种演进带来“去中心化“的组织模式,突出对能力复用、协调控制的能力,以及业务创新的差异化构建能力。为什么数据中如此重要呢,大致有以下四个原因: 1....比如以前负责数据的部门或团队往往缺乏话语权,面对业务需求往往是被动的接受的角色,这让一切数据中的想法化为泡影,需要为数据中团队授权。 其次,改变工作方式。...最合适的中是当你深入了解业务、产品、系统、组织,而且不仅了解今天在哪里,还要了解过去是怎么演变而来,未来又会怎么演化。只有当了解所有的东西之后,才能做出较好的中台架构设计。 企业为什么平台化?...大中的能力中心定位 我们在进行产品设计时,一方面考虑产品对业务支持的程度,另一方面考虑产品对其他及潜在业务支持的通用性。

    2.6K60

    进阶分布式系统架构系列(三):Zookeeper 部署(单机与集群)实践

    Zookeeper 有三种部署模式: 单机部署:一集群上运行; 集群部署:多台集群运行; 伪集群部署:一集群启动多个 Zookeeper 实例运行。 下面就介绍一下这三种模式的部署过程。...配置文件参数说明 集群部署 伪分布式部署 说明:伪分布即在一服务器上通过不同端口模拟出分布式集群的效果,分布式一般 3 起,一主两从。...:2888:3888 server.1=hadoop1:2888:3888 server.2=hadoop2:2888:3888 配置 myid mkdir /software/zk/data cd.../software/zk/data vi myid # 把 0 写到该文件的最上边,Hadoop1的就写1,Hadoop2的就写2 复制到其他节点上 若 zk 在之前就安装好了,只需修改配置文件和创建...在一个集群中,最少需要 3 。或者保证 2N + 1 ,即奇数为什么保证奇数?主要是为了举算法。 Zookeeper集群中是怎样选举leader的?

    69710

    zookeeper-3.4.10的安装配置

    环境准备 服务器集群 我准备了4虚拟机,主机名分别是hadoop01、hadoop02、hadoop03、hadoop04 虚拟机集群的准备,可以参考以下两篇文章: 在Windows中安装一Linux...虚拟机 通过已有的虚拟机克隆四虚拟机 zookeeper安装包 下载地址:http://mirrors.hust.edu.cn/apache/zookeeper/ 我用是的:zookeeper...当leader宕机,会重新选举leader,而hadoop04的角色是observer,所以它没有选举和被选举权,只负责处理请求 要求:整个zookeeper集群中可以参与选举的节点的个数为奇数个,因为...echo 1 > myid 注意:我配置的集群id信息为: server.1=hadoop01:2888:3888 server.2=hadoop02:2888:3888 server.3=hadoop03...(5) 启动集群并验证 启动集群(每个节点都要启动) zkServer.sh start 查看每个节点的状态 zkServer.sh status hadoop01、hadoop02、hadoop03的角色一定是

    1.7K40
    领券