开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

hadoop + ambari群集更改配置

Hadoop是一个开源的分布式计算框架，用于处理大规模数据集的存储和分析。Ambari是Hadoop生态系统中的一个管理工具，用于简化Hadoop集群的部署、管理和监控。

群集更改配置是指在Hadoop集群中修改配置参数，以满足特定需求或优化集群性能。这可以通过Ambari进行操作，以下是完善且全面的答案：

Hadoop集群配置：
- Hadoop集群由多个节点组成，包括主节点（NameNode）和从节点（DataNode）。主节点负责管理文件系统和任务调度，从节点存储和处理数据。
- 配置文件位于Hadoop集群的主节点上，包括核心配置文件（core-site.xml）、HDFS配置文件（hdfs-site.xml）、YARN配置文件（yarn-site.xml）等。

Ambari的作用：
- Ambari提供了一个用户友好的Web界面，用于集中管理Hadoop集群的配置、监控和维护。
- 通过Ambari，管理员可以轻松地添加、删除和管理集群节点，监控集群的健康状况，并对集群进行配置更改。
群集更改配置的步骤：
- 登录Ambari的Web界面，选择要更改配置的Hadoop集群。
- 导航到“服务”选项卡，选择要更改配置的服务（如HDFS、YARN等）。
- 在服务配置页面，可以更改各种配置参数，如副本数量、块大小、内存分配等。
- 提交更改后，Ambari会自动将新的配置应用到集群中的所有节点，并触发相应的服务重启。
Hadoop集群配置的优势：
- 分布式存储和计算：Hadoop集群可以将大规模数据分散存储在多个节点上，并并行处理数据，提高处理效率。
- 容错性：Hadoop集群具有高度容错性，即使某个节点发生故障，集群仍然可以继续正常运行。
- 可扩展性：Hadoop集群可以根据需求进行水平扩展，通过添加更多的节点来处理更大规模的数据。
Hadoop集群的应用场景：
- 大数据处理和分析：Hadoop集群适用于处理大规模的结构化和非结构化数据，如日志分析、数据挖掘和机器学习等。
- 数据仓库：Hadoop集群可以用作数据仓库，存储和管理企业的大量数据。
- 实时数据处理：通过与其他工具（如Apache Spark和Apache Flink）结合使用，Hadoop集群可以实现实时数据处理和流式计算。
腾讯云相关产品和产品介绍链接地址：
- 腾讯云Hadoop产品：https://cloud.tencent.com/product/emr
- 腾讯云Ambari产品：https://cloud.tencent.com/product/ambari

请注意，以上答案仅供参考，具体的配置和产品推荐可能会因实际情况而有所不同。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

CDP-DC中部署Knox

Apache Knox网关（“ Knox”）是一种在不降低Hadoop安全性的情况下将Apache™Hadoop®服务的覆盖范围扩展到Hadoop群集之外的用户的系统。Knox还为访问群集数据和执行作业的用户简化了Hadoop安全性。Knox网关被设计为反向代理。

03

Kerberos基本概念及原理汇总

强大的身份验证和建立用户身份是Hadoop安全访问的基础。用户需要能够可靠地“识别”自己，然后在整个Hadoop集群中传播该身份。完成此操作后，这些用户可以访问资源（例如文件或目录）或与集群交互（如运行MapReduce作业）。除了用户之外，Hadoop集群资源本身（例如主机和服务）需要相互进行身份验证，以避免潜在的恶意系统或守护程序“冒充”受信任的集群组件来获取数据访问权限。

02

Ambari？自动部署Hadoop集群

Ambari 跟 Hadoop 等开源软件一样，也是 Apache Software Foundation 中的一个项目，并且是顶级项目。就 Ambari 的作用来说，就是创建、管理、监视 Hadoop 的集群，但是这里的 Hadoop 是广义，指的是 Hadoop 整个生态圈（例如 Hive，Hbase，Sqoop，Zookeeper 等）。它帮助我们更好的去管理Hadoop集群相关的服务，也支持一些扩展，可以让我们去定制一些服务。你是不是为了配置hadoop集群伤透了脑筋？为了集群添加机器而头痛。如果你遇到了Ambari你就会发现，原来他就是你的救世主。 Ambari 自身也是一个分布式架构的软件，主要由两部分组成：Ambari Server 和 Ambari Agent。简单来说，用户通过 Ambari Server 通知 Ambari Agent 安装对应的软件；Agent 会定时地发送各个机器每个软件模块的状态给 Ambari Server，最终这些状态信息会呈现在 Ambari 的 GUI，方便用户了解到集群的各种状态，并进行相应的维护。 Ambari的详细介绍及相关信息可以浏览下面的网址，虽然他很NB，但是不是我们今天的重点！ Ambari——大数据平台的搭建利器

03

【大数据版本对比】Hortonworks HDP2.x到3.x技术演进及版本梳理

针对近期搭建HDP3.1.4版本大数据集群，相较之前研究的HDP2.6.3版本，版本跨度大，为更好的了解掌握新版本的新特性，于是对两个版本及区间版本的技术演进做下梳理。

04

看完您如果还不明白 Kerberos 原理，算我输！

强大的身份验证和建立用户身份是 Hadoop 安全访问的基础。用户需要能够可靠地 “识别” 自己，然后在整个 Hadoop 集群中传播该身份。完成此操作后，这些用户可以访问资源（例如文件或目录）或与集群交互（如运行 MapReduce 作业）。除了用户之外，Hadoop 集群资源本身（例如主机和服务）需要相互进行身份验证，以避免潜在的恶意系统或守护程序 “冒充” 受信任的集群组件来获取数据访问权限。

07

ambari系列--报错问题

hbase 启动不起来，通常是因为节点日期不同步。 HDFS 无法启动，通常是因为hdfs 进入了安全模式，需要先退出来，再启动。

01

docker-9：使用ambari-2.7.3部署大数据集群—两节点demo

git clone https://github.com/hepyu/docker-ambari-2.7.git

02

hadoop发行商介绍：Hortonworks

‍‍ Hadoop是开源的，但是企业版本其实是由几家大的公司把持，这个就类似li‍‍nu‍‍x的redhat和suse一样，提供hadoop发型版本的公司主要的有Hortonworks，Cloudera，mapR。‍‍‍‍ ‍‍ 今天简单介绍Hortonworks： ‍‍ ‍‍ ‍‍ 先了解下Hortonworks的起源，Hortonworks公司，由Yahoo和Benchmark Capital‍‍于2011年7月联合创建，出身于名门Yahoo，Hortonworks拥有着许多Hadoo

06

Ambari架构源码解析

Ambari是hadoop分布式集群配置管理工具，是由hortonworks主导的开源项目。它已经成为apache基金会的孵化器项目，已经成为hadoop运维系统中的得力助手，引起了业界和学术界的关注。

02

大数据平台HDP搭建

在ambari的setup中我们可以选择使用默认的postgresql，也可以自定义使用其他数据库，此处选用mariadb，便于后期管理维护

08

【上进小菜猪】使用Ambari提高Hadoop集群管理和开发效率:提高大数据应用部署和管理效率的利器

Hadoop是一种开源的分布式处理框架，用于在一组低成本硬件的集群上存储和处理大规模数据集。Ambari是一种基于Web的管理工具，用于轻松管理和监控Hadoop集群。在本文中，我们将探讨如何使用Ambari在Hadoop集群上运行应用程序，包括编写示例代码并将其部署到集群中。

02

使用Ambari搭建HDP集群完全参考手册

使用 ambari 来搭建 hdp 集群，前前后后搭了不下10遍，之前一直没有完整的总结整个过程，最近有空正好记录一下。

01

Ambari在离线环境中安装Hadoop集群顶

如果手工安装Hadoop集群,在管理和后继部署中，越来越多的问题不断出现，主要如下：

05

Ambari + HDP 整体介绍

Ambari 是 hortonworks推出的管理监控Hadoop集群的Web工具，此处的Hadoop集群不单单指Hadoop集群，而是泛指hadoop 整个生态，包括Hdfs，yarn,Spark,Hive,Hbase,Zookeeper，druid等等，管理指的是可以通过Ambari对整个集群进行动态管理，包括集群的部署，修改，删除，扩展等，监控指Ambari实时监控集群的运行状况，包括运行内存，剩余内存，CPU使用率，节点故障等。所以通过Ambari可以简化对集群的管理和监控，让开发者更多的聚焦与业务逻辑。 Ambari + HDP介绍： Ambari：WEB应用程序，后台为Ambari Server，负责与HDP部署的集群工作节点进行通讯，集群控制节点包括Hdfs，Spark，Zk，Hive，Hbase等等。 HDP：HDP包中包含了很多常用的工具，比如Hadoop，Hive，Hbase，Spark等 HDP-Util：包含了公共包，比如ZK等一些公共组件。老的集群部署方式： 1. 集群配置(免密登陆，静态IP，防火墙) 2. JDK，MySql 部署 (Hive相关表结构管理，如果没有用到Hive，无需安装) 3. Hadoop Hdfs 部署(修改配置) (分布式文件存储) 4. Hadoop Yarn 部署(修改配置) (MapReduce 任务调度) 5. (可选) Zookeeper部署，需要修改NameNode 和 ResourceManager 的配置文件 6. Hive 部署 (数据仓库，对Hdfs上保存的数据进行映射管理) 7. HBase 部署 (NoSQL数据库，进行数据存储) 8. (可选) Flume，Sqoop 部署(主要用于数据采集，数据迁移) 9. Spark 部署 (计算框架部署) 10. 后面还需要部署监控框架等等，部署准备：MySql,JDK,Hadoop,Hive,HBase,Zookeeper,Spark,Flume,Sqoop等部署缺点：以上全部部署都是通过命令行来部署，麻烦复杂，容易出错，动态扩展较难，无集群监控部署优点：整体可控，对集群内部运行逻辑比较清楚，只部署需要的服务，所以对集群要求(内存，CPU及硬盘) 可以不是很高 Ambari 集群部署方式： 1. 集群配置(免密登陆，静态IP，防火墙) 2. JDK，MySql 部署 (需要配置Ambari，Hive，Hbase等多张表) 3. 部署Ambari 服务 4. 通过Ambari Web工具部署Hdfs，Spark，Hive，Zk，Hbase，Flume等，想怎么部署就怎么部署，鼠标选择服务和需要部署的节点即可 5. 通过Ambari Web工具进行集群监控，并且对警告及错误进行处理部署准备：MySql,JDK,Ambari,HDP,HDP-Util，和上面老的部署方式相比，是不是少了很多部署注意事项：通过Ambari部署集群对集群节点机器要求比较高，因为有好多关于AmbariServer服务会部署在同一个管理节点上，同时其他集群节点也会同时部署很多其他服务，这对节点的配置(CPU，内存，硬盘)要求比较高，可能运行不起来。部署优点：部署简单，一键部署，方便监控，方便扩展，多集群同时管理 Ambari 部署步骤： 1. 单节点:Ntp,java,selinux,hosts,hostname,ip 2. 克隆节点，修改ip及hostname 3. 安装mysql，配置免密登陆 4. 安装httpd，配置本地ambari+HDP 的yum源 5. Ambari Server安装及初始化 6. Ambari Server 通过向导安装集群 7. Ambari 使用介绍 8. Hdfs HA的高可用 9. 接下来就可以根据我们的需求使用集群了，这部分后面会有专门章节针对Hadoop MR 和Spark进行详细解读。

01

Ambari自定义服务干货

“ ambari自定义服务干货，非常干的那种”

04

OushuDB入门（三）——高可用篇

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/80194003

02

将数据迁移到CDP 私有云基础的数据迁移用例

您可以使用 authzmigrator 工具将 Hive 对象和 URL 权限以及 Kafka 权限从 CDH 集群迁移到 CDP 私有云基础集群。您可以使用 DistCp 工具将 HDFS 数据从安全的 HDP 集群迁移到安全或不安全的CDP 私有云基础集群。

02

Ambari安装指南顶

Ambari 跟 Hadoop 等开源软件一样,也是 Apache Software Foundation 中的一个项目,并且是顶级项目.目前最新的发布版本是 2.1.2. 就 Ambari 的作用来说,就是创建,管理,监视 Hadoop 的集群,但是这里的 Hadoop 是广义,指的是 Hadoop 整个生态圈(例如 Hive,Hbase,Sqoop,Zookeeper 等),而并不仅是特指 Hadoop. 用一句话来说,Ambari 就是为了让 Hadoop 以及相关的大数据软件更容易使用的一个工具. 说到这里,大家就应该明白什么人最需要 Ambari 了.那些苦苦花费好几天去安装,调试 Hadoop 的初学者是最能体会到 Ambari 的方便之处的. 而且,Ambari 现在所支持的平台组件也越来越多,例如流行的 Spark,Storm 等计算框架,以及资源调度平台 YARN 等,我们都能轻松地通过 Ambari 来进行部署. Ambari 自身也是一个分布式架构的软件,主要由两部分组成:Ambari Server 和 Ambari Agent.简单来说,用户通过 Ambari Server 通知 Ambari Agent 安装对应的软件; Agent 会定时地发送各个机器每个软件模块的状态给 Ambari Server,最终这些状态信息会呈现在 Ambari 的 GUI,方便用户了解到集群的各种状态,并进行相应的维护.

03

分享一下我对 ambari 二次开发的一些理解~

安装过 hadoop 集群的人都应该清楚，hadoop 生态从安装、配置到后期运维是一个非常艰辛的过程，一般来说安装 hadoop 可能就需要几天时间，运维一个小型集群同样需要几个人。ambari 和 cloudera Manager 这两个系统，目的就是简化 hadoop 生态集群的安装、配置，同时提高 hadoop 运维效率，以及对 hadoop 集群进行监控。

08

Ambari——大数据平台的搭建利器

Ambari 是什么 Ambari 跟 Hadoop 等开源软件一样，也是 Apache Software Foundation 中的一个项目，并且是顶级项目。目前最新的发布版本是 2.0.1，未来不久将发布 2.1 版本。就 Ambari 的作用来说，就是创建、管理、监视 Hadoop 的集群，但是这里的 Hadoop 是广义，指的是 Hadoop 整个生态圈（例如 Hive，Hbase，Sqoop，Zookeeper 等），而并不仅是特指 Hadoop。用一句话来说，Ambari 就是为了让

09

平台安装--ambari安装

baseurl=http://192.168.199.50/ambari/centos7/

03

[大数据架构 ]Apache大数据项目目录

在使用BigData大约8年以上之后，我遇到了大量的项目。Esp Apache的运动对于BigData域非常强大。每个人都会提出一个针对特定解决方案的项目。但是，由于有这么多项目出现，我找不到一个可以查看它们的地方。所以，这就是这个页面背后的灵感。一站式，查看所有Apache BigData项目。当然，这个页面需要不断更新。如果您发现任何项目缺失，请发表评论

02

Ambari-整体介绍

多机部署问题，当集群规模增加后，机器出问题机率增加，在部署或更新中可能会出现机器故障

03

手动搭建Hadoop分布式集群

相比Cloudera Manager的安装方式，手动搭建Hadoop分布式集群能让我们了解Hadoop的详细配置，有利于我们学习HDFS和YARN的工作原理，初学者可以尝试这种方式。

02

OushuDB入门（一）——安装篇

OushuDB是由Apache HAWQ创始团队基于HAWQ打造的新一代数据仓库(New Data Warehouse)。该产品采用了存储与计算分离技术架构，具有MPP的所有优点，还具有弹性，支持混合工作负载和高扩展性等优点。作为HAWQ的增强版，OushuDB遵循ANSI-SQL标准，兼容Oracle、Greenplum Database和PostgreSQL，提供PB级数据交互式查询能力，提供对主要BI工具的描述性分析和AI支持。

02

在 Docker 上建立多节点的 Hadoop 集群

在上篇文章中你已经看到了在你的devbox创建一个单点Hadoop 集群是多么简单。

01

监控hadoop生态系统企业应该用什么监控软件

问题导读 1.文中哪些监控软件有邮件通知功能？ 2.监控粒度更细如何自定义实现？ 3.哪些监控软件可以自定义？企业转型大数据，随着发展，可能会遇到很多的问题。该如何知道磁盘的使用情况；遇到问题，该如何及时的报警通知。该如何知道各个组件的运行情况，各自暂用内存、磁盘、网络使用等，都可能是我们想获取的。由于监控软件，粒度比较粗，想定制监控内容，该如何定制，获取某个进程的信息.由于每个企业需求不一样，经常有些初学者想了解或则提问，我们到底该用哪个监控软件好。这里整合、统计一些监控软件的一些用途，大家可以选择

07

Ambari HDP集群搭建全攻略「建议收藏」

Apache Ambari是一种基于Web的工具，支持Apache Hadoop集群的供应、管理和监控。

04

Ambari介绍

多机部署问题，当集群规模增加后，机器出问题机率增加，在部署或更新中可能会出现机器故障

02

ambari安装指南

（一）准备工作 1、准备几台机器 10.1.51.100 ambariserver 本地mirrorserver及ambari server都在这一台机器 10.1.51.10 master 10.1.51.11 slave1 10.1.51.12 slave2 2、都创建管理用户hadoop 3、做ssh免密码登录(ambariserver到其他机器的，hadoop用户) ssh-keygen cd .ssh cat id_rsa.pub >> authorized_keys chmod 700 ~/.ssh chmod 600 ~/.ssh/authorized_keys 注意，免密码一定要互相登陆一次，让他记住密码 4、设置sudo免密码(hadoop用户)---后续所有操作都在hadoop用户下去做在各节点上进入root: visudo 加入如下内容： hadoop ALL=(ALL) NOPASSWD: ALL 5、Maximum Open File Descriptors(10000) 检查语句 ulimit -Sn ulimit -Hn sudo vi /etc/security/limits.conf @hadoop soft nproc 262144 @hadoop hard nproc 262144 @hadoop soft nofile 262144 @hadoop hard nofile 262144 sudo vi /etc/security/limits.d/90-nproc.conf @hadoop soft nproc 262144 以上改动重启才能生效，最好同时执行ulimit -u 10240 命令，是其立即生效。（ulimit 命令很多啊） 6、Check Existing Package Versions 7、Set up Service User Accounts(设置服务用户账户) http://docs.hortonworks.com/HDPDocuments/Ambari-2.0.0.0/Ambari_Doc_Suite/ADS_v200.html#ref-70627b43-7d78-4cbb-8df8-e3f43cbd8422 hdp的各个服务运行在不同的linux账户下，如果你创建了这些账户，ambari就会直接用，否则他会自动创建，但是自动创建的用户不知道密码是什么，但是还是可以 sudo su hdfs进入到这些用户下，不过这样就不方便了。比较好的办法是自己创建的账户，使用ambari安装组件时选择自定义账户即可(UID >= 1000)。 8、Enable NTP on the Cluster and on the Browser Host 集群各节点，包括安装ambari webui的机器都得开启ntp服务已同步时间，如果有条件，局域网应该有ntp服务器 To check that the NTP service is on, run the following command on each host:chkconfig --list ntpd To set the NTP service to start on reboot, run the following command on each host:chkconfig ntpd on To turn on the NTP service, run the following command on each host:service ntpd start 9、Check DNS(可以选择10) 集群所有机器必须配置正向和反向DNS,如果条件不允许，就设置/etc/hosts文件，每个节点都得改 10、/etc/hosts 1.2.3.4 <fully.qualified.domain.name> //一行一个注意：这两行千万不要删除 127.0.0.1 localhost.localdomain localhost ::1 localhost6.localdomain6 localhost6 vi /etc/sysconfig/network NETWORKING=yesNETWORKING_IPV6=yes HOSTNAME=<fully.qualified.domain.name> 11、关闭防火墙 12、Disable SELinux and PackageKit and check the umask Value set SELINUX=disabled in /etc/selinux/config sudo vi /etc/yum/pluginconf.d/refresh-packagekit.conf 设置：enabled=0 Ambari supports a umask value

08

大数据平台搭建神器，Ambari HDP集群搭建全攻略

Apache Ambari是一种基于Web的工具，支持Apache Hadoop集群的供应、管理和监控。

05

Ambari实战-1:Ambari使用场景及介绍

本篇文章主要讲解Ambari的一些基础知识，让大家对Ambari有一个潜意识的认识。

09

HAWQ技术解析（二） —— 安装部署

本文介绍了从Ambari迁移到HDP的步骤和注意事项。主要包括了升级前检查、配置迁移、数据迁移、应用迁移、高可用和性能优化、验证和测试、以及常见问题。

05

centos6环境下使用yum安装Ambari

Ambari是apache下面的开源项目，主要通过web UI方式对Hadoop集群进行统一创建和管理，以节省Hadoop集群的运维成本。本文通过安装过程中的截图简要介绍一下相关步骤供需要的朋友参考。

02

零基础搭建分布式集群的几个方法

大家好，许久没更新了，这段时间忙着换工作和交接过度（对，换工作了）；另一方面，这段时间试着搭建了一下分布式集群，本来打算跟大家详细分享一下，由于是零基础，中间还有好多没弄清楚，所以先简单分享几种安装思路：搭建Hadoop、Spark分布式集群，前面的几步一样：装虚拟机，我用的是Vmware Workstation，装Ubuntu或CentOS系统；开启系统的root用户；复制若干台虚拟机；每台都安装ssh，实现这若干台虚拟机的免密码通信。之后：你可以纯手动来安装、利用Ambari半自动安装、或

05

hdp 不更新了，有没有办法将 Apache Hadoop 代替 hdp 并集成到 Ambari 中呢？

今天咱来聊一聊 Ambari 如何集成 Apache Hadoop 哈，自从 cloudera 公司将 hortonworks 公司收购后，hdp 就不迭代更新了，这对 Apache Ambari 也产生了很大影响，毕竟 Ambari 与 hdp 耦合性很强。

04

玩转企业云计算平台系列（十七）：Openstack 大数据项目 Sahara

2013年4月，OpenStack社区知名厂商Mirantis正式宣布了基于OpenStack的开源BDaaS（BigData-as-a-Service）项目——Sahara（原名Savanna），正式开始了在OpenStack上构建大数据服务能力的努力。

01

用户画像大数据环境搭建——从零开始搭建实时用户画像(四)

本章我们开始正式搭建大数据环境，目标是构建一个稳定的可以运维监控的大数据环境。我们将采用Ambari搭建底层的Hadoop环境，使用原生的方式搭建Flink，Druid，Superset等实时计算环境。使用大数据构建工具与原生安装相结合的方式，共同完成大数据环境的安装。

01

ambari系列--报错问题2

ambari HDFS-HA 回滚查看hdfs的信息 curl -u admin:admin -H "X-Requested-By: ambari" -X GET http://centos1:8

02

24 Jul 2018 hdp安装及使用问题汇总（二）

1）某些服务或子服务启动失败时，如果重启所有服务后依然失败，进入Ambari Hosts页面，单独在节点启动服务或子服务试试，如果还是启动失败，进入/var/log目录查看相应服务的日志。

02

HUE配置与各服务集成使用

特别说明：该专栏文章均来源自微信公众号《大数据实战演练》，欢迎关注！

01

眼前一亮的大数据毕业设计来咯~

好多人问我，这种「基于大数据平台的xxxx」的毕业设计要怎么做。这个可以参考之前写得关于我大数据毕业设计的文章大数据方向毕业设计，选题和实现思路。这篇文章是将对之前的毕设进行优化。

02

CM+CDH 整体介绍

大数据平台的开发环境搭建，我们前面已经说过了，需要搭建Hdfs，Yarn，Spark，HBase，Hive，ZK等等，在开发环境下搭建是用于开发测试的，全部部署在VM 虚拟机里面，小数据量小运算量还可以，数据量运算量一旦上来，虚拟机是玩不转的，这就牵涉到生产环境的Hadoop的生态搭建，难道也需要我们一步一步来搭建吗？几台还可以，那么上百台呢？难道也需要一台台搭建吗？显然不可以，有没有什么好的Hadoop生态的搭建工具呢？国外有俩家企业做了这些事，hortonworks公司推出的Ambari+HDP套件和 Cloudrea公司推出的 CM+CDH 套件，不过这俩家公司 18年底合并了,不过这并不影响我们的使用。 2. CM+CDH介绍 CM是Cloudrea Manager的简称，是Cloudrea 提供的生产环境的Hadoop 生态部署工具，工具套件为CM+CDH,CM负责监控动态管理及部署Hadoop生态服务，CDH里面包含了绝大多数的Hadoop生态中的服务，包含Hdfs，Yarn，ZK，Hive，Hbase，Flume，Sqoop，Spark等。整体上与前面说所得Ambari + HDP类似。 CM+CDH有免费版和收费版，收费版当然功能更加强悍，比如支持回滚，滚动升级，支持Kerberos，SAML/LDAP支持，SNMP支持，自动化备份和灾难恢复，不过在我们看来，免费版已经够我们使用了。这里简单和Ambari + HDP对已一下，CDH在部署Hadoop生态上，整体与HDP类似，通过WEB端动态部署Hadoop生态， Name Web Server Tools hortonworks Ambari HDP HDP-Util Cloudrea CM CDH CDH-Util CM+CDH套件组成 CM：WEB应用程序，后台为Ambari Server，负责与HDP部署的集群工作节点进行通讯，集群控制节点包括Hdfs，Spark，Zk，Hive，Hbase等等。 CDH：HDP包中包含了很多常用的工具，比如Hadoop，Hive，Hbase，Spark等 CDH-Util：包含了公共包，比如ZK等一些公共组件。 3. CM+CDH 部署

01

盘点Hadoop让人讨厌的12件事

1. Pig vs. Hive 你在 Pig 里用不了 Hive UDFS。在 Pig 中你必须用 HCatalog 来访问 Hive 表。你在 Hive 里用不了Pig UDFS。在 Hive 中无

08

这12件事让我很讨厌Hadoop

文章作者Andrew C. Oliver是一位专业的软件顾问，同时还是北卡罗来纳州达勒姆大数据咨询公司Open Software Integrators的总裁和创始人。长时间的使用Hadoop，他发现

08

安装 Ambari 2.6.0 + HDP 2.6.3 搭建Hadoop集群（CentOS7）简明版

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4

03

hue 3.12 安装及组件配置

示例基于Centos7安装Hue,安装前需要安装大量的软件和包，因为python和c必须的依赖包

04

Ambari2.6安装部署Hadoop2.7

Apache Ambari是一种基于Web的工具，支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件，包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop和Hcatalog等。Apache Ambari 支持HDFS、MapReduce、Hive、Pig、Hbase、Zookeper、Sqoop和Hcatalog等的集中管理。也是5个顶级hadoop管理工具之一。Ambari能够安装安全的（基于Kerberos）Hadoop集群，以此实现了对Hadoop 安全的支持，提供了基于角色的用户认证、授权和审计功能，并为用户管理集成了LDAP和Active Directory。

02

Ambari部署及hdp部署的疑难问题解答汇总

以下，都是收集于网友、群友安装 ambari 或部署 hdp 集群时出现的问题，挤时间写了个疑难问题解答汇总，希望能够快速帮小伙伴们定位解决问题。觉得文章靠谱的小伙伴，希望能转发、点赞、在看三连走一波~

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭