前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >hadoop伪分布式之配置yarn并运行MR程序(WordCount)

hadoop伪分布式之配置yarn并运行MR程序(WordCount)

作者头像
西西嘛呦
发布2020-08-26 10:02:12
发布2020-08-26 10:02:12
67300
代码可运行
举报
运行总次数:0
代码可运行

1、配置集群

(1)在yarn-env.sh中配置JAVA_HOME

export JAVA_HOME=/opt/module/jdk1.8.0_11

(2)在yarn-site.xml中配置

代码语言:javascript
代码运行次数:0
运行
复制
<!--Reducer获取数据的方式-->
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>
<!--指定yarn的ResourceManager的地址-->
<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop01</value>
</property>

(3)配置mapred-env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_11

(4)将mapred-site.xml.template重命名为mapred-site.xml

mv mapred-site.xml.template mapred-site.xml

并配置:

代码语言:javascript
代码运行次数:0
运行
复制
<!--指定MR运行在yarn上-->
<property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
</property>

二、启动集群

确保NameNode和DataNode已经启动,用jps查看,若没启动,则进行启动(在hadoop-2.9.2目录下)

sbin/hadoop-daemon.sh start namenode

sbin/hadoop-daemon.sh start datanode

(1) 启动ResourceManager

sbin/yarn-daemon.sh start resourcemanager

(2)启动NodeManager

sbin/yarn-daemon.sh start nodemanager

systemctl status firewalld.service查看防火墙状态

systemctl stop firewalld.service 关闭运行的防火墙

(3) 查看集群

(4)执行WordCount

之前操作参考:https://cloud.tencent.com/developer/article/1686067

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.2.jar wordcount /user/gong/input /user/gong/output

然后就可以看到:

在控制台:

在50070端口:

删除应用:sh yarn application -kill jobId

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-03-02 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档