前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Hadoop伪分布式配置

Hadoop伪分布式配置

作者头像
羊羽shine
发布于 2019-08-24 11:41:34
发布于 2019-08-24 11:41:34
75600
代码可运行
举报
文章被收录于专栏:Golang开发Golang开发
运行总次数:0
代码可运行

环境变量配置

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
export PATH=$PATH:$JAVA_HOME/bin
export HADOOP_HOME=/opt/module/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
export PATH

环境变量生效

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
~ source ~/.zshrc                        
➜  ~ hadoop version                                                                                                      
Hadoop 2.7.7
Subversion Unknown -r c1aad84bd27cd79c3d1a7dd58202a8c3ee1ed3ac
Compiled by stevel on 2018-07-18T22:47Z
Compiled with protoc 2.5.0
From source with checksum 792e15d20b12c74bd6f19a1fb886490
This command was run using /opt/module/hadoop/share/hadoop/common/hadoop-common-2.7.7.jar

HDFS

测试Hadoop自带的wordcount

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop cd $HADOOP_HOME 
➜  hadoop mkdir wcinput         
➜  hadoop cd wcinput     
➜  wcinput vim wordcount.txt
hello hadoop
hello java
hello yarn
➜  wcinput cd ../
➜  hadoop pwd
/home/baxiang/opt/module/hadoop
➜  hadoop hadoop jar  /opt/module/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar wordcount wcinput wcoutput
➜  hadoop cd wcoutput 
➜  wcoutput ls
part-r-00000  _SUCCESS
➜  wcoutput cat part-r-00000                             
hadoop  1
hello   3
java    1
yarn    1

修改core-site.xml配置文件

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cd /opt/module/hadoop/etc/hadoop
vim core-site.xml

core-site.xml增加如下内容

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<configuration>
        <!-- 指定HDFS中NameNode的地址 -->
<property>
<name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
</property>

<!-- 指定Hadoop运行时产生文件的存储目录 -->
<property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/module/hadoop/data/tmp</value>
</property>

</configuration>

修改 hdfs-site.xml 配置信息

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<configuration>
<!-- 指定HDFS副本的数量 -->
<property>
        <name>dfs.replication</name>
        <value>1</value>
</property>
</configuration>

格式化命令hdfs

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
hdfs namenode -format

格式化成功会显示如下一条信息

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
19/08/23 17:12:02 INFO common.Storage: Storage directory /opt/module/hadoop/data/tmp/dfs/name has been successfully formatted.

启动namenode

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop hadoop-daemon.sh start namenode
starting namenode, logging to /opt/module/hadoop/logs/hadoop-baxiang-namenode-baxiang.out

启动datanode

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop hadoop-daemon.sh start datanode
starting datanode, logging to /opt/module/hadoop/logs/hadoop-baxiang-datanode-baxiang.out

通过jps 查看启动状态

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop jps 
4338 RemoteMavenServer36
803 NameNode
1077 Jps
933 DataNode
3935 Main

前端界面查看

http://localhost:50070/dfshealth.html#tab-overview

为什么不能一直格式化NameNode, 格式化NameNode,会产生新的集群id,导致NameNode和DataNode的集群id不一致,集群找不到已往数据。所以,格式NameNode时,一定要先删除data数据和log日志,然后再格式化NameNode。

HDFS操作
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop hadoop fs -mkdir -p /user/baxiang/input                       
➜  hadoop hadoop fs -put /opt/module/hadoop/wcinput/wordcount.txt /user/baxiang/input
➜  hadoop hadoop fs -ls /user/baxiang/input                                          
Found 1 items
-rw-r--r--   1 baxiang supergroup         35 2019-08-23 17:30 /user/baxiang/input/wordcount.txt
➜  hadoop hadoop fs -cat /user/baxiang/input/wordcount.txt
hello hadoop
hello java
hello yarn

执行wordcount例子

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
hadoop jar /opt/module/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar wordcount /user/baxiang/input/ /user/baxiang/output
➜  hadoop hadoop fs -ls /user/baxiang/output                                                                                                         
Found 2 items
-rw-r--r--   1 baxiang supergroup          0 2019-08-23 17:33 /user/baxiang/output/_SUCCESS
-rw-r--r--   1 baxiang supergroup         31 2019-08-23 17:33 /user/baxiang/output/part-r-00000
➜  hadoop hadoop fs -text /user/baxiang/output/part-r-00000
hadoop  1
hello   3
java    1
yarn    1

http://localhost:50070/explorer.html#/user/baxiang/output

图片.png

yarn

修改yarn-site.xml

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<configuration>

<!-- Site specific YARN configuration properties -->
<!-- Reducer获取数据的方式 -->
<property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
</property>
</configuration>

修改mapred-site.xml

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop cp mapred-site.xml.template mapred-site.xml
➜  hadoop vim mapred-site.xml

mapred-site.xml配置信息如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<configuration>
<!-- 指定MR运行在YARN-->
<property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
</property>
</configuration>

启动resourcemanager和nodemanager

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop yarn-daemon.sh start resourcemanager
starting resourcemanager, logging to /opt/module/hadoop/logs/yarn-baxiang-resourcemanager-baxiang.out
➜  hadoop yarn-daemon.sh start nodemanager    
starting nodemanager, logging to /opt/module/hadoop/logs/yarn-baxiang-nodemanager-baxiang.out

查看启动状况jps

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop jps
4338 RemoteMavenServer36
803 NameNode
933 DataNode
4776 Jps
4329 ResourceManager
4621 NodeManager
3935 Main

查看界面UIhttp://localhost:8088/cluster

图片.png

删除/user/baxiang/output文件夹

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop hadoop fs -rm -R /user/baxiang/output
19/08/23 17:50:49 INFO fs.TrashPolicyDefault: Namenode trash configuration: Deletion interval = 0 minutes, Emptier interval = 0 minutes.
Deleted /user/baxiang/outp

再次执行wordcount

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop hadoop jar /opt/module/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar wordcount /user/baxiang/input/ /user/baxiang/output

图片.png

为了查看程序的历史运行情况,需要配置历史服务器。具体配置步骤如下 在 mapred-site.xml增加如下内容

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<property>
<name>mapreduce.jobhistory.address</name>
<value>localhost:10020</value>
</property>
<!-- 历史服务器web端地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>localhost:19888</value>
</property>

启动 http://localhost:19888/jobhistory

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop mr-jobhistory-daemon.sh start historyserver
starting historyserver, logging to /opt/module/hadoop/logs/mapred-baxiang-historyserver-baxiang.out
➜  hadoop jps
4338 RemoteMavenServer36
803 NameNode
6292 JobHistoryServer
933 DataNode
4329 ResourceManager
6348 Jps
4621 NodeManager
3935 Main

图片.png

将程序运行日志信息上传到HDFS系统上,增加日志聚集功能好处:可以方便的查看到程序运行详情和开发调试。增加日志功能配置如下 ➜ hadoop vim yarn-site.xml

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<!-- 日志聚集功能使能 -->
<property>
<name>yarn.log-aggregation-enable</name>
<value>true</value>
</property>

<!-- 日志保留时间设置7-->
<property>
<name>yarn.log-aggregation.retain-seconds</name>
<value>604800</value>
</property>

开启日志聚集功能,需要重新启动NodeManager 、ResourceManager和HistoryManager。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop vim yarn-site.xml  
➜  hadoop yarn-daemon.sh stop resourcemanager
stopping resourcemanager
➜  hadoop yarn-daemon.sh stop nodemanager
stopping nodemanager
nodemanager did not stop gracefully after 5 seconds: killing with kill -9
➜  hadoop mr-jobhistory-daemon.sh stop historyserver
stopping historyserver
➜  hadoop jps
4338 RemoteMavenServer36
6978 Jps
803 NameNode
933 DataNode
3935 Main

重新启动

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop yarn-daemon.sh start resourcemanager
starting resourcemanager, logging to /opt/module/hadoop/logs/yarn-baxiang-resourcemanager-baxiang.out
➜  hadoop yarn-daemon.sh start nodemanager
starting nodemanager, logging to /opt/module/hadoop/logs/yarn-baxiang-nodemanager-baxiang.out
➜  hadoop mr-jobhistory-daemon.sh start historyserver
starting historyserver, logging to /opt/module/hadoop/logs/mapred-baxiang-historyserver-baxiang.out
➜  hadoop jps
7345 NodeManager
4338 RemoteMavenServer36
803 NameNode
7636 Jps
933 DataNode
7579 JobHistoryServer
7053 ResourceManager
3935 Main

删除输出结果,再次执行wordcount

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
➜  hadoop hadoop fs -rm -R /user/baxiang/output                                                                                                       
19/08/23 18:48:28 INFO fs.TrashPolicyDefault: Namenode trash configuration: Deletion interval = 0 minutes, Emptier interval = 0 minutes.
Deleted /user/baxiang/output
➜  hadoop hadoop jar /opt/module/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar wordcount /user/baxiang/input/ /user/baxiang/output

http://localhost:19888/jobhistory

图片.png

图片.png

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019.08.23 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
推荐几个常用免费的文本转语音工具
在数字内容创作的时代,文本转语音(TTS)技术已经成为内容创作者的得力助手。无论是制作视频配音、有声读物、还是为网站增加语音功能,这些工具都能大幅提高创作效率。今天,我将为大家推荐几款优质的免费文本转语音工具,满足不同创作需求。
石臻臻的杂货铺[同名公众号]
2025/05/13
330
推荐几个常用免费的文本转语音工具
当导航念出Rap范儿,有梗有味
“主人,妲己开始为您导航;” “主人别急,这里可能被坦克堵住了;” “前方有限速摄像,限速80,疾跑技能请关闭。” “路漫漫其修远兮,路上不要玩手机;” “时刻系牢安全带,一起奔向新时代。” ...... 当游戏中妲己温柔娇美的声音在耳边响起,摇身一变成为你爱车的导航员;当导航念出Rap范儿,轻松有趣,句句是梗,你还会在为漫长旅途、各种堵车感到枯燥无味吗? 从热门游戏角色到社会名人明星语音导航、播报,这些爆火的语音功能背后都有着相同的AI技术支持:语音合成(TTS)。 01 合成能力「更进一步」
腾讯云AI
2021/07/12
6860
​技术与人文的交汇:腾讯云语音产品在提升用户体验中的应用
语音技术作为人工智能的一个重要分支,正在改变我们与设备和系统交互的方式。语音技术不仅提升了操作的便捷性,还增强了用户体验,使得各类应用更加智能化和人性化。腾讯云语音产品,包括语音合成(TTS,Text-to-Speech)和语音识别(ASR,Automatic Speech Recognition)技术,凭借其卓越的性能和广泛的应用场景,迅速赢得了市场的认可和青睐。
数字扫地僧
2024/06/30
2030
这家公司用Deepfake帮明星合成语音,让他们躺着也能赚钱
也就是说,明星本人根本不需要到场,只需要一份语料,AI就能自动将他们说话的声音、语气合成出来!
量子位
2021/06/17
1.9K0
1分钟复刻明星语音,这家AI创企开年跻身独角兽
专注于AI语音合成的ElevenLabs,刚刚完成8000万美元(约合人民币5.7亿元)B轮融资,估值超过10亿美元。
量子位
2024/01/23
3550
1分钟复刻明星语音,这家AI创企开年跻身独角兽
个性经济时代,MiniMax 语音大模型如何 To C?
大约一个月前,距离 GPT Store 上线还有两周,一位名为 Kyle Tryon 的国外开发者在个人博客上分享了其基于 ChatGPT Plus 开发的三个 Agent(又称“GPTs”),其中一个 Agent 是关于美国费城旅游出行的个人指南“PhillyGPT”,它能访问当地 SEPTA 公共交通 API,为个人提供费城当地的实时天气、旅游资讯、文艺演出活动、出行路线、公交车站与地标数据、预计抵达时间等等。
AI科技评论
2024/02/06
6650
个性经济时代,MiniMax 语音大模型如何 To C?
字节跳动Seed-TTS:AI语音合成技术的革命
hi,小伙伴们,今天的主题是研究研究TTS,最近工作内容涉及到AI视频混剪,需要进行音色合成,看一下市面上效果好又花钱少的相对成熟技术薅羊毛!
朱晓霞
2024/07/12
1K0
字节跳动Seed-TTS:AI语音合成技术的革命
文生音频新贵融资5亿,半年估值涨10倍,2年跑出一个AI独角兽!
最近,成立刚满两年的AI音频公司ElevenLabs宣布,他们获得了8000万美元的B轮融资,估值超过10亿美元!
新智元
2024/02/26
1910
文生音频新贵融资5亿,半年估值涨10倍,2年跑出一个AI独角兽!
TTS它又又又来了!17.8k Star!OpenVoice V2只需一小段参考音频即可实现高效的声音克隆!
引用下我之前写的TTS文章中的话,2023年被大家称为人工智能元年,而在2024年的当下人工智能技术已然在各行各业都展露头角。各种AI工具也层出不穷,其中 语音克隆技术 也是尤为引人瞩目的产品之一。
Python兴趣圈
2024/04/26
1.8K0
TTS它又又又来了!17.8k Star!OpenVoice V2只需一小段参考音频即可实现高效的声音克隆!
【AGI-Eval行业动态】OpenAI 语音模型三连发,AI 语音进入“声优”时代
美东时间 3 月 20 日,OpenAI 发布了三款全新语音模型,分别是自动语音识别模型(ASR) GPT - 4o Transcribe 和 GPT - 4o Mini Transcribe,以及语音合成模型(TTS) GPT - 4o Mini TTS。
AGI-Eval评测社区
2025/04/08
1840
【AGI-Eval行业动态】OpenAI 语音模型三连发,AI 语音进入“声优”时代
自媒体神器!油管视频一键全自动搬运!帮你生成Netflix级字幕翻译,还可个性化配音!
在视频内容创作中,视频的字幕和配音质量对观众体验至关重要。而对于那些需要跨语言传播的视频内容来说,字幕和配音的质量更加不可忽略。
Python兴趣圈
2024/08/29
1.1K0
自媒体神器!油管视频一键全自动搬运!帮你生成Netflix级字幕翻译,还可个性化配音!
声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷
你可能已经和 OpenAI 版《Her》展开过对话,也可能询问过其他语音助手一些问题。它们都有各自的优缺点,有选择困难症的小伙伴可能犯难了,到底该选择哪一款呢?
机器之心
2025/03/17
1410
声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷
数据万象音视频处理 —— 打开对声音的想象,开启AI创作时代
“前方路口请直行”、“限速100”、“前方路段拥堵”等,是不是看到这些导航常用语句,脑海中已经有您常听的声音浮现了?导航播报所使用的TTS语音合成技术的商业化道路从有声听书、银行智能客服覆盖到虚拟人配音、残障人士辅助应用等,用户需求来源多样,应用场景逐步细化和专业,在这众多的行业所孕育出的应用场景中,TTS语音合成技术大幅减少文字转为语音的时间与企业用工成本的同时,也为用户带来由AI创作赋予的全新体验,语音合成模型经过长时间的发展,由最初的基于拼接合成,到参数合成,逐渐达到了感情充沛、高流畅度、个性化的现阶
云存储
2022/06/29
6320
数据万象音视频处理 —— 打开对声音的想象,开启AI创作时代
两分钟录音就可秒变语言通!火山语音音色复刻技术如何修炼而成?
先来欣赏一段音视频,或许你会有惊喜发现呢? 没错,这就是动漫海绵的配音模仿者的声音呈现。 不同的是,这位即将奔四的美国喜剧动画主角,如今在模仿者的演绎下一改往日的单一语言以及固定风格,居然一股脑儿说出了译制腔、TVB腔、粤语甚至上海话。 更重要的一点,所有风格以及语言,都是基于一段仅仅两分钟时长的纯中文音频训练而成。 话说两分钟时长的音频究竟可以包含多少内容? 经过语音方向的专业人士估算,基本等同于人们正常语速说出的20句话的内容量。 而这样既能保留本尊音色,又能实现多风格多语种无缝切换的“神奇语音”,还要
量子位
2022/08/26
1K0
两分钟录音就可秒变语言通!火山语音音色复刻技术如何修炼而成?
AI配音版Sora视频刷屏!绝美逼真音效打破「无声电影」,或颠覆万亿美元产业
虽然一些人不想承认,但AI视频模型Sora的开年王炸,确实给影视行业带来了颠覆性的影响!
新智元
2024/02/26
1990
AI配音版Sora视频刷屏!绝美逼真音效打破「无声电影」,或颠覆万亿美元产业
【AI落地应用实战】文本生成语音Parler-TTS + DAMODEL复现指南
这里我要推荐的【好事】文章是如何从零构建一个现代深度学习框架,2024年可以说是大模型发展迅速的一年,国内的国际的各大厂商都推出了多种场景的大模型,那么作为小白,虽然不是大模型从业者,但是也想了解一下大模型这样的深度学习框架到底是怎么来的,是如何构建的呢?可以看这篇文章:
中杯可乐多加冰
2024/11/12
4510
语音领域的GPT时刻:Meta 发布「突破性」生成式语音系统,一个通用模型解决多项任务
我们知道,GPT、DALL-E 等大规模生成模型彻底改变了自然语言处理和计算机视觉研究。这些模型可以生成高保真文本或图像,而且它们有个重要特点就是「通才」,可以解决没训过的任务。相比之下,语音生成模型在规模和任务泛化方面一直没有「突破性」成果。
机器之心
2023/08/07
4120
语音领域的GPT时刻:Meta 发布「突破性」生成式语音系统,一个通用模型解决多项任务
“AI孙燕姿”爆火后,Meta发布通用语音生成AI:可合成6种语言,支持多种语音功能
近日,Meta AI 宣布在生成式 AI 语音模型领域取得了突破:开发出了首个可泛化至多种语音生成任务的模型 Voicebox,无需专门训练即可达成顶尖性能表现。Meta AI 研究人员分享了多段音频样本和一篇研究论文,其中详细介绍了他们采用的方法和取得的成果。
深度学习与Python
2023/08/09
5220
“AI孙燕姿”爆火后,Meta发布通用语音生成AI:可合成6种语言,支持多种语音功能
打工人必藏!60+AI黑科技开挂工具箱:从智能管家到灵感核爆
人工智能(AI)工具已经成为我们日常生活和工作中不可或缺的一部分,它们不仅显著提高了工作效率,还为创意和创新开辟了新的可能性。小编特地整理了60+的AI工具提供给大家使用,包含视频与图像编辑工具、搜索引擎、应用构建、市场营销工具、销售工具、客户服务工具、简历构建建工具等。
AI.NET 极客圈
2025/03/20
1490
打工人必藏!60+AI黑科技开挂工具箱:从智能管家到灵感核爆
安利免费开源的声音克隆、文本转语音整合包软件、一键本地安装!
大家好,我是星哥,今天给大家介绍两款声音克隆、文本转语音的软件,一个是ChatTTS和Spark-TTS,并且都有一键安装包,让你无需复杂的配置,就能在本地轻松体验声音的魅力。
星哥玩云
2025/04/02
5650
安利免费开源的声音克隆、文本转语音整合包软件、一键本地安装!
推荐阅读
推荐几个常用免费的文本转语音工具
330
当导航念出Rap范儿,有梗有味
6860
​技术与人文的交汇:腾讯云语音产品在提升用户体验中的应用
2030
这家公司用Deepfake帮明星合成语音,让他们躺着也能赚钱
1.9K0
1分钟复刻明星语音,这家AI创企开年跻身独角兽
3550
个性经济时代,MiniMax 语音大模型如何 To C?
6650
字节跳动Seed-TTS:AI语音合成技术的革命
1K0
文生音频新贵融资5亿,半年估值涨10倍,2年跑出一个AI独角兽!
1910
TTS它又又又来了!17.8k Star!OpenVoice V2只需一小段参考音频即可实现高效的声音克隆!
1.8K0
【AGI-Eval行业动态】OpenAI 语音模型三连发,AI 语音进入“声优”时代
1840
自媒体神器!油管视频一键全自动搬运!帮你生成Netflix级字幕翻译,还可个性化配音!
1.1K0
声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷
1410
数据万象音视频处理 —— 打开对声音的想象,开启AI创作时代
6320
两分钟录音就可秒变语言通!火山语音音色复刻技术如何修炼而成?
1K0
AI配音版Sora视频刷屏!绝美逼真音效打破「无声电影」,或颠覆万亿美元产业
1990
【AI落地应用实战】文本生成语音Parler-TTS + DAMODEL复现指南
4510
语音领域的GPT时刻:Meta 发布「突破性」生成式语音系统,一个通用模型解决多项任务
4120
“AI孙燕姿”爆火后,Meta发布通用语音生成AI:可合成6种语言,支持多种语音功能
5220
打工人必藏!60+AI黑科技开挂工具箱:从智能管家到灵感核爆
1490
安利免费开源的声音克隆、文本转语音整合包软件、一键本地安装!
5650
相关推荐
推荐几个常用免费的文本转语音工具
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档