Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Hadoop数据分析平台实战——030Hadoop Shell命令02(熟悉linux跳过)离线数据分析平台实战——030Hadoop Shell命令02

Hadoop数据分析平台实战——030Hadoop Shell命令02(熟悉linux跳过)离线数据分析平台实战——030Hadoop Shell命令02

作者头像
Albert陈凯
发布于 2018-04-08 03:01:56
发布于 2018-04-08 03:01:56
7090
举报
文章被收录于专栏:Albert陈凯Albert陈凯

离线数据分析平台实战——030Hadoop Shell命令02

hdfs命令

hdfs命令是hadoop提供的操作HDFS分布式文件系统的shell命令客户端, 我们可以通过该命令对分布式文件系统进行文件的增删查操作, 也可以通过该命令获取到一些hadoop的相关配置信息, 而且我们启动hdfs相关服务进程都是通过该命令进行的。 hdfs命令主要分为两类, 一类是用户命令:dfs, fsck等, 一类是管理员命令:dfsadmin,namenode,datanode等。

http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.5.0-cdh5.3.6/

hdfs命令-dfs显示文件夹内容

命令: -ls -lsr 执行:hdfs dfs -ls / 区别:lsr是递归显示

hdfs命令-dfs创建文件夹

命令: -mkdir 执行:hdfs dfs -mkdir -p /bjsxt/hdfs/mkdir -p指定当需要创建的文件夹存储,那么不报错,默认情况会报错,递归的创建文件夹。 如果我们给定的路径不是以'/'开始的,那么表示在当前用户目录下创建文件夹。(默认情况下是没有当前用户目录的,那么就会报错)。

hdfs命令-dfs上传文件到HDFS

命令: -put -copyFromLocal -moveFromLocal 执行:hdfs dfs -put /home/hadoop/bigdater/ /bjsxt/put 本地路径可以指定文件夹或者多个文件,hdfs上的路径必须是根据上传东西的不同,有不同的要求。 1.本地指定的是文件夹,那么hdfs如果目录不存在,就新建目录然后将本地文件夹内容copy过去;hdfs目录存在,则将文件夹copy过去。 2.本地指定的是单个文件,那要求hdfs上指定的文件不存在 3.本地指定的是多个文件,那么要求hdfs上指定的文件夹存在。

hdfs命令-dfs下载文件

命令: -get -copyToLocal -moveToLocal 执行:hdfs dfs -get /bjsxt/put ./ get命令和put命令是一对相反命令。put是从本地到集群,get是从集群到本地。基本语法相似。

hdfs命令-dfs查看文件内容

命令: -cat -text 执行:hdfs dfs -cat /beifeng/test.txt cat命令和text命令都可以查看文件内容,但是它们的内置机制不一样,cat是copy文件内容,然后显示;text是通过hadoop解析将文件内容转化为文本内容,然后在显示。cat命令只适合看一半的文本文件,而text命令可以看出所有文件。

hdfs命令-dfs删除文件

命令: -rm -rmdir 执行:hdfs dfs -rm -R /bjsxt/put rm和rmdir的区别主要是:rm可以删除任何文件/文件夹,rmdir只能够删除空的文件夹。

hdfs命令-fsck

fsck命令是检测hdfs磁盘文件是否有丢失备份异常等信息,可以查看到具体的文件是否处于健康状况,执行命令为: hdfs -fsck <path>

hdfs命令-dfsadmin汇报集群信息

命令:-report 执行:hdfs dfsadmin -report 可以通过该命令查看集群的基本信息,包括总磁盘大小,剩余磁盘大小,丢失块个数等总的集群信息。

hdfs命令-安全模式

命令:-safemode <enter | leave | get | wait> 执行:hdfs dfsadmin -safemode get 当集群中的文件备份出现丢失的时候,可能会进行安全模式。安全模式是指当集群处于该状态下,hdfs解决文件IO操作。我们可以通过该命令强制离开安全模式。

hdfs命令-namenode

namenode命令是hadoop提供的操作NN节点的shell命令入口,包括NN节点的格式化、NN节点升级、NN节点回滚、NN节点启动等操作。 查看帮助信息:hdfs namenode -h

image.png

hdfs命令-datanode

datanode命令是hadoop提供的操作ND节点的shell命令入口,包括ND节点启动、DN节点升级、DN节点回滚等操作。 查看帮助信息:hdfs datanode -h

image.png

hadoop命令

hadoop命令主要是将hdfs、yarn和mapred全部命令进行一个整合,实际生活中一般情况下主要使用hadoop命令来进行Job的管理到多个集群之间的数据复制问题。常用命令主要有: job: job生命周期管理,包括提交、查看状态、kill等。 distcp: 多集群间数据复制。 version: 查看hadoop版本信息。

其他命令

mapred命令主要作用对mapred相关服务进行控制。 yarn命令主要作用是对yarn的相关服务进行控制,包括resourcemanagernodemanager的启动以及Job的提交等。 hadoop start-yarn.sh yarn-daemon.sh mr-jobhistory-daemon.sh

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017.08.28 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【Hadoop篇】--Hadoop常用命令总结
1、启动hadoop所有进程 start-all.sh等价于start-dfs.sh + start-yarn.sh
LhWorld哥陪你聊算法
2018/09/13
3.2K0
Hadoop数据分析平台项目实战(基于CDH版本集群部署与安装)
1、Hadoop的主要应用场景:   a、数据分析平台。   b、推荐系统。   c、业务系统的底层存储系统。   d、业务监控系统。 2、开发环境:Linux集群(Centos64位)+Window开发模式(window10,64位操作系统)。    使用技术:hadoop,hbase,hive,flume,oozie,sqoop,nginx,tomcat,spring,mybatis,springmvc,mysql等等。Hdfs为海量的数据提供存储,MapReduce为海量的数据提供计算。      此
别先生
2018/04/19
1.8K0
Hadoop数据分析平台项目实战(基于CDH版本集群部署与安装)
0661-6.2.0-Hadoop数据备份与恢复
在Hadoop集群中,数据文件是以Block的方式存储在HDFS上,而HDFS上数据的名称,副本存储的地址等都是通过NameNode上的元数据来保存的。Hive的数据库和表的数据也是保存在HDFS中,而Hive的元数据metastore则保存在关系型数据库中。这些文件和数据如果丢失或者损坏,都会导致相应的服务不可用,Hadoop集群可以启用某些组件和服务的高可用或者备份,来应对可能出现数据损坏问题。但是在集群需要迁移,集群需要扩容或者缩容,或者其他情况,集群可能会面对数据安全风险的时候,我们可以通过主动备份这些数据,来保证数据安全。本文主要讲述如何备份NameNode元数据,如何备份MariaDB元数据库,如何备份HDFS中的数据,以及如何从这些备份中恢复。
Fayson
2019/07/05
4.7K0
0661-6.2.0-Hadoop数据备份与恢复
《快学BigData》--Hadoop总结(D)(37)
Hadoop总结 - - - - - - - - - - - - - - - - - - - - - - - - - - - - 210
小徐
2019/08/05
5600
《快学BigData》--Hadoop总结(D)(37)
五万字 | 耗时一个月,整理出这份Hadoop吐血宝典
一、HDFS 二、MapReduce 三、Yarn 四、Hadoop3.x 新特性 五、Hadoop 大厂面试真题解析
五分钟学大数据
2021/10/26
1.6K0
Hadoop大数据平台运维工程师须掌握的基本命令集分享
本博文收集和整理了在日常维护hadoop集群时运维工程师需要掌握的最基本的hadoop管理与维护的相关命令,在此分享出来供大家参考学习~博主也是刚刚接触hadoop不久,如有问题欢迎批评指正~非常感谢 1、列出所有Hadoop Shell支持的命令 $ bin/hadoop fs -help 2、显示关于某个命令的详细信息 $ bin/hadoop fs -help command-name 3、用户可使用以下命令在指定路径下查看历史日志汇总 $ bin/hadoop job -history output
CSDN技术头条
2018/02/09
1.4K0
Hadoop数据分析平台实战——020Hadoop Shell命令(初学跳过)离线数据分析平台实战——020Hadoop Shell命令(可跳过)
离线数据分析平台实战——020Hadoop Shell命令(可跳过) Hadoop Shell命令简单描述 Hadoop的Shell命令主要分为两类: 一类是启动命令 一类是控制/操作命令(hdfs+mapred+yarn) 其中启动命令位于sbin目录下面, 控制/操作命令主要位于bin目录下面 其实最终的启动命令也是调用控制命令来进行集群服务的启动,区别在于启动命令中需要使用ssh的相关命令来控制其他机器启动服务, 而控制/操作命令主要是直接调用hadoop提供的服务类接口。 Hadoop配置信
Albert陈凯
2018/04/08
1.2K0
Hadoop数据分析平台实战——020Hadoop Shell命令(初学跳过)离线数据分析平台实战——020Hadoop Shell命令(可跳过)
EMR(弹性MapReduce)入门之EMR集群的基础排障(五)
前面四节已经向大家介绍完,EMR集群的概括和搭建以及集群内的一些操作,在实际的生产过程中,又会出现各式各样的故障。接着就为大家介绍一些常见的故障已经解决方法。
小司机带你入门EMR
2020/02/03
1.4K0
Hadoop常用命令
启动Hadoop 进入HADOOP_HOME目录。 执行sh bin/start-all.sh 关闭Hadoop 进入HADOOP_HOME目录。 执行sh bin/stop-all.sh 1、查看指定目录下内容 hadoop dfs –ls [文件目录] eg: [hadoop@hadoop-1 test]$ hadoop fs -ls /gsw/rs 2、打开某个已存在文件 hadoop dfs –cat [file_path] eg:[hadoop@hadoop-1
ZONGLYN
2019/08/08
1.6K0
大数据:hadoop常用操作命令
Hadoop常用操作 命令 说明 1.执行:hadoop fs -mkdir /park 在hdfs 的根目录下,创建 park目录 2.执行:hadoop fs -ls / 查看hdfs根目录下有哪些目录 3.执行:hadoop fs -put /root/1.txt /park 将linux操作系统root目录下的1.txt放在hdfs的park目录下 4.执行:hadoop fs -get /park/jdk /home 把hdfs文件系统下park目录的文件下载到linux的home目录下 5.执行
许喜朝
2020/10/14
1.4K0
Hadoop原理与技术——hdfs命令行基本操作
一、实验目的 熟悉hdfs命令行基本操作 二、实验环境 Windows 10 VMware Workstation Pro虚拟机 Hadoop环境 Jdk1.8 三、实验内容 1:hdfs常见命令: (1)查看帮助:hdfs dfs -help
FGGIT
2024/10/15
1180
Hadoop原理与技术——hdfs命令行基本操作
Hadoop数据分析平台实战——010hadoop介绍安装
本课程目标 本课程有以下几个目标: 第一:对hadoop没有了解的学员来说,可以帮助其了解在一般工作中hadoop的基本用法,以及对如何用hadoop有一定的了解。 第二:对hadoop有了解的学员来说,其一可以帮助学员加深对hadoop的了解,其二可以让学员对hadoop的实际应用场景有一个比较深入的了解。 Hadoop的主要应用场景 这里说的hadoop指的是以hadoop为中心的hadoop生态圈。 场景1:数据分析平台 场景2:推荐系统 场景3:业务系统的底层存储系统 场景4:业务监控系统
Albert陈凯
2018/04/08
8100
Hadoop数据分析平台实战——010hadoop介绍安装
快速带你搭建Hadoop的HA集群!(确定不来看看吗?)
相信大家在看了前面一篇《Hadoop High Availability (高可用)详细讲解》之后,大家一定在想怎么搭建Hadoop HA的集群呢? 不要着急 ,小生接下来就带大家快速搭建一下(#.#)。
刘浩的BigDataPath
2021/04/13
4880
快速带你搭建Hadoop的HA集群!(确定不来看看吗?)
Hadoop使用(二)
前提和设计目标 硬件错误 硬件错误是常态而不是异常。HDFS可能由成百上千的服务器所构成,每个服务器上存储着文件系统的部分数据。我们面对的现实是构成系统的组件数目是巨大的,而且任一组件都有可能失效,这意味着总是有一部分HDFS的组件是不工作的。因此错误检测和快速、自动的恢复是HDFS最核心的架构目标。 流式数据访问 运行在HDFS上的应用和普通的应用不同,需要流式访问它们的数据集。HDFS的设计中更多的考虑到了数据批处理,而不是用户交互处理。比之数据访问的低延迟问题,更关键的在于数据访问的高吞吐量。PO
cloudskyme
2018/03/20
7320
Hadoop使用(二)
大数据成长之路------hadoop集群的部署(2)
7、启动集群 a)格式化集群 在第一个节点执行 hadoop namenode -format
Maynor
2021/04/09
3190
Hadoop HDFS 实现原理图文详解
Hadoop分布式文件系统 (HDFS) 是运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System)。
一个会写诗的程序员
2021/12/16
1.4K0
Hadoop HDFS 实现原理图文详解
hadoop 基础入门
sbin/start-yarn:nodemanager、resourcemanager
WindWant
2020/09/11
4940
hadoop 基础入门
Hadoop(CDH)分布式环境搭建(简单易懂,绝对有效)
本文是由alice菌发表在:https://blog.csdn.net/weixin_44318830/article/details/102846055
王知无-import_bigdata
2020/05/08
1.7K0
Hadoop(CDH)分布式环境搭建(简单易懂,绝对有效)
大数据之Hadoop企业级生产调优手册(下)
注:演示纠删码和异构存储需要一共 5台虚拟机。尽量拿另外一套集群。提前准备 5台服务器的集群。
王知无-import_bigdata
2021/10/13
6440
HDFS常用命令的学习
2、格式化名称节点(慎用,一般只在初次搭建集群,使用一次;格式化成功后,不要再使用)
全栈程序员站长
2022/11/15
7510
推荐阅读
相关推荐
【Hadoop篇】--Hadoop常用命令总结
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档