发布

浪浪山下那个村

应无所住,而生其心。 --《金刚经》 吾生也有涯,而知也无涯。 --《庄子》
专栏成员
148
文章
119069
阅读量
21
订阅数
container-executor 详解
container-executor 是NodeManager管理Container很重要的一个工具,是深入学习Yarn作业调度不可缺少的一个知识点,值得深入学习。本文只描述比较基础的功能点(目前不会包含Docker相关)。
zeekling
2025-03-04
820
Idea Hadoop 源码YarnServiceProtos无法补全问题
使用IDEA打开Hadoop源码之后,发现YarnServiceProtos部分代码无法补全,已经安装了protobuf相关的插件。
zeekling
2025-01-05
440
Capacity调度器源码解析
Capacity 调度器的核心类是CapacityScheduler。在初始化CapacityScheduler的时候,在构造函数initAsyncSchedulingProperties,里面会初始化调度器相关。
zeekling
2024-11-04
740
router启动详解
为了解决HDFS的水平扩展性问题,社区从Apache Hadoop 0.23.0版本开始引入了HDFS federation。HDFS Federation是指 HDFS集群可同时存在多个NameNode/Namespace,每个Namespace之间是互相独立的;
zeekling
2024-10-10
1130
hadoop 主备倒换控制器:ZKFailoverController详解
HDFS的NameNode、Yarn的ResourceManager都是依靠ZK实现主备倒换的。核心的类为:ZKFailoverController.java,
zeekling
2024-09-22
1590
Hadoop 认证模块详解
客户端的入口函数为 KerberosAuthenticator.authenticate函数
zeekling
2024-09-01
1650
ContainerManager详解
ContainerManager主要负责NM中管理所有Container生命周期,其主要包含启动Container、恢复Container、停止Container等功能。
zeekling
2024-08-07
2510
BPServiceActor详解
BPServiceActor 主要在DataNode中用于和NameNode沟通的类。主要功能如下:
zeekling
2024-07-22
940
BPServiceActor详解
BPServiceActor 主要在DataNode中用于和NameNode沟通的类。主要功能如下:
zeekling
2024-07-21
920
neovim 从0开始配置优化
neovim是从vim的一个分支fork出来的,从性能等方面来讲都比vim强很多,所以从vim转到neovim了。
zeekling
2024-06-09
3610
docker stop container 报错:tried to kill container, but did not receive an exit event
zeekling
2024-06-03
1.6K0
jobhistory 作业缓存源码详解
jobhistory 一般会保存一部分作业信息到内存中,查询作业信息的时候一般会从内存查询,如果内存查询不到就会从磁盘上扫描。
zeekling
2024-05-26
730
NameNode客户端协议详解
根据交互对象的不同,将协议进行了不同的归类。要想了解协议内容,需要将其单独分开分析。
zeekling
2024-04-26
1510
FSDirectory详解
Namenode最重要的两个功能之一就是维护整个文件系统的目录树(即命名空间namesystem) 。 HDFS文件系统的命名空间(namespace) , 也就是以“/”为根的整个目录树, 是通过FSDirectory类来管理的。 FSNamesystem也提供了管理目录树结构的方法。 FSNamesystem中的方法多是调用FSDirectory类的实现。FSNamesystem在FSDirectory类方法的基础上添加了editlog日志记录的功能。
zeekling
2024-04-01
1280
Yarn 作业启动源码解读
作业提交的客户端比较核心的类是Job.java,看作业启动的源码需要从这个类开始看。
zeekling
2023-12-08
2120
Yarn 状态机以及事件机制
AsyncDispatcher 实现了接口Dispatcher,Dispatcher中定义了事件Dispatcher的接口。主要提供两个功能:
zeekling
2023-11-29
3620
ResourceManager简介
ResourceManager(RM),RM是全局的资源管理器,负责整个系统的资源管理和分配。主要由以下两部分组成:
zeekling
2023-11-26
7390
nameNode启动过程源码分析
nameNode的启动主要是有NameNode.java主导的,由main函数开始了解。
zeekling
2023-11-06
2040
HDFS 详解
HDFS采用master/slave架构。一个HDFS集群是由一个Namenode和一定数目的Datanodes组成。 Namenode是一个中心服务器,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问。 集群中的Datanode一般是一个节点一个,负责管理它所在节点上的存储。 HDFS暴露了文件系统的名字空间,用户能够以文件的形式在上面存储数据。 从内部看,一个文件其实被分成一个或多个数据块,这些块存储在一组Datanode上。 Namenode执行文件系统的名字空间操作,比如打开、关闭、重命名文件或目录。它也负责确定数据块到具体Datanode节点的映射。 Datanode负责处理文件系统客户端的读写请求。在Namenode的统一调度下进行数据块的创建、删除和复制。
zeekling
2023-10-23
5270
Yarn 详解
zeekling
2023-10-23
2000
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档