hdfs - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签hdfs

#hdfs

Flume Source channel Sink专题

wuzhigang 15天前2026-06-18 08:29:54

9010

HDFS DataNode 3.3.1 后优化详解

zeekling 2026-04-272026-04-27 09:09:25

本文系统梳理 Hadoop 3.3.1 之后（3.4.0 ~ 3.5.0）对 DataNode 的全部优化，涵盖性能优化、稳定性修复、新特性、监控增强和运维改进...

20310

运维必会！选型必备！主流分布式存储方案：HDFS、Ceph、MinIO 深度剖析

民工哥 2026-03-242026-03-24 12:39:14

前面我们介绍了有关对象存储的选型参考：主流对象存储方案大比拼：本地存储、OSS、MinIO、Ceph、Apache Ozone 与 OpenIO。

1.1K10

OpenClaw （养龙虾）+ 企业微信对接：2026年保姆级全链路操作指南

肥仔鱼 2026-03-112026-03-11 15:40:24

在2026年的企业数字化办公浪潮中，OpenClaw（曾用名 Clawdbot、Moltbot）已成长为国内领先的开源AI自动化代理工具。凭借其“自然语言驱动、...

8.5K121

HDFS从概念到实战详解：大数据分布式存储核心指南

1024068 2026-02-102026-02-10 13:47:20

在大数据时代，海量数据的存储的核心痛点的是“可靠、高效、可扩展”——单机文件系统无法承载TB/PB级数据，也难以应对硬件故障、高并发访问等场景。HDFS（Had...

65310

Sqoop实战指南：如何高效实现MySQL到HDFS的数据迁移

用户6320865 2026-01-202026-01-20 13:57:17

在当今数据驱动的商业环境中，数据仓库已成为企业决策的神经中枢。随着2025年企业数字化转型进入深水区，数据仓库架构正经历着从传统单一体到云原生、湖仓一体的重大演...

47110

HDFS写入数据流程

用户4128047 2025-12-232025-12-23 17:14:59

‌ 小文件合并‌：通过hdfs.rollSize等参数控制文件滚动生成，减少NameNode内存压力。

31000

数据节点下线

用户4128047 2025-12-232025-12-23 17:01:24

由于公司近期需要将机械盘替换成SSD盘,SSD盘又不足,需要下线部分数据节点.刚开始是直接粗暴的关掉了4个节点上的datanode服务,出现很多丢失的数...

12710

HIVE-17824,删除hdfs分区信息,清理metastore元数据

用户4128047 2025-12-232025-12-23 16:45:51

当手动删除HDFS 分区数据时,但是并没有清理 Hive 中的分区元数据,删除操作无法自动更新hive分区表元数据。也就是从hdfs中删除大量分...

40210

datanode无法启动问题

用户4128047 2025-12-232025-12-23 16:42:01

17810

集群数据均衡

用户4128047 2025-12-232025-12-23 16:31:54

对于参数 10，代表的是集群中各个节点的磁盘空间利用率相差不超过 10%，可根据实际情况进行调整。停止数据均衡命令：

17110

HDFS HA 高可用

用户4128047 2025-12-232025-12-23 16:23:15

HA 概述 1）所谓 HA（High Available），即高可用（7*24 小时不中断服务）。 2）实现高可用最关键的策略是消除单点故障。HA 严格来说...

27200

为什么块的大小不能设置太小，也不能设置太大？

用户4128047 2025-12-232025-12-23 16:14:23

（1）HDFS的块设置太小，会增加寻址时间，程序一直在找块的开始位置；（2）如果块设置的太大，从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间。导...

19510

HDFS组成架构

用户4128047 2025-12-232025-12-23 16:14:19

1）NameNode（nn）：就是Master，它是一个主管、管理者。（1）管理HDFS的名称空间；（2）配置副本策略；（3）管理数据块（Blo...

21910

项目经验之集群数据均衡

用户4128047 2025-12-232025-12-23 16:13:42

1）节点间数据均衡（1）开启数据均衡命令： start-balancer.sh -threshold 5 对于参数5，代表的是集群中各个节点的磁盘空间利...

15310

HDFS读数据流程

用户4128047 2025-12-232025-12-23 16:10:57

HDFS的读数据流程 (1)客户端通过Distributed FileSystem向NameNode请求下载文件,NameNode通过查询元数据,找到文件...

25010

HDFS的写数据流程

用户4128047 2025-12-232025-12-23 16:10:52

HDFS的写数据流程 (1)客户端通过Distributed FileSystem模块向NameNode请求上传文件,NameNode检查目标文件是否已存...

29610

hadoop集群的快照管理

用户4128047 2025-12-232025-12-23 16:08:10

通过 web 访问 hdfs://hadoop102:50070/user/hadoop/input/.snapshot/s……// 快照和源文件使用相同数...

20700

HDFS的读数据流程

用户4128047 2025-12-232025-12-23 16:04:37

1）客户端通过 Distributed FileSystem 向 NameNode 请求下载文件，NameNode 通过查询元数据，找到文件块所在的 Dat...

18410

网络拓扑概念

用户4128047 2025-12-232025-12-23 16:04:33

在 HDFS 写数据的过程中，NameNode 会选择距离待上传数据最近距离的 DataNode 接收数据。那么这个最近距离怎么计算呢？节点距离：两个节点到...

18210