hadoop - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签hadoop

#hadoop

Apache Hadoop是一款支持数据密集型分布式应用程序并以Apache 2.0许可协议发布的开源软件框架。它支持在商品硬件构建的大型集群上运行的应用程序。

【赵渝强老师】Hadoop HDFS的回收站和快照

赵渝强老师 12天前2026-07-15 10:07:42

Hadoop的HDFS除了最基本的上传数据和下载数据的功能以外，还提供了很多高级特性用于方便使用和操作，主要有：回收站、快照、配额管理、安全模式、权限管理，同时...

8610

Hadoop 集群成本高企： EMR 弹性伸缩如何帮企业节省 30% 账单

hollyx 19天前2026-07-08 11:50:29

摘要： Hadoop 集群建设面临资源利用率低、存储成本高、运维复杂等痛点。腾讯云弹性 MapReduce （ EMR ）通过自动伸缩、存算分离、集群联邦等能力...

14010

开源 Hadoop vs 商业发行版 vs 云 EMR ：三种路线优劣辨析

克劳德2048 19天前2026-07-08 11:45:00

摘要：本文对比开源 Hadoop 、商业发行版、云上 EMR 三种大数据平台路线的成本、性能、运维、弹性等维度，帮助企业根据技术团队能力和业务需求选择合适方案...

14810

腾讯云 EMR vs 自建 Hadoop ：成本、性能、运维全方位对比

hollyx 20天前2026-07-07 18:05:00

摘要：企业构建大数据平台时，需在云原生托管服务与自建 Hadoop 集群之间选择。本文从成本、性能、运维等七个维度对比腾讯云弹性 MapReduce （ EM...

15010

大数据迁移上云实战： IDC 自建 Hadoop → EMR 平滑迁移全流程

克劳德2048 20天前2026-07-07 11:05:14

摘要：企业 IDC 自建 Hadoop 集群面临扩容周期长、运维复杂等挑战。本文介绍 IDC 自建 Hadoop 迁移至腾讯云 EMR 的完整流程，包括网络打...

26710

CDH/CDP 国产化替代路径：从传统 Hadoop 发行版到自主可控大数据平台

gavin1024 21天前2026-07-06 17:45:00

摘要： CDH/CDP 等国外 Hadoop 发行版面临停更和技术封锁风险，国产化替代成为企业刚需。本文分析 CDH/CDP 的现状与风险，介绍国产化替代的主流...

25310

Hadoop 学习总结（1）-Hadoop搭建

唐甜

四川久远银海软件股份有限公司｜软件开发工程师 (已认证)

2026-06-252026-06-25 13:57:00

打通完整的大数据数仓链路：医院数据 → STG → ODS → DWD → DWS → PostgreSQL

15320

Hadoop 学习总结（1）-Hadoop搭建

唐甜

四川久远银海软件股份有限公司｜软件开发工程师 (已认证)

2026-06-252026-06-25 13:57:00

打通完整的大数据数仓链路：医院数据 → STG → ODS → DWD → DWS → PostgreSQL

15320

【hadoop】Hadoop 3.3.4 集群安装及简单使用

master336

中电金信软件有限公司｜高级技术架构师、产品售前专家 (已认证)

2026-06-152026-06-15 19:38:46

像配置JAVA_HOME一样配置HADOOP_HOME，值为Hadoop安装的根目录

17200

【赵渝强老师】Hadoop的伪分布部署模式

赵渝强老师 2026-05-062026-05-06 11:24:34

Hadoop的安装和部署是大数据生态圈体系中最麻烦的一个。Hadoop部署完成后，进一步地部署Spark和Flink就非常容易了。Hadoop的部署模式分为本地...

17210

hadoop Yarn的 RMStateStore对比分析

zeekling 2026-04-032026-04-03 09:04:51

20410

OpenClaw （养龙虾）+ 企业微信对接：2026年保姆级全链路操作指南

肥仔鱼 2026-03-112026-03-11 15:40:24

在2026年的企业数字化办公浪潮中，OpenClaw（曾用名 Clawdbot、Moltbot）已成长为国内领先的开源AI自动化代理工具。凭借其“自然语言驱动、...

8.8K121

Hadoop实战详解：从环境搭建到企业级案例落地

1024068 2026-02-112026-02-11 09:05:40

在大数据爆发的时代，PB级数据的存储与计算成为企业数字化转型的核心需求，而Hadoop作为Apache开源的分布式大数据框架，凭借高可用性、可扩展性、高容错性和...

44810

一文搞懂物化视图：从原理到实战，查询性能提升 10 倍的秘密

ETL 小当家 2026-02-042026-02-04 15:24:33

物化视图是数据库中的一种特殊对象，它存储了查询结果的物理副本，与普通视图（只保存查询定义）不同。

36810

如何在CentOS 8.5上配置并调优Hadoop YARN资源管理器，提升大数据集群的任务调度与资源分配效率？

A5IDC服务器 2026-01-102026-01-10 11:07:18

在大数据集群环境中，YARN（Yet Another Resource Negotiator）作为资源管理与调度核心，其配置与调优直接影响任务执行效率与集群资源...

33210

如何在 Ubuntu 22.04 上配置并调优 Apache Hadoop 集群，处理 TB 级数据集并优化分布式计算性能？

A5IDC服务器 2026-01-102026-01-10 11:04:31

在处理 TB 级别的数据集时，单机和传统数据库架构往往难以满足吞吐与扩展性需求。Apache Hadoop 是成熟的分布式计算与存储框架，通过合理的配置与调优，...

33710

【详解】Hadoop自定义分组比较器实现分组功能

大盘鸡拌面 2025-12-262025-12-26 09:44:35

在Hadoop MapReduce编程中，默认情况下，框架会根据键（Key）的自然排序来进行分组。然而，在某些应用场景下，我们可能需要根据特定的业务逻辑来对数据...

22310

hadoop纠删码基本原理

用户4128047 2025-12-232025-12-23 17:17:58

Hadoop纠删码（Erasure Coding, EC）是通过数学编码降低存储冗余的核心技术，其原理与实现可归纳如下：

37510

#hadoop

【赵渝强老师】Hadoop HDFS的回收站和快照

Hadoop 集群成本高企： EMR 弹性伸缩如何帮企业节省 30% 账单

开源 Hadoop vs 商业发行版 vs 云 EMR ：三种路线优劣辨析

腾讯云 EMR vs 自建 Hadoop ：成本、性能、运维全方位对比

大数据迁移上云实战： IDC 自建 Hadoop → EMR 平滑迁移全流程

CDH/CDP 国产化替代路径：从传统 Hadoop 发行版到自主可控大数据平台

Hadoop 学习总结（1）-Hadoop搭建

Hadoop 学习总结（1）-Hadoop搭建

【hadoop】Hadoop 3.3.4 集群安装及简单使用

【赵渝强老师】Hadoop的伪分布部署模式

hadoop Yarn的 RMStateStore对比分析

OpenClaw （养龙虾）+ 企业微信对接：2026年保姆级全链路操作指南

Hadoop实战详解：从环境搭建到企业级案例落地

一文搞懂物化视图：从原理到实战，查询性能提升 10 倍的秘密

如何在CentOS 8.5上配置并调优Hadoop YARN资源管理器，提升大数据集群的任务调度与资源分配效率？

如何在 Ubuntu 22.04 上配置并调优 Apache Hadoop 集群，处理 TB 级数据集并优化分布式计算性能？

【详解】Hadoop自定义分组比较器实现分组功能

hadoop纠删码基本原理

热门专栏

腾讯云开发者社区头条

王亮的专栏

陆耀伟的专栏

公有云大数据平台弹性 MapReduce

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#hadoop

【赵渝强老师】Hadoop HDFS的回收站和快照

Hadoop 集群成本高企： EMR 弹性伸缩如何帮企业节省 30% 账单

开源 Hadoop vs 商业发行版 vs 云 EMR ：三种路线优劣辨析

腾讯云 EMR vs 自建 Hadoop ：成本、性能、运维全方位对比

大数据迁移上云实战： IDC 自建 Hadoop → EMR 平滑迁移全流程

CDH/CDP 国产化替代路径：从传统 Hadoop 发行版到自主可控大数据平台

Hadoop 学习总结（1）-Hadoop搭建

Hadoop 学习总结（1）-Hadoop搭建

【hadoop】Hadoop 3.3.4 集群安装及简单使用

【赵渝强老师】Hadoop的伪分布部署模式

hadoop Yarn的 RMStateStore对比分析

OpenClaw （养龙虾）+ 企业微信对接：2026年保姆级全链路操作指南

Hadoop实战详解：从环境搭建到企业级案例落地

一文搞懂物化视图：从原理到实战，查询性能提升 10 倍的秘密

如何在CentOS 8.5上配置并调优Hadoop YARN资源管理器，提升大数据集群的任务调度与资源分配效率？

如何在 Ubuntu 22.04 上配置并调优 Apache Hadoop 集群，处理 TB 级数据集并优化分布式计算性能？

【详解】Hadoop自定义分组比较器实现分组功能

hadoop纠删码基本原理

腾讯云开发者社区头条

王亮的专栏

陆耀伟的专栏

公有云大数据平台弹性 MapReduce

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

如何在CentOS 8.5上配置并调优Hadoop YARN资源管理器，提升大数据集群的任务调度与资源分配效率？