弹性 MapReduce

文章/答案/技术大牛

发布

首页标签弹性 MapReduce

#弹性 MapReduce

安全、灵活的云端托管 Hadoop 服务

WeData任务异常日志查看

用户10546873 2025-05-262025-05-26 10:37:03

进入WeData对应项目，在运维中心➡️实例运维➡️周期实例页面，根据任务ID获取异常任务实例，点击查看日志；

45000

「EMR 开发指南」之 Sqoop 使用说明

岳涛

腾讯云TDP ｜官方产研 (已认证)

2025-04-302025-04-30 16:23:41

Sqoop是一种用于在Apache Hadoop和结构化数据存储（如关系数据库）之间传输数据的开源工具。它允许用户在Hadoop分布式文件系统（HDFS）和外部...

1K30

「EMR 开发指南」之 Hue 配置工作流

岳涛

腾讯云TDP ｜官方产研 (已认证)

2024-07-302024-07-30 19:55:34

本文将通过一个简单，并且具有典型代表的例子，描述如何使用EMR产品中的Hue组件创建工作流，并使该工作流每天定时执行。

94621

「EMR 开发指南」之 Sqoop 常见问题处理

岳涛

腾讯云TDP ｜官方产研 (已认证)

2024-03-012024-03-01 10:49:50

Sqoop是一种用于在Apache Hadoop和结构化数据存储（如关系数据库）之间传输数据的开源工具。它允许用户在Hadoop分布式文件系统（HDFS）和外部...

1.7K40

「EMR 运维指南」之 HiveServer2 启用 Custom 鉴权

岳涛

腾讯云TDP ｜官方产研 (已认证)

2023-11-202023-11-20 16:05:57

HiveServer2 服务默认不启用鉴权功能，这样的话随意输入密码都能连接上，容易造成安全隐患，下面讲解下如何配置Hiveserver2 的 Custom 鉴...

1.1K80

「EMR 运维指南」之 Impala 关联 Sentry + Hue

岳涛

腾讯云TDP ｜官方产研 (已认证)

2023-11-232023-11-23 12:50:08

在EMR集群带公网master节点部署sentry服务，Impala的GROUP组需要在Impala server节点上进行创建系统组与之关联。

1K111

【大数据】产品文档捉虫活动

腾讯云文档

腾讯｜高级经理 (已认证)

2023-11-012023-11-01 17:39:11

为了提升广大用户的文档的使用体验，现推出【大数据】产品文档定向捉虫活动。邀请大家对指定产品文档进行体验，反馈文档问题就有机会获得腾讯云电子代金券、京东储值卡和神...

1.3K10

自建迁移EMR实践案例

腾讯云大数据 2024-06-132024-06-13 16:50:54

自建开源大数据平台会随着企业数据的增长遇到：性能慢、扩容周期长、平台稳定性差、运维难、投入成本高等问题。在这里我们将从 EMR 的简介、EMR与自建Hadoop...

4.6K140

Spark SQL报错：org.apache.spark.sql.catalyst.errors.package$TreeNodeException 排查记录

王旭平

腾讯科技有限公司｜产品架构工程师 (已认证)

2022-12-112022-12-11 18:19:29

在EMR集群上按小时跑的spark sql 任务有时会失败，在driver端的日志中可以看到报错： org.apache.spark.sql.catalyst....

3.9K140

腾讯云大数据技术介绍-数据查询弹性 MapReduce

jerryteng 2021-09-162021-09-16 18:29:21

上一节我们讲到了大数据的存储： https://cloud.tencent.com/developer/article/1878422

2.3K50

高吞吐实时事务数仓方案调研 flink kudu+impala hbase等

大鹅 2021-08-072021-08-07 17:17:09

腾讯云数据仓库PostgreSql TDSQL，PingCAP的TiDB，阿里的OceanBase，华为云DWS，都是HTAP的业内常用数仓，可以一站式解决需求...

4.8K84

Oceanus Kudu Sink总结

spiderwu 2021-08-072021-08-07 19:00:52

实时即未来，最近在腾讯云Oceanus进行实时计算服务，以下为flink写入Kudu实践中的总结。分享给大家~

1.8K30

通过数据组织优化加速基于Apache Iceberg的大规模数据分析

鱼跟猫 2021-07-062021-07-06 17:53:20

数据湖（Data lake）是一种将数据以原始格式存储在同一个系统或存储库的设计思想。它可以实现在一份数据之上进行多种数据计算，以避免为了多种计算场景而导致数据...

3.3K140

腾讯云EMR基于YARN针对云原生容器化的优化与实践

腾讯云大数据 2021-06-282021-06-28 15:11:56

导语 | 传统HADOOP生态系统使用YARN管理/调度计算资源，该系统⼀般具有明显的资源使⽤周期。实时计算集群资源消耗主要在⽩天，而数据报表型业务则安排在离线...

2.6K50

【全网最新】如何在本地IDE Run起OpenTSDB源码

garyhwang 2021-06-192021-06-19 18:00:59

有需求了解一下Opentsdb的源码，然后想着能在本地run起来，打些断点和日志来跟一下，然后兴致勃勃去网上找了资料看看能否快速run起来，但是发现所有的博客、...

1.3K60

HBASE BufferedMutator 批量写入使用举例与源码解析

大鹅 2021-06-042021-06-04 15:55:24

BufferedMutator主要用来异步批量的将数据写入一个hbase表，就像Htable一样。通过Connection获取一个实例。

2.7K50

基于Sentry的大数据权限解决方案

岳涛

腾讯云TDP ｜官方产研 (已认证)

2021-10-082021-10-08 17:55:51

Apache Sentry 是Cloudera公司发布的一个Hadoop开源组件，截止目前还是Apache的孵化项目，它提供了细粒度级、基于角色的授权以及多租户...

1.8K220

基于Kerberos+Ldap复合认证的大数据权限

岳涛

腾讯云TDP ｜官方产研 (已认证)

2021-09-262021-09-26 17:17:21

关于Kerberos与Ldap两个方案，此处就不再赘述，分别参考我的另外两篇文章：

2.7K230

基于Kerberos认证的大数据权限解决方案

岳涛

腾讯云TDP ｜官方产研 (已认证)

2021-03-302021-03-30 20:01:23

Kerberos是由麻省理工（MIT）开发，对三方进行验证鉴权的服务安全管理系统。该系统很好的体现了西方三权分立的思想，其名字也很形象，来源于希腊神话地狱三个脑...

3.7K210

Hive全库数据迁移方案

岳涛

腾讯云TDP ｜官方产研 (已认证)

2021-09-262021-09-26 17:19:40

考虑到多数场景是迁移整个Hive数据库，该篇文章只介绍迁移的第二种，即元数据及Hive数据全量迁移。

5.7K222

#弹性 MapReduce

WeData任务异常日志查看

「EMR 开发指南」之 Sqoop 使用说明

「EMR 开发指南」之 Hue 配置工作流

「EMR 开发指南」之 Sqoop 常见问题处理

「EMR 运维指南」之 HiveServer2 启用 Custom 鉴权

「EMR 运维指南」之 Impala 关联 Sentry + Hue

【大数据】产品文档捉虫活动

自建迁移EMR实践案例

Spark SQL报错：org.apache.spark.sql.catalyst.errors.package$TreeNodeException 排查记录

腾讯云大数据技术介绍-数据查询弹性 MapReduce

高吞吐实时事务数仓方案调研 flink kudu+impala hbase等

Oceanus Kudu Sink总结

通过数据组织优化加速基于Apache Iceberg的大规模数据分析

腾讯云EMR基于YARN针对云原生容器化的优化与实践

【全网最新】如何在本地IDE Run起OpenTSDB源码

HBASE BufferedMutator 批量写入使用举例与源码解析

基于Sentry的大数据权限解决方案

基于Kerberos+Ldap复合认证的大数据权限

基于Kerberos认证的大数据权限解决方案

Hive全库数据迁移方案

相关产品

热门专栏

公有云大数据平台弹性 MapReduce

jerryteng的专栏

Java职业技术分享

Redis源码学习系列

数据饕餮

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐