Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >将 Oozie 迁移到 CDP

将 Oozie 迁移到 CDP

作者头像
大数据杂货铺
发布于 2021-10-09 06:54:47
发布于 2021-10-09 06:54:47
5920
举报
文章被收录于专栏:大数据杂货铺大数据杂货铺

这是CDH/HDP/Apache Hadoop迁移到CDP系列的博客,如对迁移感兴趣,请关注该系列之前博客《使用 Replication Manager 迁移到CDP 私有云基础》、《将数据迁移到CDP 私有云基础的数据迁移用例》、《将Hive数据迁移到CDP》、《将 Kudu 数据迁移到 CDP》、《将 HBase 迁移到 CDP》、《将 Accumulo 迁移到 CDP》、《安全和治理迁移到CDP》。

将 Oozie 数据迁移到 CDP 后,您必须首先配置 Oozie,然后将自定义 ShareLib jar 迁移到您的新集群。

您必须将 Oozie 配置为使用不同的 CDP 服务,包括 Sqoop 操作、Yarn 作业和 HDFS HA。有关配置这些服务的信息,请参阅配置 Oozie。

笔记

默认情况下,Oozie 服务安排内部作业从数据库中清除所有早于 30 天的 Oozie 工作流。但是,在协调器完成之前,与长时间运行的协调器相关联的操作不会清除。Cloudera 建议您使用空数据库为 CDP 配置 Oozie。要查看旧数据,您可以备份并对该数据运行 SQL 查询。您必须重新创建长时间运行的协调器作业,因为 CDP 环境与 HDP 和 CDH 的环境不同。

程序

配置 Oozie 后,您必须将自定义 ShareLib jar 迁移到新集群。

  1. 从 HDP 或 CDH 集群复制 Oozie ShareLib jar:

cp /user/oozie/share/lib/lib_{TIMESTAMP}/{COMPONENT}

Oozie ShareLib 的位置在 HDP、CDH 和 CDP 环境中是相同的。

  1. 将 ShareLib 粘贴到 CDP 环境的新文件系统中。

paste /user/oozie/share/lib/lib_{TIMESTAMP}/{COMPONENT}

笔记

这些文件必须存在于存储(如 HDFS、S3 等)上,而不是存在于您安装 Oozie 的主机上。

  1. 执行 ShareLib 更新:

oozie admin -oozie {OOZIE_URL} -sharelibupdate

迁移自定义 ShareLib jar 后,更新 DFS 路径、JDBC URL(例如 Hive)等的工作流 XML 文件,以管理新环境。

原文链接:https://docs.cloudera.com/cdp-private-cloud-upgrade/latest/data-migration/topics/cdp-data-migration-oozie-migration.html

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-10-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据杂货铺 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
安全和治理迁移到CDP
使用 BDR/Replication Manager 将加密数据迁移到CDP PvC Base。
大数据杂货铺
2021/10/09
5880
将 HBase 迁移到 CDP
您可以将 Apache HBase 工作负载从 CDH 和 HDP 迁移到 CDP。要成功迁移 Apache HBase 工作负载,您必须首先了解两个平台之间的数据管理差异,并准备好源数据以与目标 CDP 平台兼容。
大数据杂货铺
2021/10/09
5360
将 Accumulo 迁移到 CDP
由于由 Apache Accumulo (OpDB) 提供支持的操作数据库作为与 Accumulo 不同的服务进行处理,因此不支持就地升级,因为 OpDB 作为与 Accumulo 不同的服务进行处理,因此配置更改将在升级时丢失。
大数据杂货铺
2021/10/09
3890
将数据迁移到CDP 私有云基础的数据迁移用例
您可以使用 authzmigrator 工具将 Hive 对象和 URL 权限以及 Kafka 权限从 CDH 集群迁移到 CDP 私有云基础 集群。您可以使用 DistCp 工具将 HDFS 数据从安全的 HDP 集群迁移到安全或不安全的CDP 私有云基础集群。
大数据杂货铺
2021/10/09
1.7K0
将 Kudu 数据迁移到 CDP
当您将 Kudu 数据从 CDH 迁移到 CDP 时,您必须使用 Kudu 备份工具来备份和恢复您的 Kudu 数据。
大数据杂货铺
2021/10/09
1.4K0
将 Impala 数据迁移到 CDP
在将 Impala 工作负载从 CDH 平台迁移到 CDP 之前,您必须了解 CDH 和 CDP Impala 之间的语义和行为差异以及需要在数据迁移之前执行的活动。
大数据杂货铺
2021/10/20
1.5K0
将 Impala 数据迁移到 CDP
FAQ系列之CDP PvC Base
CDP 私有云基础是Cloudera的本地(裸机)产品、企业数据中心(Enterprise Data Hub)和 HDP 企业的演变。CDP Private Cloud Base 7.1 包括 Cloudera Runtime 7.1,它将 CDH 和 HDP 的优点结合到一个发行版中。CDP私有云基础为客户提供以下服务:
大数据杂货铺
2021/07/27
1.1K0
FAQ系列之CDP PvC Base
将Hive数据迁移到CDP
使用Replication Manager 将 Hive 数据迁移到 CDP 后,您可能需要执行其他任务。您需要了解 Hive 3.x 和更早版本之间的语义差异。其中一些差异要求您更改 Hive 脚本或工作流程。此外,您需要将使用 CDP 不支持的 Hive CLI 的脚本转换为 Beeline。
大数据杂货铺
2021/10/09
1.3K0
0834-CDP Private Cloud Base 7.1.6正式GA
https://docs.cloudera.com/cdp-private-cloud-base/7.1.6/manager-release-notes/topics/cm-release-notes-731.html
Fayson
2021/04/19
9730
CDP私有云基础版7.1.6版本概要
Cloudera于2021年3月宣布发布Cloudera Data Platform(CDP)私有云(PvC)基本版本7.1.6和Cloudera Manager版本7.3.1。这些版本引入了从HDP 3到CDP私有云基础版的直接升级路径,同时添加了许多增强功能以简化从CDH 5和HDP 2的升级和迁移路径,并汇总了先前版本中的所有先前维护增强功能。
大数据杂货铺
2021/04/16
1.8K0
CDP私有云基础版7.1.6的新功能是什么?
根据IDG的说法,当客户考虑更新到产品的最新版本时,他们期望新功能、增强的安全性和更好的性能,但越来越希望拥有更简化的升级过程。伴随着CDP私有云的每个新版本,我们正在努力提供这些内容。伴随着许多新功能,我们正在尽可能简化升级过程。在此博客中,我们将介绍7.1.6版本中的新功能以及从HDP进行的新的就地升级,从而完全消除了替换基础架构和数据迁移的麻烦。
大数据杂货铺
2021/04/30
2.6K0
从遗留发行版到CDP的四种升级和迁移路径
从遗留平台的发行版到CDP的所有路径的每种机制都有共同的工作、缓解风险和取得成功成果的方面。其中包括工作负载审查、测试和验证、管理服务级别协议(SLA)、以及在移动期间最大程度地减少工作负载的不可用。
大数据杂货铺
2021/07/02
9960
使用Distcp和HMS-Mirror同步Hive到CDP
对于Hive迁移到CDP平台,如果源平台为CDH且具有Cloudera的使用许可证,则可以通过CDP提供的Replication Manager轻松将Hive迁移到CDP平台中;如果源平台不是CDH或者没有Cloudera的许可证,则可以使用本文提供的方法进行迁移。
大数据杂货铺
2022/03/29
1.5K0
使用Distcp和HMS-Mirror同步Hive到CDP
0480-如何从HDP2.6.5原地迁移到CDH5.16.1
我们常使用的Hadoop平台包括Apache Hadoop,CDH和HDP,有时我们会碰到需要迁移平台的情况,举个例子,比如你已经一直在使用Apache Hadoop2.4,近期看到CDH6附带Hadoop3发布了,想迁移到CDH并且做整个平台的所有组件升级。平台迁移和平台升级的方式基本一样的,一般有2种大的选择,第一种是原地升级即直接在原有平台上操作,该办法操作效率较高,马上看到效果,但往往风险较高,比如升级失败回滚方案不完善,跨大版本比如Hadoop2到Hadoop3可能HDFS还有丢数据的风险;第二种是拷贝数据的方式升级,需要额外的服务器资源,会新搭平台,然后把旧的平台的数据拷贝过去,数据拷贝完毕后,再把旧集群的机器下线了慢慢加入到新集群,该方法一般实施周期较长,但是风险较小。根据实际情况可以选择不同的方式来进行平台迁移或者平升级,另外对于两种方案还可以具体细化分类出不同的方案,比如第一种方案考虑提前备份数据或者备份关键数据等,本文Fayson不做细化讨论。
Fayson
2018/12/27
8440
0480-如何从HDP2.6.5原地迁移到CDH5.16.1
使用 Replication Manager 迁移到CDP 私有云基础
这是CDH/HDP/Apache Hadoop迁移到CDP系列的第一篇博客,如对迁移感兴趣,请关注该系列博客。
大数据杂货铺
2021/10/09
2K0
CDP PVC基础版的新功能
如果您是CDH或HDP用户,则除了从CDH和HDP版本转移到CDP的功能之外,还可以查看CDP私有云基础版中可用的新功能。
大数据杂货铺
2021/01/08
9280
CDP PVC基础版的新功能
CDH5升级到CDP7.1
将Cloudera Enterprise CDH升级到更高版本的CDH和CDP数据中心版。
大数据杂货铺
2020/08/07
2.4K0
CDH5升级到CDP7.1
基于投资,通过迁移或者升级到CDP-DC
Cloudera数据平台(CDP)数据中心版(CDP-DC)是Cloudera数据平台的本地版本。CDP-DC结合了Cloudera Enterprise Data Hub和Hortonworks Data Platform Enterprise的最佳服务和组件,以及在堆栈中的增加了新功能和增强功能,提供一流的本地企业数据平台。此统一分发是可扩展和可定制的平台,您可以在其中安全地运行多种类型的工作负载。
大数据杂货铺
2020/07/16
5680
基于投资,通过迁移或者升级到CDP-DC
CDP PvC Base的参考架构
Cloudera发布的Cloudera的数据平台(CDP)私有云基础版为用户提供了下一代混合云架构。这篇博文概述了设计和部署包含硬件和操作系统配置的集群的最佳实践,以及有关网络和安全以及与现有企业基础架构集成的指南。
大数据杂货铺
2021/07/27
1.2K0
CDP PvC Base的参考架构
0842-7.1.6-如何使用authzmigrator 工具迁移Sentry权限到Ranger
1.CDP 的 CM 节点与 CDH 的元数据库节点没有网络限制,并且CDP 集群中的CM节点可以正常使用 sentry 元数据的用户密码登陆 CDH 的 sentry 元数据库
Fayson
2021/07/05
1.9K1
相关推荐
安全和治理迁移到CDP
更多 >
加入讨论
的问答专区 >
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档