首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

无网络接入的CDH集群如何安装parckage(如mmlspark)?

在无网络接入的CDH(Cloudera Distribution Hadoop)集群中安装软件包(如mmlspark)是一个具有挑战性的任务,因为通常这些软件包需要从互联网上下载。然而,通过一些预先准备和手动步骤,你仍然可以在这样的环境中完成安装。以下是一个详细的指南:

基础概念

  • CDH集群:Cloudera Distribution Hadoop,一个流行的Hadoop发行版,包含了Hadoop及其生态系统中的多个组件。
  • mmlspark:Microsoft Machine Learning for Apache Spark,一个为Spark提供机器学习功能的库。
  • 无网络接入:指的是集群无法直接访问互联网,这限制了从在线仓库下载软件包的能力。

相关优势

  • 离线安装:允许在没有网络连接的环境中安装必要的软件包,确保集群的稳定性和安全性。
  • 减少依赖:通过预先下载所有必需的组件,可以减少安装过程中对外部服务的依赖。

类型与应用场景

  • 类型:离线软件包安装。
  • 应用场景:企业内部网络隔离环境、远程数据中心、灾难恢复站点等。

解决方案步骤

  1. 准备环境
    • 在一个可以访问互联网的机器上,下载mmlspark及其所有依赖项。
    • 将下载的文件复制到一个外部存储设备(如USB驱动器)。
  • 传输文件到CDH集群
    • 将外部存储设备连接到CDH集群的节点。
    • 将下载的mmlspark及其依赖项复制到集群的适当位置,通常是/var/lib/hadoop-hdfs/或指定的软件仓库目录。
  • 安装软件包
    • 在CDH集群的节点上,导航到mmlspark的安装目录。
    • 运行安装脚本或手动配置环境变量和类路径,以便Spark可以找到并加载mmlspark库。
  • 验证安装
    • 启动一个Spark会话,并尝试导入mmlspark包以验证其是否正确安装。
    • 运行一些简单的测试用例来确保mmlspark的功能正常。

可能遇到的问题及解决方法

  • 依赖项缺失:如果在安装过程中遇到依赖项缺失的问题,需要回到准备环境步骤,确保所有必需的依赖项都已下载并传输到集群。
  • 版本不兼容:确保下载的mmlspark版本与CDH集群中的Spark版本兼容。如果不兼容,可能需要寻找替代方案或升级集群组件。
  • 权限问题:在复制文件和运行安装脚本时,可能会遇到权限问题。确保以适当的用户身份执行这些操作,或调整文件和目录的权限设置。

参考链接

请注意,具体的安装步骤可能因集群配置和软件版本的不同而有所差异。建议参考官方文档和社区论坛以获取更详细的指导和支持。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

0721-5.10.0-CM接管rpm方式安装CMCDH集群

文档编写目的 在部署CDH集群时,可能使用tar包或者rpm包方式安装集群,但是在部署时并没有采用Cloudera Manager来对集群进行管理,在使用过程中,集群数据量日益增长,组件慢慢变多,因此想将现有的集群使用...Cloudera Manager来进行管理,本文档将介绍如何使用Cloudera Manager来接管一个Cloudera Manager管理CDH集群。...测试环境: · CM和CDH版本为5.10.0 · 操作系统版本为RedHat7.2 · 使用root用户进行操作 · 集群一共三个节点 CDH集群以rpm方式已经安装组件如下: · Zookeeper...出现两个警告是由于使用rpm方式安装CDH集群,并不影响 16.安装服务页面,在此处不选择添加任何服务,在后面再进行服务添加 ? 17.点击左上角,回到CM主页 ?...总结 1.使用CM接管未受管CDH集群,在添加服务时需要注意是,要保持角色与之前安装角色一致,数据目录也需要指定成之前安装数据目录,以及一些配置也需要在CM上修改,与支持一致,保证CM接管后服务都与之前一样正常运行

1.2K20

0724-6.2.0-CM接管rpm方式安装CMCDH集群

文档编写目的 在之前文档中介绍了如何用CM接管CM以rpm方式安装CDH5.10.0,本文档同样会介绍如何使用Cloudera Manager来接管一个Cloudera Manager管理CDH...集群,只不过这次版本是CDH6.2.0。...测试环境: CM和CDH版本为6.2.0 操作系统版本为RedHat7.2 使用root用户进行操作 集群一共三个节点 CDH集群以rpm方式已经安装组件如下: Zookeeper HDFS Yarn...出现警告是由于使用rpm方式安装CDH集群,并不影响 17.安装服务页面,在此处不选择添加任何服务,在后面再进行服务添加 ? 18.点击左上角,回到CM主页 ?...3.使用CM接管原集群后,能够通过CM更好监控集群服务状态以及使用情况,方便更好集群进行管理。

99840
  • 如何编译Livy并在非Kerberos环境CDH集群安装

    ,基于Apache Spark开源REST服务,加入Cloudera Labs》,由于Cloudera暂未将Livy服务打包集成到CDH,所以需要我们自己编译安装,本篇文章主要介绍如何通过Maven编译...Livy并在非Kerberos环境CDH集群安装。...R和Python环境变量 这里R和Python安装及配置这里就不多讲了,可以参考Fayson前面的文章《如何在Redhat中配置R环境》和《如何CDH集群安装Anaconda&搭建Python私有源...[pa8k4d2qhv.jpeg] 到此为止就完成了Livy源码编译、安装与非Kerberos环境下CDH集群集成。...7.总结 ---- 部署Livy节点需要安装CDHGateWay工具 Livy工程编译依赖环境需要配置否则在编译时会报错,具体可以参考如下: https://github.com/cloudera

    2.3K60

    0686-6.2.0-如何CDH集群JDK安装JCE策略文件

    本篇文章Fayson主要介绍使用不同方式安装JCE加密策略文件以及如何禁用KerberosAES-256加密。...测试环境: 1.Redhat7.2 2.采用root用户操作 3.CM/CDH6.2.0 手动安装JCE Policy File 1.确认当前CDH集群使用JDK路径 可以使用“ps -ef”命令查看启动...当前CDH5集群只有这一个JDK安装包 ? 再通过CM引导界面为JDK安装JCE ? ? 安装完成后,可以看到集群所有节点都新安装了Oracle JDK 1.7 ?...2.JDK 1.8.0_161或更高版本JDK是不需要再安装JCE Policy File,默认已默认启用无限强度加密。 3.可以通过手动或CM引导方式为CDH集群JDK安装JCE策略文件。...5.通过前面的测试发现通过CM引导界面来为CDH集群JDK安装JCE策略文件,只能为升级向导中同时安装JDK(即CM默认自带JDK)添加JCE策略文件,如果集群使用自定义JDK版本则需要通过手动方式安装

    1.2K30

    如何CDH集群非元数据库节点安装MySQL5.7.12

    1.文档编写目的 ---- 在CDH集群中默认使用MySQL版本是操作系统自带版本,一般操作系统自带MySQL版本都会比较低,对于企业已有应用可能会用较新MySQL版本,使用集群安装MySQL...时可能会出现SQL不兼容问题,那么解决方法一是在集群安装新版本MySQL,二是升级集群中老版本MySQL。...本文主要选择第一种方法在集群安装新版本MySQL,在RedHat6安装时会遇到mysql-community-libs包冲突问题,卸载冲突包时会将cloudera-manager-agent包也卸载导致...Agent异常,在RedHat7安装时会自动更新mysql-community-libs依赖包,本文档主要讲述基于RedHat7.2系统CDH集群非元数据库节点安装MySQL5.7.12。...那么在RedHat6操作系统安装MySQL新版本时候如何解决依赖包冲突问题及确保Agent服务正常会在后续文章做详细说明。 醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!

    1.1K60

    如何网络下免编译安装程序(RPM包)

    摘要:rpm包是预先在Linux主机上编译好并打包文件,安装起来非常快捷。不需要再进行繁琐编译等操作,拿来就能用,区别于yum包管理,rpm可以在不需要网络环境情况下使用。...安装rpm-build sudo yum install -y gcc make rpm-build redhat-rpm-config vim lrzsz 在网络机器上装备环境 需要在网络情况下解决一些依赖包环境可以使用以下命令提前在一台有网络机器上下载好...RPM包再到网络机器上安装就可以了 yum install --downloadonly --downloaddir= 创建必须文件夹和文件 mkdir -p ~/...: 依赖软件, 安装时候需要检查 Packager: 软件打包者 Vendor: 软件发行商或者打包组织信息,(Apache Software Foundation) %description...网络时提前在有网络机器上下载好依赖包就好啦 引用 How to create an RPM package/zh-hk CentOS6下rpm打包实战 Centos 6 制作 rpm 包 Linux

    2.1K170

    大规模集群下,如何快速实现死角网络连通性主动巡检

    02 传统网络主动巡检痛点主动巡检多采用手工方式,通过 CLI 工具或者脚本,向集群主动注入压力,获取集群响应情况,因此存在很多不足之处。...对于大规模 k8s 集群,希望确认所有节点间 POD 网络连通性,避免某个节点存在网络故障,发现网络中是否存在偶发丢包问题,而通信渠道非常多,包括 Pod IP、ClusterIP、NodePort、...对于不同应用需要使用不同工具检查, dns 服务、业务应用服务、磁盘等,需要运维人员对不同巡检工具有深入了解,大大提高了运维人员门槛。...kdoctor 会绑定相对应资源目标, ingress 、service,每一个 agent pod 根据任务配置相互访问绑定资源,根据请求结果得出结论 。...安装 kdoctor。

    25510

    0787-6.3.3-如何在本地集群安装Workload Experience Manager(WXM)

    关于Workload XM是如何与其他集群交互以及在本地安装Workload XM实例所依赖服务可在如下架构图中体现: ?...此部署方式最大程度减少对集群影响,并避免了升级CDH集群以满足WXM部署需求。因此建议使用独立集群安装部署WMX,对于集群硬件配置及OS版本要求如下: ?...集群接入WXM 在前面已经成功安装了Workload XM服务,也能通过浏览器正常访问Web界面,新装WXM里面是没有任何数据,这里我们需要在被接入诊断分析集群安装Telemetry Publisher...服务,接下来Fayson已CDH6.3.3集群为例介绍如何安装TP服务并进行配置。...、Yarn、Zookeeper、HDFS服务 4.Workload XM服务可以同时接入诊断分析多个CDH或CDP集群 5.需要接入Workload XM诊断分析集群,必须需要在集群Cloudera

    1.6K20

    0523-5.15-为Cloudera Manager配置自定义告警脚本

    1 文档编写目的 Cloudera Manager支持三种方式告警输出,在前面的文章《如何CDH集群配置警报邮箱》和《如何通过Cloudera Manager配置使用SNMP方式转发告警》...Fayson介绍了邮件和SNMP两种方式告警接入,那Cloudera Manager还支另外一种自定义告警脚本方式接入告警,本篇文章Fayson主要介绍如何使用自定义告警脚本方式将CM告警输出。...测试环境 1.CM和CDH版本为5.15.0 前置条件 1.CDH集群使用Cloudera Manager管理 2 环境准备 这里在Cloudera Management Service下Alert...Publisher服务所在节点安装了jq命令,主要用于解析JSON格式数据。...4 告警脚本测试 1.在集群中手动kill掉几个服务进程 ?

    2K10

    0720-5.10.0-如何在RedHat7.2使用rpm安装CDH(有CM)

    文档编写目的 在上一篇文档《5.10.0-如何在RedHat7.2使用rpm安装CDH(CM)》中介绍了如何在没有CM情况下使用rpm方式安装CDH集群,本文档将介绍如何使用CM以rpm方式安装...环境介绍: · 安装部署使用root用户进行操作 · 安装CDH和CM版本为5.10.0 · OS为RedHat7.2 · CDH集群三个节点信息如下: ?...安装前置准备 2.1 服务相关设置 安装CDH集群时需要做一些前置准备,本次安装使用环境已经做好前置准备,需要做准备如下: 1.hosts以及hostname配置正确 2.服务器没有启用IPv6且配置了静态...2.2 配置本地yum源 在官网下载好安装CDH集群需要rpm包,地址如下: http://archive.cloudera.com/cdh5/redhat/7/x86_64/cdh/5.10.0/RPMS...指定CM自定义存储库 ? 7.JDK安装 ? 8.单用户模式,这里不选择 ? 9.输入主机密码 ? 10.集群安装需要包 ? ? 11.检测CDH版本 ? 12.检查主机正确性 ?

    64030

    0723-6.2.0-如何在RedHat7.2使用rpm安装CDH(有CM)

    文档编写目的 在之前文档《0722-6.2.0-如何在RedHat7.2使用rpm安装CDH(CM)》中介绍了如何在CM上使用rpm方式安装CDH6.2.0集群,本文档将介绍如何在CM上使用rpm...方式安装CDH6.2.0集群。...环境介绍: 安装部署使用root用户进行操作 安装CDH和CM版本为6.2.0 OS为RedHat7.2 CDH集群三个节点信息如下: ?...安装前置准备 2.1 服务器相关设置 安装CDH集群时需要做一些前置准备,本次安装使用环境已经做好前置准备,需要做准备如下: 1.hosts以及hostname配置正确 2.服务器没有启用IPv6...7.选择存储库 CDH选择数据包方式 ? ? 指定CM自定义存储库 ? 8.JDK安装 ? 9.输入主机密码 ? 10.集群安装需要包 ? ? 11.检测CDH版本 ?

    97740

    CDH6.3应知应会

    CDH 简介 Cloudera Manager是一个拥有集群自动化安装、中心化管理、集群监控、报警功能一个工具,使得安装集群从几天时间缩短在几个小时内,运维人员从数十人降低到几人以内,极大提高集群管理效率...资源监控和运维:CDH内置了管理、监控、诊断、配置修改等工具,使集群监控和运维变得更加简单高效。不再需要安装第三方软件,ganglia和nagios,以进行监控和运维。...手动部署需要管理员逐个安装和配置各个组件,而 Cloudera Manager 则提供了集中式集群部署、配置、监控和维护。 4. CDH 集群如何进行故障排除和监控?...如果有,可以分享一下你在使用 CDH 部署和管理集群经验,如何添加节点、配置服务、监控集群状态等。如果没有直接使用经验,可以提及自己对 CDH 了解和学习计划。 6....CDH 集群如何实现高可用性?

    16510

    数栈V6.0全新产品矩阵发布,数据底座 EasyMR 焕新升级

    图片EasyMR 集群管理包括以下五大功能:· 主机管理:可以对接x86服务器、ARM 服务器、Kubernetes 集群等主机类型,进行包括批量接入、主机下架、主机监控等在内主机操作· 安装部署:...基于此,数栈支持 CDP/CDH 平滑迁移到 EasyMR 解决方案,大大降低企业迁移成本低。生产业务不能停,该方案支持双轨运行,即客户CDH 集群和信创 EasyMR 集群可以同时运行。...包含集群切换,及老服务器下线,新服务器上线等动作切换,最终达到 CDP/CDH 平滑迁移到 EasyMR 目的,并且实现对客户侧业务感知。...图片EasyMR 实践应用在介绍完 EasyMR 具体功能和特性之后,下文将为大家介绍2个 EasyMR 经典实践应用落地,更深地感受 EasyMR 是如何帮助企业更高效、平滑、安全地实现实现国外进口产品国产化替代...图片面对客户需求,数栈 + EasyMR 与云平台网络架构、服务器、云平台统一权限管控等各项内容实现全面兼容适配,保证在客户开通权限资源后,依然能够保障 EasyMR 稳定运行。

    37230

    如何使用StreamSets实时采集Kafka中嵌套JSON数据并写入Hive表

    1.文档编写目的 ---- 在前面的文章Fayson介绍了关于StreamSets一些文章《如何CDH安装和使用StreamSets》、《如何使用StreamSets从MySQL增量更新数据到Hive...并入库Kudu》和《如何使用StreamSets实时采集Kafka数据并写入Hive表》,本篇文章Fayson主要介绍如何使用StreamSets实时采集Kafka中嵌套JSON数据并将采集数据写入...配置Kafka相关信息,Broker、ZK、Group、Topic及Kerberos信息 ? 配置数据格式化方式,写入Kafka数据为JSON格式,所以这里选择JSON ?...5.总结 ---- 1.在使用StreamSetsKafka Consumer模块接入Kafka嵌套JSON数据后,无法直接将数据入库到Hive,需要将嵌套JSON数据解析,这里可以使用Evaluator...模块,StreamSets支持多种语言Evaluator(:JavaScprit、Jython、Groovy、Expression及Spark)。

    4.9K51

    0001-CDH网络要求(Lenovo参考架构)

    [01.jpg] 2.数据网络 数据网络是用于数据访问节点之间私有集群数据互连,比如在集群节点之间移动数据,或者将数据导入到CDH集群CDH集群通常会连接到企业内部数据网络。...需要2个TOR交换机:一个是用作带外管理,一个是用于CDH数据网络。节点带外管理至少需要一个1GbE交换机。数据网络交换机一般为10GbE,具体取决于工作负载。...通过System x3650 M5服务器中集成管理模块II(IMM2),带外管理可实现集群节点硬件级管理,节点部署,基本输入/输出系统(BIOS)配置,状态和电源状态。...G8272过载率(over-subscription ratio)是1:2. 下图展示了当CDH集群安装在多个机架上时,如何配置网络。...6.CDH只支持IPv4,不支持IPv6 7.机架之间网络连接速度应该足够快。 8.确保网络接口对于集群所有节点应该是一致

    1.8K140

    基于Ambari构建自己大数据平台产品

    我们公司最初是使用CDH环境,近日领导找到我让我基于Ambari做一个公司自己数据平台产品。...大数据平台包含数据接入模块,数据存储模块,数据计算模块,资源调度模块,集群监控模块组成,致力于完成数据存储、流计算、批处理、交互式分析等多种需求。本文将重点介绍大数据平台建设规划。...集群资源监控使用自行开发XJManager,页面应包含组件名称及状态统计信息,主机健康信息,用户管理等模块,实现用户通过Web页面就可以安装配置大数据平台。...数据接入模块   包含传感器数据采集程序接入,使用Flume采集业务系统日志数据,对接其他业务系统数据库数据。对实时采集数据使用Kafka作为缓冲。...集群监控模块 实现ambari页面汉化 修改ambari监控页面样式 实现ambari一键安装部署   目前初期建设待解决问题如下: 3.1.

    1.5K30

    0868-7.1.5-如何配置及使用Cloudera Replication Manager

    ,本文主要介绍如何配置及使用RM进行HDFS和Hive 复制 测试环境 源集群版本:CDH5.16.2、CM 5.16.2、已启用Kerberos 目标集群版本:CDH7.1.5、CM7.2.4、已启用...源集群和目标集群节点之间必须网络互通 2. 源集群和目标集群都有企业版 License 3....3.RM配置 1、在目标CDP7.1.5 集群CM界面>备份>同行中 2、点击添加同行,填写源CDH5.16.2集群地址和CM页面的管理员用户和密码 测试连接中出现如下异常,表明两个集群Kerberos...使用源集群也就是CDH5集群凭证在CDP7集群中认证,然后执行HDFS命令查看 CDP.COM 为CDP7.1.5 集群Kerberos域,FAYSON.COM为CDH5.16.2集群域 #需确认在.../user/hive/warehouse,这也是官网建议做法,这样原有 C5 应用代码可以做到感知运行。

    1.4K20

    如何为Kerberos环境CDH集群在线扩容数据节点

    集群资源紧张情况下可通过动态扩容节点来增加集群计算能力,前面Fayson文章讲过《如何在非Kerberos环境下对CDH进行扩容》、《如何使用Cloudera Manager在线为集群减容》。...本篇文章主要介绍如何为Kerberos环境CDH集群在线扩容数据节点。Kerberos和非Kerberos集群减容步骤是一样,Fayson不会专门用文章来介绍。...1.CDH集群安装成功并正常运行 2.集群已启用Kerberos 2.扩容集群环境说明 ---- 1.扩容前集群节点信息 [pur3mbddcm.jpeg] 2.扩容前HDSF容量 [72j9otl41t.jpeg...关于Kerberos客户安装可参考Fayson前面的文章《如何给Kerberos环境下CDH集群添加Gateway节点》和《如何CDH集群启用Kerberos》。...节点fayson用户导致,在执行MR作业时报错“User fayson not found” 解决方法:将集群节点上创建用户信息同步至新DataNode节点OS中。

    2.6K91

    如何给Hadoop集群划分角色

    网络要求(Lenovo参考架构)》,《如何为Hadoop集群选择正确硬件》和《CDH安装前置准备》,而我们在搭建Hadoop集群时,还一件很重要事就是如何集群分配角色。...当你使用Cloudera Manager安装向导来安装CDH时,CM会根据主机可用资源,自动分配角色到各台主机,边缘节点除外。...MySQL主备参考《如何实现CDH元数据库MySQL主备》,《如何实现CDH元数据库MySQL主主互备》和《如何实现CDH元数据库MySQL高可用》 OpenLDAP主备参考《3.如何实现OpenLDAP...CDH元数据库MySQL主备》,《如何实现CDH元数据库MySQL主主互备》和《如何实现CDH元数据库MySQL高可用》 OpenLDAP主备参考《3.如何实现OpenLDAP主主同步》 Kerberos...CDH元数据库MySQL主备》,《如何实现CDH元数据库MySQL主主互备》和《如何实现CDH元数据库MySQL高可用》 OpenLDAP主备参考《3.如何实现OpenLDAP主主同步》 Kerberos

    1.4K70

    如何使用java命令从非集群节点向CDH集群提交MapReduce作业

    CDH集群节点提交作业,这里实现方式有多种一种是将该节点加入CDH集群管理并部署GateWay角色,可以参考Fayson前面的文章《如何CDH集群增加Gateway节点》,还有一种方式就是使用java...,OS为Redhat7.2 2.非Kerberos集群CDH5.13,OS为CentOS6.5 前置条件 1.CDH集群运行正常 2.提交作业节点与集群网络互通且端口放通 3.你已知道如何下载CDH集群...conf文件以及生成keytab,并知道在代码中如何引用,否则请仔细阅读《如何使用hadoop命令向CDH集群提交MapReduce作业》和《如何跨平台在本地开发环境提交MapReduce作业到CDH集群...] 6.总结 ---- 这里需要注意是我们使用java命令向集群提交MapReduce作业,在我们代码中需要加载CDH集群配置信息(core-site.xml、hdfs-site.xml、yarn-site.xml...、mapred-site.xml),提交作业节点必须和CDH集群网络是通

    1K60
    领券