kettle linux怎么用_kettle linux_linux kettle - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

kettle使用教程(超详细)

这样就算你可以入门了，我相信在不断的探索中你会有更多的心得的。在此也要提醒一点，KETTLE的性能可能会有不稳定的情况出现，所以注意保存你已经做过的东西。

02

Kettle构建Hadoop ETL实践（二）：安装与配置

在前一篇里介绍了ETL和Kettle的基本概念，内容偏重于理论。从本篇开始，让我们进入实践阶段。工欲善其事，必先利其器。既然我们要用Kettle构建Hadoop ETL应用，那么先要做的就是安装Kettle。本篇首先阐述选择安装环境所要考虑的因素，之后详细介绍Kettle的安装过程，最后说明Kettle配置文件、启动脚本和JDBC驱动管理。本专题后面的实践部分都是基于这里所安装的Kettle之上完成的。

03

您找到你想要的搜索结果了吗？

是的

没有找到

Kettle（PDI）的坑，有点大

网络上有不少Kettle的文章，但实际上都大同小异，都是些非常基础的文章，实际上在使用过程中还有遇到不少的坑，这部分在网上资料比较少，这里主要讲一下我们在使用过程中遇到的各种问题，属于难得的实践经验。

04

kettle学习【大牛经验】

ETL是EXTRACT（抽取）、TRANSFORM（转换）、LOAD（加载）的简称，实现数据从多个异构数据源加载到数据库或其他目标地址，是数据仓库建设和维护中的重要一环也是工作量较大的一块。当前知道的ETL工具有informatica, datastage,kettle,ETL Automation,sqoop,SSIS等等。这里我们聊聊kettle的学习吧（如果你有一定的kettle使用，推荐看看Pentaho Kettle解决方案，这里用kettle实践kimball的数据仓库理论）

02

Linux系列--定时任务设置

用在linux环境下调度kettle脚本为案例说明在Linux环境下做定时任务的过程

01

kettle下载安装使用教程

Kettle是一款国外开源的ETL工具，纯java编写，可以在Window、Linux、Unix上运行，数据抽取高效稳定。Kettle 中文名称叫水壶，该项目的主程序员MATT 希望把各种数据放到一个壶里，然后以一种指定的格式流出。Kettle这个ETL工具集，它允许你管理来自不同数据库的数据，通过提供一个图形化的用户环境来描述你想做什么，而不是你想怎么做。Kettle中有两种脚本文件，transformation和job，transformation完成针对数据的基础转换，job则完成整个工作流的控制。

03

kettle调度监控平台（kettle-scheduler）开源[通俗易懂]

Kettle作为用户规模最多的开源ETL工具，强大简洁的功能深受广大ETL从业者的欢迎。但kettle本身的调度监控功能却非常弱。Pentaho官方都建议采用crontab(Unix平台)和计划任务(Windows平台)来完成调度功能。所以大家在实施kettle作业调度功能的时候，通常采用以下几种方式：使用spoon程序来启动Job，使用crontab或计划任务，自主开发java程序来调用kettle的类库。

kettle 教程（一）：简介及入门「建议收藏」

kettle 是纯 java 开发，开源的 ETL工具，用于数据库间的数据迁移。可以在 Linux、windows、unix 中运行。有图形界面，也有命令脚本还可以二次开发。

02

kettle參数、变量具体解说「建议收藏」

kettle 3.2 曾经的版本号里仅仅有 variable 和 argument，kettle 3.2 中。又引入了 parameter 概念。variable 即environment variables（环境变量或全局变量）。即使是不同的转换它们也拥有相同的值；而argument（位置參数）和parameter（命名參数），能够映射为局部变量，仅仅针对一个特定的转换，比方像是限定结果集的大小和过滤条件。

02

Kettle与Hadoop（二）Kettle安装配置

本文描述在CentOS 7.2上安装和运行Kettle 8.3的步骤。

05

开源基于开源Kettle自研的大数据调度服务监控平台

https://gitee.com/yaukie/x-smart-kettle-server

01

Linux下环境变量配置方法梳理（.bash_profile和.bashrc的区别）

在linux系统下，如果下载并安装了应用程序，在启动时很有可能在键入它的名称时出现"command not found"的提示内容。如果每次都到安装目标文件夹内，找到可执行文件来进行操作就太繁琐了，这种情况下就涉及到环境变量PATH的设置问题，而PATH的设置也是在linux下定制环境变量的一个组成部分。环境变量配置的两个方法： 1）修改/etc/profile文件推荐使用这种方法，因为所有用户的shell都有权使用这些环境变量，缺点是可能会给系统带来安全性问题。这里是针对所有的用户的,所有的she

06

ETL开发工具KETTLE使用教程「建议收藏」

Kettle的建立数据库连接、使用kettle进行简单的全量对比插入更新：kettle会自动对比用户设置的对比字段，若目标表不存在该字段，则新插入该条记录。若存在，则更新。

01

07-PDI(Kettle)源码编译8.2.0.0.R版本

博客上有很多关于PDI源码编译的文章，但大多版本较早，或是有些文件已经找不多，本博客基于2021年10月的PDI源码编译过程制作而成，并在编译过程中解决了对应的问题，解决方案放在博客最后。

02

Linux下环境变量配置方法小结（.bash_profile和.bashrc的区别）

在linux系统下，如果下载并安装了应用程序，在启动时很有可能在键入它的名称时出现”command not found”的提示内容。如果每次都到安装目标文件夹内，找到可执行文件

03

Kettle教程一：Kettle简介和Kettle的部署安装

ETL（Extract-Transform-Load的缩写，即数据抽取、转换、装载的过程），对于开发或者运维人员来说，我们经常会遇到各种数据的处理，转换，迁移，所以了解并掌握一种ETL工具的使用，必不可少，这里我们要学习的ETL工具就是Kettle！

06

使用kellte（ETL工具）对数据的抽取、迁移等操作（入门安装篇）

Kettle简介：Kettle是一款国外开源的ETL工具，纯java编写，可以在Window、Linux、Unix上运行，数据抽取高效稳定。Kettle 中文名称叫水壶，该项目的主程序员MATT 希望把各种数据放到一个壶里，然后以一种指定的格式流出。Kettle这个ETL工具集，它允许你管理来自不同数据库的数据，通过提供一个图形化的用户环境来描述你想做什么，而不是你想怎么做。Kettle中有两种脚本文件，transformation和job，transformation完成针对数据的基础转换，job则完成整个工作流的控制。（引用百度百科）

02

企业实战（20）ETL数据库迁移工具Kettle的安装配置详解

Kettle简介：Kettle 是 PDI 以前的名称，PDI 的全称是Pentaho Data Integeration，Kettle 本意是水壶的意思，表达了数据流的含义。Kettle是一款国外开源的ETL工具，纯java编写，可以在Window、Linux、Unix上运行，绿色无需安装，数据抽取高效稳定。Kettle这个ETL工具集，它允许你管理来自不同数据库的数据，通过提供一个图形化的用户环境来描述你想做什么，而不是你想怎么做。Kettle中有两种脚本文件，transformation和job，transformation完成针对数据的基础转换，job则完成整个工作流的控制。作为Pentaho的一个重要组成部分，现在在国内项目应用上逐渐增多。

01

kettle学习笔记（一）——入门与安装

Kettle是一款国外开源的ETL工具，纯java编写，可以在Window、Linux、Unix上运行，绿色无需安装，数据抽取高效稳定。中文名称叫水壶，该项目的主程序员MATT 希望把各种数据放到一个壶里，然后以一种指定的格式流出。

02

kettle教程（1）简单入门、kettle简单插入与更新。打开kettle

本文要点：Kettle的建立数据库连接、使用kettle进行简单的全量对比插入更新：kettle会自动对比用户设置的对比字段，若目标表不存在该字段，则新插入该条记录。若存在，则更新。

01

Kettle工具的基本使用[通俗易懂]

Kettle是国外免费的开源轻量级ETL工具，是基于Java语言开发的，可以在Windows.Linux,UNIX系统上运行，且绿色不需安装，可用于各种数据库之间的连接。

03

etl调度工具必备的10个功能属性

taskctl是一款国内开源的ETL工具，纯C编写，可以在Window、Linux、Unix上运行。

03

小程聊微服务-数据抽取那点事（二）

ETL（Extract-Transform-Load的缩写，即数据抽取、转换、装载的过程），对于企业或行业应用来说，我们经常会遇到各种数据的处理，转换，迁移，所以了解并掌握一种etl工具的使用，这里介绍一个ETL工具Kettle，这个工具很强大，支持图形化的GUI设计界面，然后可以以工作流的形式流转，在做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面有着比较稳定的表现。

02

kettle相关知识

开源ETL工具(Kettle) V5.1.0 免费Spoon版 http://www.cr173.com/soft/30051.html ETL工具大全，你了解多少 http://bbs.csdn.net/topics/390349305 Kettle_抽取数据举例 http://blog.csdn.net/huangyanlong/article/details/42264543

04

使用kettle迁移oracle 12c数据到mysql (简单例子)

Hitachi Data Systems于2017年改名为Hitachi Vantara 了.

01

【开发者推荐】告别繁琐：一键解锁国产 ETL 新贵，Kettle 的终结者

TASKCTL 是一款免费、国产的ETL调度工具。以其实时数据集成、全 WEB 可视化操作、高性能和对国产数据库的深度支持，迅速成为市场的新选择。

01

还不会使用大数据ETL工具Kettle，你就真的out了!

最近在做一个数仓项目，其中就用到了Kettle。对于像我这样的小白来说，自然也是第一次使用。但好在熟能生巧，在快速掌握了如何使用之后，便打算单独拿一期来好好为大家科普一下什么是Kettle，以及如何简单入门~

02

开源ETL工具之Kettle介绍

Kettle是一个Java编写的ETL工具，主作者是Matt Casters，2003年就开始了这个项目，最新稳定版为7.1。 2005年12月，Kettle从2.1版本开始进入了开源领域，一直到4.1版本遵守LGPL协议，从4.2版本开始遵守Apache Licence 2.0协议。 Kettle在2006年初加入了开源的BI公司Pentaho, 正式命名为：Pentaho Data Integeration，简称“PDI”。自2017年9月20日起，Pentaho已经被合并于日立集团下的新公司： Hitachi Vantara。总之，Kettle可以简化数据仓库的创建，更新和维护，使用Kettle可以构建一套开源的ETL解决方案。

01

kettle的基础概念入门、下载、安装、部署

答：ETL（Extract-Transform-Load的缩写，即数据抽取、转换、装载的过程），对于企业或行业应用来说，我们经常会遇到各种数据的处理，转换，迁移，所以了解并掌握一种etl工具的使用，必不可少，这里我要学习的ETL工具是Kettle！

02

数据库同步工具etl之kettle

公司领导交给我了一个活，让我用etl工具将数据清洗,并同步到我们公司的数据中心，于是我便在网上找教程学习了etl。

03

Kettle Carte集群在windows 上的部署与运行

carte是由kettle所提供的web server的程序， carte也被叫做子服务器（slave）在kettle调用集群（cluster）来进行分布式分发、处理任务的时候，

01

大数据实战【千亿级数仓】项目总结

写在前面：博主是一名软件工程系大数据应用开发专业大二的学生，昵称来源于《爱丽丝梦游仙境》中的Alice和自己的昵称。作为一名互联网小白，写博客一方面是为了记录自己的学习历程，一方面是希望能够帮助到很多和自己一样处于起步阶段的萌新。由于水平有限，博客中难免会有一些错误，有纰漏之处恳请各位大佬不吝赐教！个人小站:http://alices.ibilibili.xyz/ , 博客主页:https://alice.blog.csdn.net/ 尽管当前水平可能不及各位大佬，但我还是希望自己能够做得更好，因为一

03

系列 | 漫谈数仓第三篇NO.3 『数据魔法』ETL

☞ ETL同步之道 [ Sqoop、DataX、Kettle、Canal、StreaSets ]

03

大数据ETL开发之图解Kettle工具（入门到精通）

ETL (Extract-Transform-Load 的缩写，即数据抽取、转换、装载的过程)，对于企业或行业应用来说，我们经常会遇到各种数据的处理，转换，迁移，所以了解并掌握一种ETL工具的使用，必不可少。

kettle学习笔记（三）——kettle资源库、运行方式与日志

资源库是用来保存转换任务的，用户通过图形界面创建的的转换任务可以保存在资源库中。

02

数据同步工具

公司要搞数据平台，首当其冲的是把旧库的数据导入到新库中，原本各种数据库大部分都提供了导入导出的工具，但是数据存储到各个地方，mongdb,hbase,mysql,oracle等各种各样的不同数据库，同步起来头都大了

02

系列 | 漫谈数仓第三篇NO.3 『数据魔法』ETL

☞ ETL同步之道 [ Sqoop、DataX、Kettle、Canal、StreamSets ]

04

Kettle安装详细步骤和使用示例

Kettle 是 PDI 以前的名称，PDI 的全称是Pentaho Data Integeration，Kettle 本意是水壶的意思，表达了数据流的含义。Kettle是一款国外开源的ETL工具，纯java编写，可以在Window、Linux、Unix上运行，绿色无需安装，数据抽取高效稳定。Kettle这个ETL工具集，它允许你管理来自不同数据库的数据，通过提供一个图形化的用户环境来描述你想做什么，而不是你想怎么做。Kettle中有两种脚本文件，transformation和job，transformation完成针对数据的基础转换，job则完成整个工作流的控制。作为Pentaho的一个重要组成部分，现在在国内项目应用上逐渐增多。

01

超详细的六款主流ETL工具介绍及功能对比

ETL（Extract-Transform-Load的缩写，即数据抽取、转换、装载的过程），对于企业或行业应用来说，我们经常会遇到各种数据的处理，转换，迁移，所以了解并掌握一种etl工具的使用，必不可少。最近用kettle做数据处理比较多，所以也就介绍下这方面内容，这里先对比下几款主流的ETL工具。

触类旁通Elasticsearch：安装

输出如下，缺省的集群名称为elasticsearch，已经启动一个名为“yO9AEg-”的节点。

02

Hadoop的数据采集框架

问题导读： Hadoop数据采集框架都有哪些？ Hadoop数据采集框架异同及适用场景？

02

kettle工具的介绍和使用

原文地址链接：https://blog.csdn.net/qq_35731570/article/details/71123413

02

大数据开发体系，进来了解一下？

掌握Linux必备知识，熟悉Python的使用与爬虫程序的编写，搭建Hadoop（CDH）集群，为大数据技术学习打好基础。

06

Kettle构建Hadoop ETL实践（一）：ETL与Kettle

我在2017年写了一本名为《Hadoop构建数据仓库实践》的书。在这本书中，较为详细地讲解了如何利用Hadoop（Cloudera's Distribution Including Apache Hadoop，CDH）生态圈组件构建传统数据仓库。例如，使用Sqoop从关系数据库全量或增量抽取数据到Hadoop系统，使用Hive进行数据转换和装载处理等等。作为进阶，书中还说明了数据仓库技术中的渐变维、代理键、角色扮演维度、层次维度、退化维度、无事实事实表、迟到事实、累计度量等常见问题在Hadoop上的处理。它们都是通过Hive SQL来实现的，其中有些SQL语句逻辑复杂，可读性也不是很好。

07

kettle工具中嵌入java代码_kettle设置变量

插件地址 https://download.csdn.net/download/xukun5137/12267874

03

ETL-Kettle学习笔记（入门，简介，简单操作）

Kettle是一款国外开源的ETL工具，纯java编写，可以在Window、Linux、Unix上运行，绿色无需安装，数据抽取高效稳定。

03

ETL 是什么 ETL 工具有哪些 ETL 数据交换系统

ETL简介ETL是英文Extract-Transform-Load的缩写。用来描述将数据从源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。它能够对各种分布的、异构的源数据(如关系数据)进行抽取。按照预先设计的规则将不完整数据、重复数据以及错误数据等“脏"数据内容进行清洗。得到符合要求的“干净”数据，并加载到数据仓库中进行存储。这些“干净”数据就成为了数据分析、数据挖掘的基石。ETL重要性ETL是实现商务智能(Business Intelligence,BI)的核心

01

【实战】使用 Kettle 工具将 mysql 数据增量导入到 MongoDB 中

1）根据 source 和 db 字段来获取 MongoDB 集合内 business_time 最大值。

03

国产数据仓库常用ETL调度平台TASKCTL对于Kettle作业类型的转换使用

TASKCTL默认采用pan命令方式调度kettle转换作业。除此之外，我们还提供了taskctl-plugin-kettle（Soap服务）插件的方式驱动kettle转换。相比原生的pan命令，Soap服务直接驱动kettle核心进行调度。资源消耗更低、速度更快，支持高并发。

03

Kettle构建Hadoop ETL实践（三）：Kettle对Hadoop的支持

本篇演示使用Kettle操作Hadoop上的数据。首先概要介绍Kettle对大数据的支持，然后用示例说明Kettle如何连接Hadoop，如何导入导出Hadoop集群上的数据，如何用Kettle执行Hive的HiveQL语句，还会用一个典型的MapReduce转换，说明Kettle在实际应用中是怎样利用Hadoop分布式计算框架的。本篇最后介绍如何在Kettle中提交Spark作业。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭