Loading [MathJax]/jax/output/CommonHTML/fonts/TeX/AMS-Regular.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >02-PDI(Kettle)导入与导出

02-PDI(Kettle)导入与导出

作者头像
用户2225445
发布于 2022-11-12 07:27:11
发布于 2022-11-12 07:27:11
2.7K00
代码可运行
举报
文章被收录于专栏:IT从业者张某某IT从业者张某某
运行总次数:0
代码可运行

文章目录

02-PDI(Kettle)导入与导出

本文主要介绍基于Kettle的导入与导出,并针对每种文件特点进行相关介绍。

多个excel表格数据的合并

实验步骤:

  1. 数据准备: 在课程信息表1.xlsx中的sheet1中提供如下数据,

将该文件复制几份,放在不同的子目录下,本文的目录数据结果如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
D:\kettle-XXX-data\多个Excel合并data>tree . /f /a
卷 软件 的文件夹 PATH 列表
D:\KETTLE-REPOSITORY-DATA\CHAPTER03-1-02多个EXCEL合并DATA
|   课程信息表1.xlsx
|   课程信息表2.xlsx
|   课程信息表3.xlsx
|
\---子目录
        课程信息表4.xlsx
  1. 设计转换
  1. 命名参数的配置。 在画布上点击鼠标右键,在弹出的菜单中选择“Properties”调出命名参数设置窗口。 选择卡项“paramerers”配置命名参数,其中“Default Value”的值为待处理的输入数据的实际存储路径。
  1. ““Microsoft Excel input”的配置: Files选项设置: 数据源的 配置如下图所示:(如果该文件夹下包含有子目录,则“包含子目录”配置为”Y”)

sheet选项设置: 数据表和数据行列的的选择如下图配置:

Fields选项设置: 重新配置数据的字段,如下图所示。

  1. “Microsoft Excel 输出”的配置 配置输出的文件名,Excel版本,sheet等,如下图所示。

配置输出的字段名,如下图所示。

  1. 运行转换 依次点击菜单“Action->run”运行程序.运行完毕后,如下图所示,

点击“Preview data”浏览输出数据,亦可在实验输出路径上查看验证输出的Excel文件数据,已经合并成了一个Excel文件。

拓展 Excel介绍

最大行 1048576

最大列 列从A开始,Z结尾,XFD等同于26进制的O64 XFD是26进制的(24*26+6)*26+4=16384…也就是2^14 =16384

按住下键9小时得出的吧。其实用Ctrl+下,一次就到最后一行了。1048576好啊,这个数多整,1024x1024。对学计算机的人来说,256、1024、2^16=65536、1048576,这些都是很整很整的数。

Excel 规范与限制

https://support.microsoft.com/zh-cn/office/excel-%e8%a7%84%e8%8c%83%e4%b8%8e%e9%99%90%e5%88%b6-1672b34d-7043-467e-8e27-269d656771c3?ui=zh-cn&rs=zh-cn&ad=cn#ID0EDBD=Newer_versions

基于文本的数据导入与导出

文本文件是使用ETL工具处理的最简单的一种数据。文本文件易于交换,压缩比高,任何文本编辑器都可打开。总体来说,文本文件可分为分割符文件和固定宽度文件。 本实验读入student.csv文件,输出固定宽度为15字节的student.txt文件。student.csv文件以逗号为分隔符。

实验步骤

  1. 数据准备: student.csv的内容
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cat student.csv
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
学号,姓名,性别,班级,年龄,成绩,身高,手机
1,张一,,1701,16,78,170,18946554571
2,李二,,1701,17,80,175,18946554572
3,谢逊,,1702,18,95,169,18946554573
4,赵玲,,1702,19,86,180,18956257895
5,张明,,1704,20,85,185,18946554575
6,张三,,1704,18,92,169,18946554576
  1. 设计转换图。

如下:

  1. “CSV file input”步骤的设置

(1)点击“Browse(B)浏览”按钮,选择student.csv文件作为输入文件来处理。 (2)“Delimiter列分隔符”选择逗号(,),CSV文件默认是逗号分割。 (3)勾选“Header row present 包含列头行”,表示此文件内含有文件头(列名) (4)中文乱码可选择“File encoding 文件编码”为UTF-8 (5)点击“Get Fields获取字段”,在此步骤的字段列表中选择出此文件的8个字段。

csv input 注意事项

如果输出为等宽文本,需要在获取字段后,修改所有字段的类型为string。

  1. “Text file output”步骤的设置 File选项设置: (1)点击“Browse(B)浏览”按钮,选择等宽文件的输出路径。 (2)文件的后缀名在“extension 扩展名”中指定txt。 Content选项设置: (3)“separator分隔符”配置为空,因为我们需要输出没有分隔符的文件。 (4)“Format格式”选择“LF terminated(Unix)”或“CR+LF terminated(window,DOS)”。 Fileds选项设置: (5)点击“Get Fields获取字段”按钮,在字段列表上选择出此文件的所有字段。然后,在各个字段的“长度”中,输入“15”,表示每个输出字段的长度为15字节。
  1. 点击运行按钮运行转换。 输出文件输出文件.txt内容如下:

扩展 回车与换行的区别

转载于:http://www.pythontab.com/html/2017/linuxkaiyuan_0115/1116.html

关于换行和回车其实平时我们不太在意,所以关于两者的区别也不太清楚,在平时开发时可能会遇到一些文件处理的问题,放到不同的操作系统上出现各种坑。那么回车和换行到底有哪些区别呢?今天咱们就来总结一下。

  1. 由来

在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的机械打字机,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。

于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车”,告诉打字机把打印头定位在左边界,不卷动滚筒;另一个叫做“换行”,告诉打字机把滚筒卷一格,不改变水平位置。

这就是“换行”和“回车”的由来。

  1. 使用

后来,计算机发明了,这两个概念也就被般到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。

回车 \r 本义是光标重新回到本行开头,r的英文return,控制字符可以写成CR,即Carriage Return

换行 \n 本义是光标往下一行(不一定到下一行行首),n的英文newline,控制字符可以写成LF,即Line Feed

符号 ASCII码 意义

\n 10 换行NL (0x0A)

\r 13 回车CR (0x0D)

\r\n (0x0D,0x0A)

在不同的操作系统这几个字符表现不同,比如在WIN系统下,这两个字符就是表现的本义,在UNIX类系统,换行\n就表现为光标下一行并回到行首,在MAC上,\r就表现为回到本行开头并往下一行,至于ENTER键的定义是与操作系统有关的。通常用的Enter是两个加起来。

不同操作系统下的含义:

\n: UNIX 系统行末结束符

\r\n: window 系统行末结束符

\r: MAC OS 系统行末结束符

我们经常遇到的一个问题就是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。

后来,Mac 改成跟Unix/Linux 一样的“\n”

“first line\rsecond line” 的效果是:

“first line\nsecond line” 的效果是:

只有 “first line\r\nsecond line” 才能展示成:

计算机时代改用计算机之后,该怎么办呢?早期的 ADM-3A 计算机的键盘有人觉得还是保留原来打字机的习惯,继续用 CR LF (\r\n),例如 MS-DOS 操作系统,再比如网络协议。 Windows 自然也是沿用 MS-DOS 的传统。有人觉得计算机没有必要保留打字机的旧习惯,留下一个就够了。这其中又有人用 LF (\n),例如 Unix 也有人用 CR (\r),例如 Mac OS 经典操作系统(Mac OS 9 以及之前)。后来 Mac OS X 也把 Mac OS 9 的规矩废除了,投奔Unix,所以改成用 LF (\n)。今天,我们看到的就是 Windows 与网络协议都用 CR LF ,而类 Unix 操作系统都用 LF 。

  1. 软回车和硬回车

再扩展一下回车的一些知识。 硬回车就是普通我们按回车产生的,它在换行的同时也起着段落分隔的作用。 软回车是用 Shift + Enter 产生的,它换行,但是并不换段,即前后两段文字在 Word 中属于同一“段”。在应用格式时你会体会到这一点。 软回车能使前后两行的行间距大幅度缩小,因为它不是段落标记,要和法定的段落标记——硬回车区别出来。硬回车的html代码是

,段落的内容就夹在里面,而软回车的代码很精悍: 。网页的文字如果复制到word中,则硬回车变为弯曲的箭头,软回车变为向下的箭头。

基于XML文本的数据导入导出

步骤设计

  1. 准备数据
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<?xml version='1.0' encoding='UTF-8'?>
<CATALOG>
<CD>
<TITLE>Empire Burlesque</TITLE>
<ARTIST>Bob Dylan</ARTIST>
<COUNTRY>USA</COUNTRY>
<COMPANY>Columbia</COMPANY>
<PRICE>10.90</PRICE>
<YEAR>1985</YEAR>
</CD>
<CD>
<TITLE>Hide your heart</TITLE>
<ARTIST>Bonnie Tyler</ARTIST>
<COUNTRY>UK</COUNTRY>
<COMPANY>CBS Records</COMPANY>
<PRICE>9.90</PRICE>
<YEAR>1988</YEAR>
</CD>
<CD>
<TITLE>Greatest Hits</TITLE>
<ARTIST>Dolly Parton</ARTIST>
<COUNTRY>USA</COUNTRY>
<COMPANY>RCA</COMPANY>
<PRICE>9.90</PRICE>
<YEAR>1982</YEAR>
</CD>
<CD>
<TITLE>Still got the blues</TITLE>
<ARTIST>Gary Moore</ARTIST>
<COUNTRY>UK</COUNTRY>
<COMPANY>Virgin records</COMPANY>
<PRICE>10.20</PRICE>
<YEAR>1990</YEAR>
</CD>
</CATALOG>
  1. 转换步骤设计如下:
  1. Get data from XML设置

将文件添加到选择文件区域

选择get xpath nodes

设置fileds

  1. Excel输出设置

这里先不描述

  1. XML output设置
  1. 输出的文件为:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<?xml version='1.0' encoding='UTF-8'?>
<CATALOG>
<CD><TITLE>Empire Burlesque</TITLE> <ARTIST>Bob Dylan</ARTIST> <COUNTRY>USA</COUNTRY> <COMPANY>Columbia</COMPANY> <PRICE>10.9</PRICE> <YEAR>1985</YEAR></CD>
...
<CD><TITLE>Still got the blues</TITLE> <ARTIST>Gary Moore</ARTIST> <COUNTRY>UK</COUNTRY> <COMPANY>Virgin records</COMPANY> <PRICE>10.20</PRICE> <YEAR>1990</YEAR></CD>
</CATALOG>

扩展 XML教程

内容较多,参考 http://www.jk1123.com/?p=124 https://blog.csdn.net/L_ZG_/article/details/105363109

基于JSON文本的数据导入导出

实验步骤

  1. 准备数据 本案例数据位于:XX\read-nested-fields.js 内容如下:
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
  {
       "missions":
    	 [
    		{
    			"id": "59434767",
    			 "timestamp": "2011-11-21 09:21:53",
    			 "data": [
      				{
      					"field": "13776121",
      					"value": "Baylor Dallas"
       				},
    				{
                        "field": "13776401",
                        "value": "CHF"
      				},
       
    			    {
                      	"field": "13777966",
                       	"value": "John Doe"
                     },
     
    			     {
                      	"field": "13780027",
                       	"value": "9999"
                      } ]
     
    		 },
                
    		{
                 "id": "59474875",
    			 "timestamp": "2011-11-21 17:01:22",
    			 "data": [
                     {
                     "field": "13776121",
                     "value": "Healthsouth,"
                     },
    
                    {
                    "field": "13776401",
                    "value": "Pneumonia"
                    },
    
                    {
                    "field": "13777966",
                    "value": "Jane Doe"
                    } 
              ]
    
            }],
            "total": 2,
            "pages": 1
        }
  1. 步骤设计

转换步骤设计如下:

  1. json input 设置 File选项设置: 设置文件地址:XX\read-nested-fields.js

content选项设置为默认设置

fields选项设置: id 表示json数据,.missions…id表示获取该文件中missions下的子元素的中的id子元素。 data 表示json数据,.missions…data表示获取该文件中missions下的子元素的中的data子元素。

  1. json input get -nested fields设置 File选项设置: 勾选source is from previous step,表示选择读取上一步骤的源字段 select field:会自动提示上一步骤中的data和id字段,这里勾选data字段。

fileds选项设置

  1. excel output设置 与前面基本类似,重点在于设置字段选择
  2. json out put 设置

拓展 JSON

JSON格式相关 https://www.bejson.com/

基于数据库的数据导入与导出

实验步骤

当前,市场上主流的关系型数据库MySQL、Oracle、SQL Server、DB2等。面对这些类型的关系型数据库,Kettle都可以使用“表输入”“表输出”这两个步骤完成数据的导入与导出。 本实验读入student表数据,输出满足身高大于等于170,成绩大于等于80的学生数据。输出的数据存储在StuOut表中。

1.在mysql命令行执行student.sql脚本脚本内容

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
SET NAMES utf8mb4;
SET FOREIGN_KEY_CHECKS = 0;

-- ----------------------------
-- Table structure for student
-- ----------------------------
DROP TABLE IF EXISTS `student`;
CREATE TABLE `student`  (
  `学号` int(11) NOT NULL,
  `姓名` varchar(45) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `性别` varchar(45) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `班级` varchar(45) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `年龄` varchar(45) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `成绩` int(15) NULL DEFAULT NULL,
  `身高` varchar(45) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  `手机` varchar(45) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL,
  PRIMARY KEY (`学号`) USING BTREE
) ENGINE = InnoDB CHARACTER SET = utf8 COLLATE = utf8_general_ci ROW_FORMAT = Dynamic;

-- ----------------------------
-- Records of student
-- ----------------------------
INSERT INTO `student` VALUES (1, '张一', '男', '1701', '16', 78, '170', '18946554571');
INSERT INTO `student` VALUES (2, '李二', '男', '1701', '17', 80, '175', '18946554572');
INSERT INTO `student` VALUES (3, '谢逊', '男', '1702', '18', 95, '169', '18946554573');
INSERT INTO `student` VALUES (4, '赵玲', '女', '1702', '19', 86, '180', '18956257895');
INSERT INTO `student` VALUES (5, '赵明', '男', '1704', '20', 85, '185', '18946554575');
INSERT INTO `student` VALUES (6, '张三', '女', '1704', '18', 92, '169', '18946554576');

SET FOREIGN_KEY_CHECKS = 1;

执行脚本

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
source  /home/ubuntu/student.sql

2.新建转换如下

  1. data grid设置
  1. table input设置 创建mysql_conn连接,并测试

测试完成后,执行Get SQL select statement 修改sql语句,添加

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
WHERE 身高>? AND 成绩>?

这一步骤需要勾选Replace variables in,并选择insert data from step选择上一步骤的data grid。 完整SQL为:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
SELECT
  学号
, 姓名
, 性别
, 班级
, 年龄
, 成绩
, 身高
, 手机
FROM student
WHERE 年龄 >? AND 成绩 > ?
  1. table output 选择target后,可以执行下sql

执行sql后,可以映射字段

注意:这里可以多次尝试,比如去掉specify database fields,get fields ,table field的字段可以手动选择。

拓展 kettle分享数据库连接

先在一个转换中创建连接后,通过view – 》database connections --》 数据库连接–》share就可以分享了

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021-11-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
03-PDI(Kettle)导入与导出CDC
参考博客: https://blog.csdn.net/qq_38097573/article/details/103593150
用户2225445
2022/11/12
8210
03-PDI(Kettle)导入与导出CDC
pandas的基本用法——导入导出数据
本文主要是关于pandas的数据导入导出功能,非常简单。pandas支持的导入数据格式有csv,excel,sql,json,html,pickle等。导入数据使用的csv文件,student.csv文件内容为:
Tyan
2019/05/25
1.3K0
【实战】使用 Kettle 工具将 mysql 数据增量导入到 MongoDB 中
1)根据 source 和 db 字段来获取 MongoDB 集合内 business_time 最大值。
create17
2020/02/18
5.7K0
【实战】使用 Kettle 工具将 mysql 数据增量导入到 MongoDB 中
学习 XSLT:XML文档转换的关键
一个 <table> 元素可能表示 HTML 表格、一件家具或其他东西 - 浏览器不知道如何显示它!
小万哥
2024/04/09
7010
学习 XSLT:XML文档转换的关键
Web安全 | 带你了解一下XML及其注入的相关知识
前段时间学习了.Net,通过更改XML让连接数据库变得更方便,简单易懂,上手无压力,便对XML注入这块挺感兴趣的,刚好学校也开了XML课程,忍不住花时间研究了一下
Power7089
2019/07/25
4.2K0
Web安全 | 带你了解一下XML及其注入的相关知识
2.XML之编程解析示例笔记
描述:在采用JavaScript解析XML时候常常采用AJAX 技术 与 XML 的融合,即XML解析器把 XML 文档转换为 XML DOM 对象 - 可通过 JavaScript 操作的对象。
全栈工程师修炼指南
2020/10/23
8500
2.XML之编程解析示例笔记
Hive数据仓库DDL应用
假设张三是xx公司的大数据开发工程师,现在xx Music有一千万用户在每天播放音乐和收藏音乐,那么张三要如何设计音乐榜单数据仓库来进行数据分析呢。
esse LL
2024/03/17
2540
XML基础
随着Internet的飞速发展,HTML因扩展困难、交互性差和语义模糊等缺点在日益增长的网络设计需求面前呈现出弱势。标准、简洁、结构严谨、可扩展性高的XML应运而生。在推出之初,XML提供通用数据交换、改变Web发布、改变分布式计算的功能。如今,XML不仅对软件开发的各个方面都产生了巨大影响,而且在各行各业都得到了充分应用。
张哥编程
2024/12/17
2120
Kettle构建Hadoop ETL实践(三):Kettle对Hadoop的支持
本篇演示使用Kettle操作Hadoop上的数据。首先概要介绍Kettle对大数据的支持,然后用示例说明Kettle如何连接Hadoop,如何导入导出Hadoop集群上的数据,如何用Kettle执行Hive的HiveQL语句,还会用一个典型的MapReduce转换,说明Kettle在实际应用中是怎样利用Hadoop分布式计算框架的。本篇最后介绍如何在Kettle中提交Spark作业。
用户1148526
2020/09/02
6.6K0
MySQL DML 数据操作
如果发现表中已经有此行数据(根据主键或者唯一索引判断)则先删除此行数据,然后插入新的数据,否则直接插入新数据。
恋喵大鲤鱼
2023/10/12
2530
大数据ETL开发之图解Kettle工具(入门到精通)
ETL (Extract-Transform-Load 的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种ETL工具的使用,必不可少。
全栈程序员站长
2022/07/01
21.9K0
大数据ETL开发之图解Kettle工具(入门到精通)
批量数据导入Neo4j的方式
Cypher中的LOAD CSV命令允许我们指定一个文件路径、是否有头文件、不同的值定界符,以及Cypher语句,以便我们在图形中对这些表格数据进行建模。
WHYBIGDATA
2023/01/31
2.3K0
批量数据导入Neo4j的方式
【DB笔试面试446】如何将文本文件或Excel中的数据导入数据库?
有多种方式可以将文本文件的数据导入到数据库中,例如,利用PLSQL Developer软件进行复制粘贴,利用外部表,利用SQL*Loader等方式。至于EXCEL中的数据可以另存为csv文件(csv文件其实是逗号分隔的文本文件),然后导入到数据库中。
AiDBA宝典
2019/09/30
4.9K0
kettle使用文件导入到Postgresql出现如下几种问题的总结
1、kettle使用文件导入到Postgresql出现如下几种问题的总结: 1 kettle使用文件导入到Postgresql出现如下几种问题的总结: 2 1、第一种错误,报错如ERROR: extra data after last expected column所示。或者报错为报错为0x05,多一列,extra data after last expected column。 3 1)、sql查询语句定位到某个字段: 4 SELECT * from 数据表名称 where 字段名称 l
别先生
2019/01/02
1.1K0
MySQL 数据导入与导出的深入解析
在现代数据库管理中,数据的导入与导出是日常工作的重要组成部分。MySQL 提供了高效且易用的命令用于实现数据的文件级迁移,包括从数据库导出到文件以及从文件导入到数据库的操作。本文将深入探讨 MySQL 的 SELECT ... INTO OUTFILE 和 LOAD DATA INFILE 两个命令,涵盖其用法、原理、场景和潜在问题。
九转成圣
2025/01/20
2140
SpringBoot整合EasyExcel,Excel导入导出就靠它了
本文讲解了如何在SpringBoot项目中整合EasyExcel,实现Excel快捷导入导出,解析Excel导入导出的实现过程,提供了相关源码。
Designer 小郑
2023/08/02
1.7K0
SpringBoot整合EasyExcel,Excel导入导出就靠它了
VUE中使用vue-json-excel超级方便导出excel表格数据
在项目开发时免不了有时会用到表格数据导出excel的功能,以前会用file-saver xlsx script-loader来导出,而且配置非常麻烦,现在用vue-json-excel配置VUE中使用vue-json-excel超级方便导出excel表格数据 及使用都非常简单 一、安装vue-json-excel npm install vue-json-excel -S 1 二、main.js里面引入并注册使用 import JsonExcel from 'vue-json-excel' Vue.com
IT工作者
2022/02/21
7K1
JeeSite | Excel 导入导出
  在各种管理系统中,数据的导入导出是经常用到的功能,通常导入导出以 Excel、CSV 格式居多。如果是学习的过程中,最好是自己实现数据导入与导出的功能,然而在项目中,还是调用现成的功能比较好。以前使用过一款名叫 JeeSite 的开源项目来进行二次开发,记录了该项目对于 Excel 导入导出数据的过程。JeeSite 提供了很好的 Excel 的导入导出功能,隐藏了底层的很多实现,通过简单的套路式步骤即可完成数据的 Excel 数据的导入导出。对于没有使用过 JeeSite 的可以不用往下看了,因为下面的代码是跟 JeeSite 二次开发相关的代码,不做 JeeSite 的二次开发,以下代码对您无用,在这里友情提醒,避免浪费您宝贵的时间。
码农UP2U
2020/08/26
1.7K1
Kettle安装详细步骤和使用示例
Kettle 是 PDI 以前的名称,PDI 的全称是Pentaho Data Integeration,Kettle 本意是水壶的意思,表达了数据流的含义。Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。作为Pentaho的一个重要组成部分,现在在国内项目应用上逐渐增多。
bboy枫亭
2021/12/07
3.4K0
Kettle安装详细步骤和使用示例
asp.net core导出导入excel
使用NPOI导入导出excel,已经封装好Action可以直接调用 导出 效果图 使用方法 定义导出实体 class Student { public int Id { get; set; }
用户6362579
2019/09/29
4.1K0
asp.net core导出导入excel
推荐阅读
相关推荐
03-PDI(Kettle)导入与导出CDC
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档