首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Kettle之“获取文件名”

    现在需要把这些文件的内容导入一个,除了文件中的两列,还要存一列记录对应的文件名。 作为一个搞数据库的,导入数据本来是小事一桩,可这有几百个文件要手工逐个处理未免太麻烦了,于是想起了Kettle。...Kettle的转换处理数据流,其中有一个“获取文件名”的输入对象,可以使用它在导入文件数据时添加上文件名字段,而且支持正则表达式同时获取多个文件名,正好适用此场景。下面为实现步骤。 1....新建一个转换,包含“获取文件名”、“文本文件输入”、“输出”三个步骤,如下图所示。 ? 2. “获取文件名”如下图所示。 ? 注意:正则表达式的*前面要加一个“.”,否则报错。 3....注意:通过这种设置后文本文件输入中字段选项无法自动获取字段。不过可以先不设置从前一步骤获取文件名,利用这个步骤的自身属性先获取字段,然后再设置。 4. “输出”如下面两图所示。 ? ?...参考:kettle读取文件目录下的数据结构一致的所有数据文件信息和内容

    3.2K10

    Kettle工具使用及总结

    操作完成之后反复尝试还是报相同的错,识别不到,则说明你的kettle版本与你的驱动版本不容,无法识别。...(例如我的kettle7.0无法识别mysql-connector-java-8.0.19.jar)。...原因:你导入的jar包被kettle识别,但是它与你本地MySQL版本不容 解决方法:换连接驱动的jar包(因为驱动版本是跟数据库版本一致的,间接说明你的kettleMySQL版本不容) 连接SQL...sql脚本在sqlserver运行不出错,但在kettle就会报错(不知道为什么,所以现在我sql脚本没有写,不过想想确实还不如直接去数据库客户端里建方便) IF NOT EXISTS (select...,在工作页面选择“获取工作名称”,选择相应的“可用项目”添加至“你的选择”中; (4)单击“字段”,在字段页面点击“获取来自头部数据的字段”,(所以Excel表格最好带有列字段列名),并可以对获取的数据字段类型进行调整

    2.5K11

    Kettle构建Hadoop ETL实践(九):事实技术

    目录 一、事实概述 二、周期快照 1. 修改数据仓库模式 2. 创建快照表数据装载Kettle转换 三、累计快照 1. 修改数据库模式 2. 修改增量抽取销售订单Kettle转换 3....修改定期装载销售订单事实Kettle转换 4. 修改定期装载Kettle作业 5. 测试 四、无事实的事实 1. 建立新产品发布的无事实事实 2. 初始装载无事实事实 3....在传统关系数据库中实现增量处理累积快照,需要行级更新,但Hive中无法这样做。...通常销售事实可以回答促销商品的销售情况,可是无法回答的一个重要问题是:处于促销状态但尚未销售的产品包括哪些?销售事实所记录的仅仅是实际卖出的产品。...首先,当迟到度量事件出现时,不得不反向搜索维度历史记录,以确定事务发生时间点的有效的维度代理键,因为当前的维度内容无法匹配输入行的情况。

    5.9K11

    Kettle构建Hadoop ETL实践(八-2):维度技术

    (1)建立示例并添加实验数据 -- 在mysql的source库中建立源 use source; create table tree (c_child int, c_name varchar...我们在MySQL的源库中建立了名为tree的,并插入了11条测试数据。该只有子节点、节点名称、父节点三个字段,其中父节点是引用子节点的外键,它们构成一个典型的递归结构。...图8-18 初始装载和定期装载递归树的作业 两个Sqoop import作业项都是如下设置,全量覆盖抽取tree的数据: --connect jdbc:mysql://node3...对于数据流的多行输入,尤其在Hive这类Hadoop上的数据库上执行这些步骤,将会慢到无法容忍的地步。...如果杂项维度的取值事先并不知道,只有在获取数据时才能确定,那么就需要在处理业务系统事务时,建立新观察到的杂项维度行。

    2.3K30

    Mysql如何随机获取中的数呢rand()

    随机获取数据的业务场景,想必大家都有遇到过,今天我们分析一下如何正确的显示随机消息. mysql> CREATE TABLE `words` ( `id` int(11) NOT NULL AUTO_INCREMENT...但是对于内存,回过程只是简单的根据数据行的位置,直接访问内存得到数据,根本不会导致多访问磁盘,因此优化器如果没有这个顾虑,那么他优先考虑的是排序的行越少越好了,所以,Mysql这个时候就会选择rowid...上图我们发现sort_buffer中的位置信息,是个什么概念呢,而Mysql是如何定位一行数据的呢, 首先我们知道mysql中有以下规则 对于有主键的innodb来说,rowid就是我们的主键 对于没有主键的...floor函数在这里的作用,就是取整数部分 获取 limit Y ,1,得到一行数据 对应的sql如下 mysql> select count(*) into @C from t; set @Y =...现在如果要获取三个随机数,根据随机算法2的思路 获取整张的总行数C 根据同样的共识获取Y1,Y2,Y3 再执行limit Y,1.获取三个随机数 对应的sql语句如下 mysql> select

    4.5K20

    Kettle构建Hadoop ETL实践(八-1):维度技术

    如果属性的含义不同或者包含不同的值,维度就不是一致的。 子维度是一种一致性维度,由基本维度的列与行的子集构成。当构建聚合事实,或者需要获取粒度级别较高的数据时,需要用到子维度。...例如,有一个进销存业务系统,零售过程获取原子产品级别的数据,而预测过程需要建立品牌级别的数据。无法跨两个业务过程模式,共享单一产品维度,因为它们需要的粒度是不同的。...第一个步骤是“输入”,获取日期维度数据,其SQL查询语句如下: select date_sk, dt, month, month_name, quarter, year from dw.date_dim...修改Kettle定过期装载作业 (1)修改增量抽取sales_order的Kettle转换 由于增加了数据列,定期装载Kettle作业中,装载销售订单过渡区和销售订单事实的转换需要做相应的修改...日期维度每行记录的含义不再指唯一一天,因此无法在同一张中标识出周、月等一致性维度,进而无法简单地处理按时间维度的上卷、聚合等需求。 四、层次维度 大多数维度都具有一个或多个层次。

    3.4K30

    程序员小sister的烦恼_快速上手大数据ETL神器Kettle(xls导入mysql)

    6.点击「字段」选项卡,点击「获取来自头部数据的字段…」按钮,Kettle会从Excel中读取第一行字段名称。...1.双击「输入」组件,会自动弹出配置窗口,点击「新建」按钮 2.配置MySQL连接 (1)输入连接名称,此处用mysql_开头,数据库名称kettle_demo为结尾 (2)在连接类型列表中...4.5.2.2 使用KettleMySQL中自动创建 要保存数据到MySQL,必须先要创建好。那么,我们是否需要自己手动在MySQL中创建一个,用来保存Excel中抽取过来的数据呢?...Kettke可以自动为我们在MySQL中创建。 1.输入目标的名称为:t_user,后续Kettle将在MySQL中创建一张名为 t_user 的表格。...Kettle将会让MySQL执行该SQL脚本。执行完后,可以在DataGrip中刷新在数据库,可以查看到Kettle帮助我们创建的t_user

    1K20

    mysql 获取分区的最大值_MySQL分区测试「建议收藏」

    分区,分区引擎测试 分区的存储引擎相同 mysql> Create table pengine1(id int) engine=myisam partition by range(id)(partition...同一个分区中的所有分区必须使用同一个存储引擎,并且存储引擎要和主表的保持一致。...4.分区类型 Range:基于一个连续区间的列值,把多行分配给分区; LIST:列值匹配一个离散集合; Hash:基于用户定义的表达式的返回值选择分区,表达式对要插入中的列值进行计算。...5.RANGE分区MAXVALUE值 及加分区测试; 创建 PRANGE,最后分区一个分区值是MAXVALUE mysql> Create table prange(id int) engine=myisam...要小心使用其中的一些函数,避免犯逻辑性的错误,引起全扫描。

    2.9K30

    Mysql实现获取自增id插入到其他

    现在有这样一个需求,就是我向A中插入一条数据,id是自增的。...插入之后,还需要向B中插入一条数据,但是B中需要保存的数据中要使用刚刚A自增后的id, 这个其实是一个比较常见的需求,就是两张之间的一个关联,如果用程序来执行也是很容易实现。...比如我就在用sql执行之后,获取A的id插入到B中 实现方式如下: insert into A (id,name,code) values (null, "zhagnsan", "zs"); // 注意...A的id要设置为自增,给null值即可 set @id = @@IDENTITY; // 使用id变量保存刚刚自增生成的id insert into B (id,a_id,name) values...(null, @id, "lisi"); // 使用变量获取AId 上面是用自定义变量的形式进行保存的,如果你只是想查一下是多少,可以直接使用: select @@IDENTITY; 好了,如果对你有帮助

    4K30

    mysql实现获取自增id插入到其他

    现在有这样一个需求,就是我向A中插入一条数据,id是自增的。...插入之后,还需要向B中插入一条数据,但是B中需要保存的数据中要使用刚刚A自增后的id, 这个其实是一个比较常见的需求,就是两张之间的一个关联,如果用程序来执行也是很容易实现。...比如我就在用sql执行之后,获取A的id插入到B中 实现方式如下: insert into A (id,name,code) values (null, "zhagnsan", "zs"); // 注意...A的id要设置为自增,给null值即可 set @id = @@IDENTITY; // 使用id变量保存刚刚自增生成的id insert into B (id,a_id,name) values...(null, @id, "lisi"); // 使用变量获取AId 上面是用自定义变量的形式进行保存的,如果你只是想查一下是多少,可以直接使用: select @@IDENTITY; 好了,如果对你有帮助

    3.5K20

    程序员小姐姐的烦恼_快速上手大数据ETL神器Kettle(xls导入mysql)

    4.3.2 在MySQL数据库中创建数据库 为了方便将Excel文件中的数据抽取到MySQL中,我们必须要创建一个名字叫kettle_demo的数据库,后续Excel中的数据会装载到该数据库的中。...6.点击「字段」选项卡,点击「获取来自头部数据的字段…」按钮,Kettle会从Excel中读取第一行字段名称。 ?...4.5.2.2 使用KettleMySQL中自动创建 要保存数据到MySQL,必须先要创建好。那么,我们是否需要自己手动在MySQL中创建一个,用来保存Excel中抽取过来的数据呢?...Kettke可以自动为我们在MySQL中创建。 1.输入目标的名称为:t_user,后续Kettle将在MySQL中创建一张名为 t_user 的表格。 ?...Kettle将会让MySQL执行该SQL脚本。执行完后,可以在DataGrip中刷新在数据库,可以查看到Kettle帮助我们创建的t_user。 ? ? 4.点击「确定」按钮,保存配置 ?

    1.4K20
    领券