前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >项目四 kettle预处理北京公交线路

项目四 kettle预处理北京公交线路

原创
作者头像
弟大翻着洗
发布2024-09-25 22:43:27
1030
发布2024-09-25 22:43:27
举报
文章被收录于专栏:人邮电数据采集与预处理

启动kettle

  • 双击Spoon.bat文件

新建一个Transformations

  • 输入文件 (Text file input
  • 转换(unique row
  • 应用(if field value is null
  • 输出(Table output
  • 按住shift键将这些模块依次连接,并将表输出设置为主输出步骤
  • 设置表输入(Text file input
  • 浏览要导入的文件,然后添加该文件路径,最后确定
  • 点击connect选项卡,设置相关参数,最后点击确定
  • 点击获取字段,输入100,最后点击确定
  • 编辑(unique row
  • 编辑(if field value is null
  • 编辑(Table output
  • 此处要连接MySQL需要先从MySQL官网下载相关版本MySQL驱动包,将驱动包放在lib目录下
  • 下载网址https://downloads.mysql.com/archives/c-j/,下载完解压后就能看到MySQL驱动包
  • 将驱动包存放在该位置
  • 设置数据库连接
  • 先按红色框设置参数,再按蓝色框测试连接,最后按绿色框点击确认
  • 选择输出的目标表
  • 此处目标表的建表如下
代码语言:sql
复制
-- 登录本地MySQL创建数据库


-- 使用数据库并建表
use studb;
CREATE TABLE `stu_businfo` (
  `id` int NOT NULL AUTO_INCREMENT,
  `bus_name` text,
  `bus_type` text,
  `bus_time` text,
  `ticket` text,
  `gongsi` text,
  `gengxin` text,
  `licheng` text,
  `wang_info` text,
  `wang_buff` text,
  `fan_info` text,
  `fan_buff` text,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=142 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;
  • 目标表相关设置
  • 选择输入字段映射
  • 将一个个字段按照数据库相关表字段的顺序映射过来
  • 最终映射结果

启动任务

  • 选中模块之后点击三角标运行
  • 执行结果
  • navicat 查看数据

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 启动kettle
  • 新建一个Transformations
  • 启动任务
相关产品与服务
云数据库 MySQL
腾讯云数据库 MySQL(TencentDB for MySQL)为用户提供安全可靠,性能卓越、易于维护的企业级云数据库服务。其具备6大企业级特性,包括企业级定制内核、企业级高可用、企业级高可靠、企业级安全、企业级扩展以及企业级智能运维。通过使用腾讯云数据库 MySQL,可实现分钟级别的数据库部署、弹性扩展以及全自动化的运维管理,不仅经济实惠,而且稳定可靠,易于运维。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档