首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

工具推荐:大数据时代你应该懂点ETL

DT时代,把数据转换为信息、知识,已成为企业提高核心竞争力的关键。目前,大多数企业和政府采用传统的数据库脚本方式来处理数据,但脚本方式可读性差,过分依赖人,无论是程序的迁移还是系统维护,都极为不便,而ETL(Extact-Transform-Load,数据的抽取、交换、加载)则成为主要的一个技术手段。

ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为数据分析、数据挖掘的基础。

ETL全过程图

随着各种ETL工具的涌现,在众多花样百出的ETL工具中,今天给大家推荐的是亿信华辰旗下的数据工厂软件(EsDataFactory)。数据工厂是亿信华辰经过十多年的数据仓库和商业智能项目管理以及实施经验总结、知识沉淀,全力打造的一款同时满足大中小型数据集成和数据管控的实施利器,很大程度上能降低数据集成实施技术门槛,使复杂、重复性的工作简单及智能化。

下面,我们就来看一下数据工厂的厉害之处吧。

数据工厂登录界面

多视角多方式可视化建模

数据工厂提供了可视化定义的方式来完成数据模型的创建,支持自定义创建,同时也可从现有的数据结构(数据库表、视图、文件等)中挑选字段进行创建,提供全局视图用于呈现模型以及模型与维度之间的关联关系,支持范式模型、星型模型和雪花模型的定义。

增量捕获和数据装载

数据工厂提供了基于时间戳、MD5、触发器、全表比较等多种方式变化数据捕获机制,对用户透明,只需要简单设置即可完成增量数据获取,提供数据覆盖、数据追加、数据更新和更新插入等多种数据的落地装载策略,全面覆盖数据落地场景。

拖拽式流程设计器

数据工厂采用全拖拽式流程设计器,用户只需要在简单拖拽数据资源和加工组件就可完成复杂的ETL作业和作业流程的定义,“零”编码,易操作、易阅读、易维护。另外,支持完整图形编辑功能,如复制、粘贴、撤销、重做、自动对齐等。

可视化调试和预装载

支持流程调试,如顺序执行、执行到功能,可以查看每步的执行状态、执行时长和执行结果集,同时面向开发人员设置了预装载机制和数据抽样加载,方便开发人员快速验证流程和调试脚本。

丰富的数据处理组件

数据工厂提供了50余种数据处理组件,用于完成数据的传输、清洗转换、装载落地。扁平化图标设计,详细的在线帮助手册和案例库,让用户很轻易就能上手使用。

多重登录认证

提供Ukey签名及用户角色权限双重认证机制,从访问资源控制系统受控访问,杜绝非法访问,降低事件风险发生率。

小结:数据工厂区别于其它工具的特性可远远不止这些,数据工厂也不仅仅只是ETL哟。数据工厂广泛适用于所有数据类的实施场合,包含数据整合、数据迁移、数据同步、数据交换等。同时全面兼容各行各业的业务系统数据,完成各业务域系统的数据融合、数据关联、数据共享等应用场景,不愧是快捷自动的新一代数据仓库工具。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200320A065EF00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券