前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >企业电商离线数仓项目实战第一部分 数据仓库理论1.5 元数据第二部分 电商离线数仓设计第三部分 电商分析之--会员活跃度第四部分 电商分析之--广告业务

企业电商离线数仓项目实战第一部分 数据仓库理论1.5 元数据第二部分 电商离线数仓设计第三部分 电商分析之--会员活跃度第四部分 电商分析之--广告业务

作者头像
用户2337871
发布2021-02-04 10:23:27
5270
发布2021-02-04 10:23:27
举报
文章被收录于专栏:git

第一部分 数据仓库理论

1.1 什么是数据仓库

数据仓库(DataWarehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化的(Time Variant)数据集合,用于支持管理决策(Decision-Making Support)

1.2 数据仓库四大特征

代码语言:javascript
复制
* 面向主题的
* 集成的
* 稳定的
* 反映历史变化的

1.3 数据仓库作用

整合企业业务数据,建立统一的数据中心;

产生业务报表,了解企业的经营状况;

为企业运营、决策提供数据支持;

可以作为各个业务的数据源,形成业务数据互相反馈的良性循环;

分析用户行为数据,通过数据挖掘来降低投入成本,提高投入效果;

开发数据产品,直接或间接地为企业盈利;

1.4 数据仓库与数据库的区别

代码语言:javascript
复制
数据库与数据仓库的区别实际讲的是 OLTP 与 OLAP 的区别。
OLTP(On-Line Transaction Processing 联机事务处理),也称面向交易的处理系
统。主要针对具体业务在数据库系统的日常操作,通常对少数记录进行查询、修
改。用户较为关心操作的响应时间、数据的安全性、完整性和并发支持的用户数等
问题。传统的数据库系统作为数据管理的主要手段,主要用于操作型处理。

OLAP(On-Line Analytical Processing 联机分析处理),一般针对某些主题的历史
数据进行分析,支持管理决策。

1.5 元数据

代码语言:javascript
复制
元数据(Metadata)是关于数据的数据。元数据打通了源数据、数据仓库、数据应
用,记录了数据从产生到消费的全过程。元数据就相当于所有数据的地图,有了这
张地图就能知道数据仓库中:
	有哪些数据
	数据的分布情况
	数据类型
	数据之间有什么关系
	哪些数据经常被使用,哪些数据很少有人光顾
在大数据平台中,元数据贯穿大数据平台数据流动的全过程,主要包括数据源元数
据、数据加工处理过程元数据、数据主题库专题库元数据、服务层元数据、应用层
元数据等。

第二部分 电商离线数仓设计

第三部分 电商分析之--会员活跃度

第四部分 电商分析之--广告业务

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.1 什么是数据仓库
  • 1.2 数据仓库四大特征
  • 1.3 数据仓库作用
  • 1.4 数据仓库与数据库的区别
  • 1.5 元数据
  • 第二部分 电商离线数仓设计
  • 第三部分 电商分析之--会员活跃度
  • 第四部分 电商分析之--广告业务
相关产品与服务
腾讯云数据仓库 TCHouse
腾讯云数据仓库 TCHouse 是腾讯云基于开源引擎打造的一系列企业级托管型云数仓产品,兼备稳定性、安全性的同时提供高效的自主运维工具和自主开发环境等配套设施。满足用户不同业务数据仓库场景的方案选型,提升用户分析查询效率、赋能用户数据价值。产品服务覆盖移动互联、广告、银行、保险、游戏、教育、地图等客户场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档