数据库技术对于数据分析有着非常重要的意义,了解数据库技术的基础是每一个分析师的必备素质。
释意
OLAP:On line Analysis Processing联机分析处理
使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互的存取,从而获得对数据更深入了解的一类软件技术。
提出
E.F.Codd(关系数据库之父)
1993年
特点
直接仿照用户的多角度思考模式,预先为用户组建多维的数据模型。
一旦多维数据模型建立完成,用户可以快速地从各个分析角度获取数据,也能动态的在各个角度之间切换或者进行多角度综合分析,具有极大的分析灵活性。
功能
钻取(Drill-up和Drill-down):
改变维的层次,变换分析的粒度——包括向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)。
Drill-up是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;
而Drill-down则相反,它从汇总数据深入到细节数据进行观察或增加新维。
切片(Slice)/切块(Dice):
是在一部分维上选定值后,关心度量数据在剩余维上的分布。如果剩余的维只有两个,则是切片;如果有三个或以上,则是切块。
旋转(Pivot):
是变换维的方向,即在表格中重新安排维的放置(例如行列互换)
数据仓库 VS OLAP
数据仓库与OLAP的关系是互补的,现代OLAP系统一般以数据仓库作为基础,即从数据仓库中抽取详细数据的一个子集并经过必要的聚集存储到OLAP存储器中供前端分析工具读取。
OLAP VS OLTP
OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。
OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。