人们在谈商业智能(BI)时,经常会提到OLAP,有的人可能认为OLAP工具就是BI。其实OLAP仅是BI的一部分,是很重要的一项分析技术。那什么是OLAP呢?
OLAP(Online analytical processing),即联机分析处理,最早是由关系数据库之父E.F.Codd于1993年提出的,主要用于支持企业决策管理分析。它的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是维这个概念,“维”一般包含着层次关系。因此OLAP也可以说是多维数据分析工具的集合。
OLAP的基本概念
维(Dimension):是人们观察数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维(时间维、地理维等)。
维的层次(Lever of Dimension):人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的各个描述方面(时间维:日期、月份、季度、年)。。
维的成员(Member of Dimension):维的一个取值,是数据项在某维中位置的描述。(如“2020年9月1日”是在时间维上位置的描述)。
度量(Measure):多维数组的取值。
OLAP的基本功能
下钻(Drill down):维度是有层次的,下钻表示进入维度的下一层,将汇总数据拆分到下一层所在细节数据信息,如下图从第二季度下探到看4、5、6月的明细数据。
上钻(Roll up):下探的反向操作,回到更高汇聚层的汇总数据。
切片(Slice):切片可以理解成把立体按某一个维度进行切分,就可以看两维数据,如图中按电子产品切分,看到的是时间和地理位置关系的二维数据。
切块(Dice):相对于切片是按一个点切分,切块就是按一个范围(区间)来做切分。
旋转(Pivot):维的行列位置交换,换一个视角分析数据。
OLAP的特点
快速性:用户对OLAP的快速反应能力有很高的要求。系统应能在用户要求的时间内对用户的大部分分析要求做出反应,因此就更需要一些技术上的支持,如专门的数据存储格式、大量的事先运算、特别的硬件设计等。
可分析性:OLAP系统应能处理与应用有关的任何逻辑分析和统计分析。用户无需编程就可以定义新的专门计算,将其作为分析的一部分,并以用户理想的方式给出报告。用户可以在OLAP平台上进行数据分析,也可以连接到其他外部分析工具上,如时间序列分析工具、数据挖掘工具等。
多维性:多维性是OLAP的关键属性。系统必须提供对数据分析的多维视图和分析,包括对层次维和多重层次维的完全支持。事实上,多维分析是分析企业数据最有效的方法,是OLAP的灵魂。
信息性:不论数据量有多大,也不管数据存储在何处,OLAP系统应能及时获得信息,并且管理大容量信息。这里有许多因素需要考虑,如数据的可复制性、可利用的磁盘空间、OLAP产品的性能及与数据仓库的结合度等。
作为商业智能BI系统的关键技术,OLAP可以在使用多维数据模型的数据仓库或数据集市上进行,充分发挥OLAP的联机分析的功能和特性。将OLAP与数据挖掘进行结合,能够为数据挖掘提供基础数据支持,提高数据挖掘的效率,而且还可以实现联机分析数据挖掘的功能。
领取专属 10元无门槛券
私享最新 技术干货