00:00
好,那么接下来呢,是第七章我们的ods层终于要到我们这个见表了,对吧,好,那呃,第一个ods原始数据对吧?啊,那这边呢,Ods。这个压缩要压缩或者拉兹罗对吧,然后ods表明规范呢,用这样的,你用增量还是用全量这个做一个区分啊呃,那这个呢,Ods其实没有什么好说的,就是把我们之前导过来的表呢,你统一都。按照之前买S当中的这个字段去建好这个表就OK了,好吧,啊,这个呢我们就不多说了,我们正好通过这个点呢,来熟悉一下我们的表有哪一些啊,首先第一步我们创建这个数据库并应用我们的这个数据库就不在default底下去做了啊呃,那么第一个叫活动。信息表啊,你可以趁着这个时间稍微的看一下这里边儿的内容啊,那这个监表呢,我们都把它去构建一下,好吧,这是第一个活动信息表,呃,第二个叫活动规则表。
01:06
啊,像这种原始数据层的表呢,我都给大家保留着吧,那后面呢,我们可能就挑这么。几张表来说明啊,第三个是这个一级品类表叫CATEGORY1,这个呢,大家看一下ID name对吧,比较简单啊,然后呢,二级品类有ID name加CAT1的ID。啊,因为他们是逐级关联的,那像三级品类表,它里面有K2的ID,那这样的话,它这三张表是不是就可以关联起来了呀,对吧?啊见面呃,然后接下来是我们的。被CC编码字典表。省份表。啊,咱们的审判ID对吧,审判名称地区的ID啊等等,然后呢是地区表啊,分为两个区啊,华东华东华南华北对吧,是这样的啊。好,然后品牌表。Trademark。
02:01
啊,然后是购物车,诶这是一个全量表,而且购物车呢,我们是有全量跟增量两个的,对吧,之前我们提到加购啊。优惠券。信息啊,然后呢,商品平台属性表。然后下来是商品表,也就是我们的SKU,这个表呢,也比较核心啊。然后是咱们的。享受属性值。啊,SPU。然后是购物车。购物车啊,保留购物车,然后呢是评价表。啊,就是里边是差评好评啊类似这样的对吧。好,然后这个是。那优惠券领用,像这种增量表呢,我们都用的杰森的解析方式啊,因为之前我们导过来数据,它就是杰森,不像我们之前全量表用斯库去导的对吧?啊增量表呢,呃,要用杰森的解析方式啊,这个大家注意一下,然后呢,订单明细表all the detail对吧。
03:15
拿过来。好。订单明细、活动关联表。跟优惠券的。关联表还有大的一张表,订单表对吧,这张表未来数据量呢也是比较大啊呃,退单表。但是我们自己造的数据嘛,所以就没有造那么大啊,这个大家注意一下,那有同学可能想到时候自己操作的时候就想问了,哎,那你上课的时候说这个比较大对吧,但是呢,我自己一看这个数据量呢,它并不大啊。那因为你自己造数据,你可以控制对吧,而且呢,我们也说了,里边的一些参数其实可以控制它的一个大小的,好,那用户表,用户表呢,是目前来说我们自己造数据表当中最大的一张表啊,那这块呢,咱们就搞定了,咱们界面语句就搞定了,28张表啊,29呢是数据的装载脚本啊,那也就是说我们把表建立了,然后我们数据呢,之前是导到HDFS的这个目录,对吧,那接下来呢,我们就要把这个目录里边的内容。
04:21
呃,是不是要导到我们。这表语句这个地方。对吧,这表语句所关联的。路径。啊,比如说warehouse对吧,J末odsa,那我们有这些个表28张啊,那你咱们是不是现在要做的事情,就是说把刚才我们之前导入数据要放到这个目录底下,你才能够进行查询吧,对吧?好,那这是我们第一个建表先完成啊,同时大家在建表的时候呢,稍微留意一下诶有哪些表对吧。
我来说两句