温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那接下来呢,我们正式进入我们项目的学习,那我们打开第一个目录文档啊,那在这里边呢,将其分为了三个文档。第一个需求及架构设计,在这个文档当中呢,我们主要了解到我们当前这个项目的整体的需求是什么,以及我们所选择的框架,那为什么要选择这个框架,同时我们要把这个框架搭建好,也就是说构建我们数据的采集通道,因为在生产环境当中,我们的业务数据来源于Java的后台,那我们要从业务库当中将这些数据呢,要采集到我们大数据集群当中,这样我们才能够做分析处理,那第二个文档呢,就是对这些数据进行分析处理,也就是我们构建。离线仓库的一个文档啊,那第三个呢,最终我们要把我们算出来的这些指标要进行一个可视化。
01:04
啊,那你提供给公司的决策层去使用,因为我们数据仓库最重要的一个点就在于它是给公司的管理层提供业务数据支持的,所以我们需要把我们计算的结果以最直观的方式反馈给我们的管理层,啊,那接下来呢,我们就打开第一个文档来看一下,这里面呢,我们分为了六个章节,第一个序言啊。呃,这里边呢,了解一下我们课程的目标,以及数据仓库的概念。第二章,项目需求及架构设计。在这个当中呢,我们要了解到我们的需求。第二块呢,更重要的是我们框架的选择啊。呃,第三章电商业务简介,那这就涉及到我们本次课程的一个业务背景,我们是以电商为业务背景的,呃,为什么选择电商呢?因为对于各个学习的同学来说,我们不一定有所有行业的一个经验,但是电商虽然我们没有他的一个工作经验,但是电商的业务背景对大家来说并不陌生,因为我们都多多少少都会在网上进行一个购物,所以相关的流程呢也会比较熟悉一些,这样大家接受起来呢也会更好一点啊。呃,那第四章呢,就是选购腾讯云的Emma啊,构建我们的集群了。第五章业。
02:30
数据啊,那这就涉及到我们整个的业务表了,看着比较多,那没关系,我们会用呃,PPT的方式给大家做一个展示啊,而且在这块呢,我也不会详细的对每张表做一些介绍,当我们使用到这张表的时候,我们再具体的去看里边的字段就好了,说实话我现在把这里的字段一个一个的给你分析清楚,我问一下大家,你觉得我在讲完这个之后。把这么多张表一次性讲完,你又能记得多少呢?
03:03
对吧?啊,我相信他呢,大家都可能说那根本就记不住,确实也是这样的,包括我们在线下课程当中的时候,呃,同学们的反馈也都是这样,所以呢,我们要不断的再结合需求,反过来来去分析这张表的字段,这样呢更有利于我们吸收啊,所以这块呢,我们就整体把握一下,大概分哪些业务线,每个业务线当中可能有哪些表,大家尽量的去记一记,并不需要每一个字段都去。了解OK吧啊,那接下来呢,就是模拟数据的一个生成啊,因为我们这块是做离线数据搭建,我们并不会去写一个Java的后台去产生数据,我们就自己模拟数据生成就好了。第六章整个业务数据的采集,我们要把MYSO当中的这些业务数据呢,采集到我们大数据集群当中。啊,这是我们第一个文档的内容。好。
我来说两句