温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那接下来呢,来构建咱们的数仓的环境啊,那第一个呢,主要是have have呢,它引擎有这么三个,大家都是了解的啊,已默认的有这个MR可以改成T,也可以改成Spark啊呃,那我们这地方呢,给大家简单介绍一下这两者不同点什么呢?一个have on Spark,一个Spark on。Have啊,呃,那have Spark呢及存储原数据用的是。Have这边又用的是SRK的解析优化啊呃,语法呢还语法执行引擎变成了Spark Spark负责RDD的执行,而Spark呢,Have只作为存储原数据的作用,Spark呢负责搜的优化,语法是Spark,然后采用RDD的一个执行,那这两者呢,还是不太一样的,大家去了解一下啊呃,那后面呢,咱们是要把这个配置改成这个Spark。
01:00
啊,改成Spark。好吧,嗯,那这个点呢,比较简单,我们带大家做一下啊,首先呢,在集群服务当中找到我们的have,然后呢,我们去找到这个配置。呃,我们可以去编辑。配啊,你去找到自己的配置啊呃,然后呢,把它修改掉啊,把它新增一下啊,那新增的配置呢,在这儿。啊,在这儿OK吧,好,那我把这个复制一下啊。来到这边来,在have找到咱们的have在这对吧,呃,直接。看配置管理。Have在这啊编辑配置,然后呢,新增配置项名字。Spark引擎。保存。好,那这样呢,就多了这样的一个配置项。好吧,呃,那这是我们修改完配置,修改完配置之后呢,要保存,保存完之后呢,我们要去。
02:07
重启啊,要去重启服务对吧?啊好,那我们来操作一下,这边呢,一定要保存表保存并下发。好,呃,这边呢就搞定了,因为我们have呢,也不止装了一个,对吧?啊,有多个这个注意啊,切到have-set这来,呃,那也就是说你重启啊,别着急,因为到下面为止呢,我们还有这个其他的内容要一并去做一下,所以呢,这中间的重启测试呢,我先不测啊,省得等会儿呢,修改完配置又要重启,所以呢,我们两个一块去做一下,好吧,呃,那还是一样的,在我们配置当中呢,我们要打开这个动态分区,因为默认的在腾讯云的em Mr服务器当中,它的动态分区是关闭的,那还是一样的啊,找到我们的配置管理。啊,去编辑配置啊,然后还是新增配置项,把它加上就好了,然后呢,最后还是下发跟刚才操作完全。
03:03
一样对吧,最后呢,我们要去重启啊,最后呢,我们要去重启好吧,呃,那么在这块呢,我们去把这个配置改一下啊,我先把这个配置复制上啊呃,然后在这边还是have杠塞里边对吧,然后编辑配置。这个。你拿一下。保存。保存配置,保存并下发。对吧,那这是我们把两个参数自己额外配了,有两个参数大家注意,那叫have set里面去配啊,不要配错位置了。
我来说两句