00:00
好,那么接下来呢,我们去购买一下emr的集群,好吧,呃,那打开我们的网页,可以搜索这个腾讯云进到这个官方网站啊,然后在这个右上角呢,有一个登录按钮,因为我已经登录了啊,大家点击这个登录按钮之后呢,你可以选择注册啊,也可以直接使用微信登录来看一下啊,你可以注册也可以使用直接使用微信登录。好,那登录进来之后呢,我们可以点击到产品这边,选择大数据。啊,那我们直接啊悬停在上面,然后呢,大数据里边有一个弹性mapduce,点击它啊,点击它以后呢,我们就直接立即选购。首先呢,第一个选择我们的地域啊,那我们选择自己最近的就行了,我在上海,那我们就点击这个上海,然后呢,集训类型选择哈杜普,因为我们未来是要用到这个哈杜,可以做这个适用于实时离线等各类大数据的一个场景,对吧?呃,那这边呢,选择默认场景就可以了啊,那其他的场景当中呢,其实我们的组件相对来说就比较少了啊好,那这边呢,我们选择这个目前的最高版本,因为它对于我们其他内容那个兼容性比较好。
01:20
呃,那本次我们的计算框架呢,用的是flink啊,但是呢,大家看一下这边呢,Flink自带是01:14啊呃,然后呢,稍微的老一个版本3.3看他就01:12,但是其实在我们线下课程当中呢,咱们用的是弗林格01:13啊,那没有对应的这个版本,那怎么办呢?其实大家也不用担心,那如果工作的时候。跟你所需要用到的这个版本如果不同的话,那咱们也可以自己进行一个安装,好吧,啊,那我们就把基本的组件选定之后呢,呃,正常的其他的我们就不选择了啊,那其实我们还会用到这个h base,呃,这个腾讯云给我们提供的是2.4.5这个版本呢,有点高,因为未来呢,我们要对接的Phoenix啊,那Phoenix呢,跟2.4.5呢,我们用的版本是,呃,有存在兼容性问题的,所以呢,我们的也不选了,我们就直接。
02:16
来下一步这里边儿的内容呢,可以就不用管了啊,下一步然后第二个呢是计费啊,那我们肯定选择这个按量计费,因为大家看一下这边一个月,或者说你选择一年。那这个价格还是比较贵的,之前我们也提到了,一年一台机器呢,就五万多对吧?啊,那我们学习。教学阶段呢,我们就用按量计费的方式,呃,然后接下来选择集群网络这块呢,大家第一次进来的时候,这个集群网络是没有的,那我们要呃在这边去新建网络来到这来。那首先第一个你要在这个上面选择你自己所在的这个区域啊,就刚才前面选择的,然后呃,我这边是已经有了一个,如果没有的话,你可以新建一个来给他看一下,然后这边取一个名称啊,取一个名称,然后呢,是ibs的一个网段,然后子网的一个名称啊,大家去配一下,呃,一定要注意一下,这边你选择一个区啊,当然这边可用的,你可以看到,诶,它还有多少个剩余对不对,那你就可以选择有剩余的这个区,呃,无论选择哪个区无所谓,一定要注意,就是这个区一定要记一下,好吧,你比如说我之前配的这个地方呢,它是一个上海三区,我给大家看一下,点开。
03:39
呃,那我们点到这个子网吧啊,在这边可以看到我这边是上海三区,这个一定要记住,你自己所选的这个不做要求,无所谓的好吧,呃,然后回来你配完之后呢,回来回来之后呢,这边可以选择了啊,要不然的话这是没有的,点开,点开之后呢,接下来可用区一定要注意刚才我们所选的那个区,我刚才是三上海三区对不对,那我们就点击上海三区,呃,然后选择咱们的子网,诶刚才已经配好了对吧?好,那下面呢,就。
04:09
没有什么其他的,这边呢,是对我们的资源可以做一个配置啊,比如说我们现在做这个实时项目,那呃,我们可以把对应的这个内存呢,呃,可以调高一点,比如说这个主节点,那我们可以用八和16G啊,那个价格相对高一点啊呃,然后云盘这块呢,我们做实时项目,其实云盘呢用不了那么高,我们弄一个50G就够了啊,然后确定。呃,那这边的价格会稍微的比刚才要多一点,因为我们的内存调高了,那其他节点一样,咱们呢,同样的可以调整一下。啊,当然这个就未来学习的时候呢,咱们这个资源其实就够了啊呃,生产环境当中呢,你就根据你公司的一个要求,你可以选择,你看最高能有320G的一个资源啊,那标准型也可以有这个,呃,大数据类型高IO的那就是。
05:02
直会更高一点啊,内存啊内存会更高计算型。啊,CPU还有内存啊等等,那我们这块呢,学习阶段我们可以用标准型就行了啊好,那接下来呢,我们这边还是一样的,把这个调小啊,因为我们并不做这个太多的一个存储,因为做实时嘛,对吧,并比较离线,那我们为了。节省啊,而且这边其实我们刚才改了50对不对,但是呢,最小是100G,它会自动给我们改回来,这个倒还好,那我们就能省一点,对吧?那同样的这边呢,我们也可以做一个调整啊,那比如说他刚才最小呢是100可选的100对吧,那确定,呃,这个时候呢,价格又会再便宜点啊,不到16块钱一个小时啊,也就是说给我们提供了这个八台机器,那其中这个master节点的,比如说我们再配一些高可用,像name note啊,还有雅安的resource manager,那就安装在这个master节点上,呃,其中的这个call节点,那就是我们核心的这个计算节点啊,其实你这个地方呢,你可以根据自己的要求去选择计算型的也可以,因为未来有一些任务呢,我们可以运行在这上面,其实我们的node manager啊都在这上面,好吧,啊还有common节点,公共节点模块,它是它的资源相对来说比较小一点,因为它上面呢,未来我们并不会装太多的呃软件呃去运行,比如说就是一些中间呢,像这个ZK这样的。
06:25
内容啊,它会自动装在我们的这个common节点上,好,那这块呢,就根据自己公司当中一个需求去配置就行了,如果说呢,你是学习阶段想自己先玩一下,那么你这个配置呢,其实可以不用太高啊,那够我们跑简单的几个任务就OK,好那我们直接点击下一步。呃,然后呢,取一个这个集群名称,那我选择emr的硅谷好吧,呃,接下来呢,是设置这个密码,呃,密码的话你一定要记住,未来呢,我们用远程工具连接到我们服务器的时候呢,用的就是这个密码,那用户名呢,大家都知道Linux用户名默认的有一个root用户,对不对啊,那我们就用root用户,那这边呢,我这边我用这个密码好吧。
07:13
呃,其他的东西呢,你就不用管了,我们直接点击这个下一步啊,这是整体我们刚才所选择内容的一个预览,你看一下这当中有没有,呃,哪一块你可能选错了,你回去,哎,回到上一步去进行重新选择,好吧,就是对于我们整个内容做一个。预览啊,当然你也可以在这边直接进行一个编辑啊,那我们最后呢,点击同意。选择立即购买。呃,等待他的一个购买流程。好,那这边呢,我们就看到了一个集群创建中的字样,诶,它会帮我们自动去构建我们的集群,同时安装好刚才我们所选择的那些软件,比如说IGDF雅安啊,这个过程呢,需要花费一点时间,那么我接下来呢,会把这个。
08:09
视频截掉。啊,也就是说我按个暂停,等这边集群创建成功之后,我再把这个视频接上,因为这个就完全的等待时间,我们做不了任何事情,好吧。那当然在这个过程当中呢,你可以看一下这个,呃,我们上面有哪些个服务啊,当然现在呢,集群创建中,嗯,其我们的操作呢,会失败,因为他们并没有服务看到看得到对吧?啊,这个资源在这块我们也能看得到,诶它有自动的这个监控啊,但是呢,现在我们集群还没有构建成功嘛,所以这些东西呢,显示的无数据,但没有关系,包括下面的节点,它给我们分配的IP,我们现在也看不到,那没关系,等我们等会。安装好之后,哎,我们再来看好吧,那现在呢,我把视频暂停掉。好,那在我们经过一定时间等待之后呢,我们就看到这边有一个集群运行中的字样,那表示这边我们整个的都已经完成了构建啊,那这块呢,就是我们去购买整个腾讯云emr的一个过程。
我来说两句