大家好,又见面了,我是你们的朋友全栈君。
分布式:在hdfs中由多个服务器组成,每个服务器扮演着不同的角色
HDFS适用于一次写入多次读出,不支持文件修改
1高容错性 一台宕机没有什么问题,不会造成一个数据整体丢失。 丢失的部分数据丢失会很快从其他节点拉取并回复。 2合存储大数据量的文件 数量级 GB TB PB都支持 件规模 适合存储百万规模的数据 3硬件价格低廉 可以使用廉价的物理机
1不适合存储小文件 这个面试也可能会被问到,请重点理解 造成namenode的元数据储存信息比较多 文件过多会导致寻址时间较长,组合元数据过慢 2适合做实时访问要求比较高的系统 3不适合修改文件 能适合做追加文件 4适合并发操作
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/133637.html原文链接:https://javaforall.cn