如果我在Amazon Web Services上运行电子病历作业(用Java语言)来处理大量数据,是否可以让每个单独的映射器访问存储在S3上的一个小文件?请注意,我所讨论的小文件不是映射器的输入。例如,可能大的输入文件是十亿行文本,我想通过读取存储在S3存储桶中的黑名单单词的小文件来过滤黑名单中的单词。在这种情况下,每个映射器将处理输入数据的不同部分,但它们都需要访问S3上的限制字文件。
2018年4月,亚马逊宣布推出一种新的存储类,名为“单一区域罕见访问”,它通过仅使用一个AZ来降低存储成本,以补充普通的IA选项。
它的,广告说所有的存储类都具有所谓的11 9s持久性。亚马逊S3标准,S3标准-IA,S3 One Zone-IA和亚马逊冰川,都是为99.999999999%的耐用性而设计的。亚马逊S3标准,S3标准-IA和亚马逊冰川在至少三个地理位置分开的可用区域分发数据,以提供最高水平的抗灾能力。S3 One Zo