前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >纠删码集群需要关注的哪些

纠删码集群需要关注的哪些

作者头像
用户4700054
发布于 2022-08-17 04:33:13
发布于 2022-08-17 04:33:13
5110
举报

纠删码存储方案

  • 按照存储单元单元连接方式,纠删码存储可以分为基于高速总线的磁盘阵列LAN方式的集群基于WAN/Internet方式的广域网存储系统。阵列码是一种特殊化的纠删码,采用高效率的异或运算 。国内大部分纠删码存储主要集中在磁盘阵列和阵列编码两个分支。纠删码存储集群的重要设计目标就是降低总体成本。
数据访问频度
  • 国外大公司通过分析很多应用的I/O特征发现,数据访问的频度随着时间递减,这与数据信息生命周期概念保持了一致,即在数据创建的时候,访问数据的频度很高,这些数据称为热数据;经过一段时间后,这些数据访问的频度下降,这些数据就成为温数据
纠删码存储集群关注关键点
  • 降级读分布式存储系统出现故障可以分为临时性节点故障和永久性节点故障。其中永久性节点故障是指数据由于硬件损坏导致节点数据无法访问;如果节点是因为掉电这主要的原因短时间内不能访问,这就是临时性故障。研究表明,数据中心的数据失效事件中临时性数据失效在所有数据失效故障中占比最高。如果节点出现了临时性故障,用户的IO落到这个节点,系统需要从其他的存活的节点读取相关数据吗,通过解码操作计算出需要的数据,这个就是降级读。降级读需要花费比正常读取操作几倍的时间,这个对于存储系统的SLA有很大的影响,所以提升降级读的性能就非常有意义。Khan等提出一种算法可以最小化单节点失效情况下重构操作和降极读操作需要的数据。
  • 写更新:纠删码集群写更新有两种针对RMW更新优化的方法,第一种是由Aguilera等提出,如果数据块D1被更新为D2,计算出D2-D1并将其通知给集群里的所有节点,校验节点最终完成运算;第二种Hafner等为保证校验数据一致性提出一种校验更新的方法,数据节点完成就数据分块和新数据分块的差分块,并由数据节点将差分块发送给第一个校验节点,第一个校验节点在将查分块转发给第二个校验分块,依次转发。这两种更新优化都是通过RMW方式达到数据更新和校验更细的木库,其优化的想法在于将更新过程进行分解成多个步骤,由不同节点完成不同更新步骤,避免集中式计算校验分块。 -节点重构:当节点永久性失效时,纠删码存储系统需要进行数据重构过程以恢复失效数据,这个过程称为节点重构。节点重构从是否响应用户IO,可以分为在线重构和离线重构。针对重构加速失效节点数据问题,一般就可以采用降低用户IO、重构IO互补干扰、提供重构IO的并行度、优化解码操作、降低校验组大小(k+m整体变小)、减少数据重构过程中网络传输。
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-11-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 存储内核技术交流 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
纠删码优势分析
纠删码概述 存储节点或者存储介质失效已经成为经常的事情,提高存储可靠性以及保障数据可用性已经变得非常重要,纠删码具有高存储效率和高容错能力。在体量非常大的存储中纠删码存储方式相比副本方式存在编码开销,又由于其特有的IO访问路径,其改进空间比较大 保障数据可用性的常用方法就是数据冗余,传统的数据冗余方式就是副本和纠删码方式,副本是将每个原始数据分块都镜像复制到其他设备上来保证原始数据丢失或者失效时有副本可恢复;副本方式不涉及数据变换,而纠删码会对数据进行变换和运算,得到支持数据冗余的编码数据,比如k+r(k个
用户4700054
2022/08/17
1.7K0
纠删码优势分析
有趣的纠删码(erasure code)
RAID 是 "Redundant Array of Independent Disk" 的缩写,中文意思是独立冗余磁盘阵列 是一种古老的磁盘冗余备份技术,也许你从未了解其中的原理,但肯定也听说过它的大名。简单地解释,就是将N台硬盘通过RAID Controller(分Hardware,Software)结合成虚拟单台大容量的硬盘使用,其特色是N台硬盘同时读取速度加快及提供容错性.
王磊-字节跳动
2021/05/30
12.1K0
​纠删码理论基础
纠删码数据容错原理 纠删码是一种前向纠删码。过程分为编码和解码。编码过程是将文件分割为固定大小的文件块,针对这些被分割的文件块编码为k个块(k个块中包括了k1个数据块和k2个校验块)。解码过程是将编码后的多个子块作为输入,经过解码可以恢复任何一个块的数据(不管是数据块还是校验块)。 采用纠删码技术来做数据容错,当磁盘出现故障,失效数据可以通过纠删码的校验链的构建机制来恢复数据,而不是纠正数据自身的错误,一般(k+r,k)纠删码存储开校门为r/k,相对副本纠删码具有低存储开销,但是纠删码涉及到的编解码
用户4700054
2022/08/17
1.4K0
​纠删码理论基础
什么是HDFS的纠删码
Fayson在前面的文章中介绍过CDH6,参考《Cloudera Enterprise 6正式发布》和《如何在Redhat7.4安装CDH6.0》。CDH6主要集成打包了Hadoop3,包括Hadoop3的一些新特性的官方支持,比如NameNode联邦,纠删码等。纠删码可以将HDFS的存储开销降低约50%,同时与三分本策略一样,还可以保证数据的可用性。本文Fayson主要介绍纠删码的工作原理。
Fayson
2018/11/16
5.5K0
应用AI芯片加速 Hadoop 3.0 纠删码的计算性能
在保证可靠性的前提下如何提高存储利用率已成为当前 DFS 应用的主要问题之一。
ethanzhang
2018/12/30
10.5K1
应用AI芯片加速 Hadoop 3.0 纠删码的计算性能
Ceph中的数据副本和纠删码的实现,以及它们对数据可靠性的影响
在Ceph中,数据副本是通过分布式存储集群的方式实现的。当数据写入Ceph存储集群时,Ceph会将数据划分为若干对象(Object),并根据设定的复制策略和规则,在不同的存储节点上生成副本。
一凡sir
2023/12/20
7920
Ceph中的数据副本和纠删码的实现,以及它们对数据可靠性的影响
分布式存储系统纠删码技术分享
海云捷迅云课堂专题,旨在秉承开源理念,为大家提供OpenStack技术原理与实践经验,该专题文章均由海云捷迅工程师理论与实践相结合总结而成,如大家有其他想要了解的信息,可留言给我们,我们会根据问题酌情回复。
海云捷迅
2020/07/08
4K0
分布式存储系统纠删码技术分享
伸手党福利 - 直击TFS技术内幕
TEG云端专业号
2017/07/13
3.9K0
伸手党福利 - 直击TFS技术内幕
详解HDFS3.x新特性-纠删码
EC(纠删码)是一种编码技术,在HDFS之前,这种编码技术在廉价磁盘冗余阵列(RAID)中应用最广泛(RAID介绍:大数据预备知识-存储磁盘、磁盘冗余阵列RAID介绍),RAID通过条带化技术实现EC,条带化技术就是一种自动将 I/O 的负载均衡到多个物理磁盘上的技术,原理就是将一块连续的数据分成很多小部分并把他们分别存储到不同磁盘上去,这就能使多个进程同时访问数据的多个不同部分而不会造成磁盘冲突(当多个进程同时访问一个磁盘时,可能会出现磁盘冲突),而且在需要对这种数据进行顺序访问的时候可以获得最大程度上的 I/O 并行能力,从而获得非常好的性能。在HDFS中,把连续的数据分成很多的小部分称为条带化单元,对于原始数据单元的每个条带单元,都会计算并存储一定数量的奇偶检验单元,计算的过程称为编码,可以通过基于剩余数据和奇偶校验单元的解码计算来恢复任何条带化单元上的错误。
五分钟学大数据
2021/01/15
1.7K0
纯干货 | 深入剖析 HDFS 3.x 新特性-纠删码
HDFS是一个高吞吐、高容错的分布式文件系统,但是HDFS在保证高容错的同时也带来了高昂的存储成本,比如有5T的数据存储在HDFS上,按照HDFS的默认3副本机制,将会占用15T的存储空间。那么有没有一种能达到和副本机制相同的容错能力但是能大幅度降低存储成本的机制呢,有,就是在HDFS 3.x 版本引入的纠删码机制。
五分钟学大数据
2021/04/01
1.8K0
分布式文件系统实战,使用MinIO构建分布式文件系统!
随着文件数据的越来越多,传统的文件存储方式通过tomcat或nginx虚拟化的静态资源文件在单一的服务器节点内已经无法满足系统需求,也不利于文件的管理和维护,这就需要一个系统来管理多台计算机节点上的文件数据,这就是分布式文件系统。
架构师精进
2023/03/23
5K0
分布式文件系统实战,使用MinIO构建分布式文件系统!
RAID磁盘阵列原理分析总结
(1) 基本原理 1.RAID 是由多个独立的高性能磁盘驱动器组成的磁盘子系统,从而提供比单个磁盘更高的存储性能和数据冗余的技术。 2.RAID是一类多磁盘管理技术,其向主机环境提供了成本适中、数据可靠性高的高性能存储。
全栈工程师修炼指南
2022/09/28
3.4K0
RAID磁盘阵列原理分析总结
分布式系统下的纠删码技术(一) — Erasure Code (EC)
近几个月主要参与一个分布式存储系统的纠删码部分(用于数据容错),纠删码在学术界出现比较早,现在ceph,微软的存储系统,Hadoop 3.0等都用了EC。文章会分为多篇,主要将Erasure Code,LRC, 以及相关的数学基础,作为学习总结。
全栈程序员站长
2022/11/17
3.3K0
分布式系统下的纠删码技术(一) — Erasure Code (EC)
顶会论文:纠删码存储系统中的投机性部分写技术
本文已被USENIX'17年度技术大会录用,此处为中文简译版。 阅读英文论文完整版请点击:Speculative Partial Writes in Erasure-Coded Systems 。 前言 多副本和纠删码(EC,Erasure Code)是存储系统中常见的两种数据可靠性方法。与多副本冗余不同,EC将m个原始数据块编码生成k个检验块,形成一个EC组,之后系统可最多容忍任意k个原始数据块或校验块损坏,都不会产生数据丢失。纠删码可将数据存储的冗余度降低50%以上,大大降低了存储成本,在许多大规模分
美团技术团队
2018/03/13
2.4K0
顶会论文:纠删码存储系统中的投机性部分写技术
如何在CDH6.0中使用纠删码
Fayson在前面的文章中介绍过《什么是HDFS的纠删码》,当时详细介绍了什么是纠删码,纠删码的实现原理,以及一些Benchmark的结果比较。
Fayson
2018/11/16
4.2K0
分布式对象存储设计原理
保存像图片、音视频这类大文件就是对象存储。不仅有很好的大文件读写性能,还可通过水平扩展实现近乎无限容量,并兼顾服务高可用、数据高可靠。
JavaEdge
2023/01/02
1.4K0
分布式对象存储设计原理
RS 纠删码为什么可以提高分布式存储可靠性?| 原力计划
Erasure Code(EC),即纠删码,是一种前向错误纠正技术(Forward Error Correction,FEC,说明见后附录)。目前很多用在分布式存储来提高存储的可靠性。相比于多副本技术而言,纠删码以最小的数据冗余度获得更高的数据可靠性,但是它的编码方式比较复杂。
区块链大本营
2020/03/24
1.6K0
RS 纠删码为什么可以提高分布式存储可靠性?| 原力计划
0460-HDFS纠删码的机架感知
Fayson在前面的文章中对Hadoop3的新特性之一纠删码进行过介绍,参考《什么是HDFS的纠删码》,后面又对纠删码的使用进行了实操,参考《如何在CDH6.0中使用纠删码》。但我们知道,在HDFS的三副本年代,Hadoop为了最大限度保证数据可用性,HDFS本身还有一个机架感知策略。这里先温习一下:
Fayson
2018/12/17
1.2K0
图文并茂 RAID 技术全解 – RAID0、RAID1、RAID5、RAID100……
  RAID 技术相信大家都有接触过,尤其是服务器运维人员,RAID 概念很多,有时候会概念混淆。这篇文章为网络转载,写得相当不错,它对 RAID 技术的概念特征、基本原理、关键技术、各种等级和发展现状进行了全面的阐述,并为用户如何进行应用选择提供了基本原则,对于初学者应该有很大的帮助。
菲宇
2019/06/13
6.3K0
图文并茂 RAID 技术全解 – RAID0、RAID1、RAID5、RAID100……
分布式存储
分布式存储的思想是将数据分散存储在多个节点上,以提高数据的可靠性、可扩展性和性能。它基于以下几个核心思想:
明志德道
2023/12/18
4760
相关推荐
纠删码优势分析
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档