数据副本管理(CDM)是一种节约存储资源,有效管理数据生命周期的方法,包括消除不必要的重复生产数据。传统备份软件和企业应用程序独立运行,经常会创建多个相同数据的副本。然而,相同数据的冗余副本不但浪费存储空间,还降低网络性能,使数据访问或恢复关键数据任务更加困难。CDM软件可以通过减少使用数据虚拟化的完整副本的数量来帮助消除这些问题。
CDM工作机制和原理
大多数CDM管理软件通过创建一个完整的数据拷贝来工作。当生产环境对原数据进行更改时,软件将以块级粒度创建存储增量更改的快照。快照机制这里不再赘述。由于快照写操作不会指向原数据副本,管理员不必担心主副本的内容会发生意外更改。减少完整副本的数量也减少了存储、服务器资源的消耗,进而降低成本,因为有价值的存储空间不会被不必要的数据拷贝所占用。
虚拟化软件供应商Actifio是CDM解决方案的典型代表,Actifio捕捉生产数据,产生一个主副本,并基于主副本产生无限的虚拟副本,以便在需要生产数据时候,各类应用软件可以直接使用。在开发、分析或测试环境中,这种方法尤其重要;这意味着开发、分析或测试环境可以基于组织的生产数据的精确副本完成相应工作,且无需消耗额外的存储空间。
为什么复制数据管理很重要?
随着存储容量的扩大,复制数据管理技术缓解这一需求的加剧。数据正以稳定的速度增长,不必要的数据拷贝占用了大量的存储空间。存储虚拟化有利于备份和恢复,但是额外数据的创建和存储可能是一个难点。
因为存储多个副本和备份通常是标准的措施,也是数据保护常有实践,所以往往复制的数量很快就会失控。存储效率和生能力可能会因为过多的拷贝数据而陷入困境。然而,这些额外的存储空间都是有代价的。数据存储并不便宜,而且存储容量越大,在不必要的存储开销上的浪费就越严重。通过消除额外的数据拷贝,组织不仅可以提高效率,而且可以释放昂贵的存储空间。
CDM数据副本管理的好处?
加快应用程序的发布周期,提高决策效率,提高效率和生产力,快速、简单和自导向的以适当的格式访问副本数据。
副本数据的使用使数据具备有更大的可视性,同时确保遵从性和降低安全性风险。
通过集中控制、自动化和编排降低存储管理成本。通过正确地存储正确的数据拷贝数来减少存储成本。
数据副本管理CDM和备份关系
虽然CDM数据副本管理具备一定的备份工具能力,但它不应该认为它是替代传统备份的工具。CDM不是为数据保护设计的,而主要是为了存储效率而设计的。虽然CDM可以用于创建数据恢复点,但它并没有创建数据源的真正备份。
存储快照在传统数据备份和CDM中都会用到,在一定程度上,一些组织可能认为快照是备份的替代品。但是,由于快照和备份常常通过冗余来达到多数据副本目的,CDM可能不会达到同样的目的。
如何找到正确的CDM产品
虽然大多数CDM数据副本管理平台在某些特性和功能是一致的,但是CDM产品在供应商之间是有差异的,针对不同客户,不同的CDM产品可能比其他产品更适合其应用和场景。
领先的CDM供应商包括Actifio Inc.、Catalogic Software、Cohesity Inc.、Commvault Systems Inc.、Delphix Corp.和Rubrik Inc.。
目前,数据副本管理供应商正在发布具有许多相同特性和功能的产品。大多数CDM供应商都销售可以从生产平台导入数据的产品,并通过其软件把数据导入其管理的存储系统。还有产品允许数据管理跨不同的传统同构、异构存储产品。主流的CDM供应商都提供支持物理和虚拟数据资源的CDM产品,有些供应商还提供备份、归档等存储设备。随着市场的成熟,越来越多的供应商正在向他们的产品增加公有云数据存储和流动能力。
CDM数据副本管理市场的未来
无序扩张变得越来越重严重,数据增长的现状和问题也不会很快消失。解决之道或许就是CDM技术和产品。根据在2017年Taneja Group的一项研究表明,超过30%的公司正在考虑或实施CDM产品。
由于供应商在CDM数据副本管理软件增加了更多的特性来应对迫切的数据保护和备份问题,CDM队伍和市场在未来可能会继续增长。
在选择复制数据管理产品时,可选的产品和功能数量可能会令人生畏。作为企业组织,需要了解如何比较产品以获得满足特定需求的产品。
在过去的几年里,数据副本管理已经成为降低存储成本的首选技术。随着这种技术的普及,数据副本管理供应商也变得鱼目混杂、良莠不齐。组织如何决定选择哪款产品呢?成本是一个因素,但这里还有几个重要的选择标准应该考虑。
1、CDM具备什么可靠性保护机制?
通过消除多个数据副本,CDM数据副本管理产品可以降低存储成本。因为数据副本管理往往处理单个的集中数据复制,如果数据损坏,数据复制就会成为单点故障。
在理想情况下,数据副本管理供应商应该提供一个选项,其产品支持创建一个辅助数据副本(最好复制到远程数据中心),这样在主副本数据发生物理故障时,有在线和可用的数据副本保证业务可用和连续。
2、数据初始副本是如何创建的?
假设,CDM软件是通过一个发现过程来发现定位企业数据,但是在这个发现过程中有两个重要的考虑因素。
发现过程会产生大量的存储开销吗?一些复制数据管理产品要求将数据库复制或移动到另一个位置(从而暂时增加存储消耗),这给较大的数据库带来性能问题。
软件如何处理相似的数据?如果发现过程发现了一堆相同的文件副本,是否需要管理员必须将一个副本标记为“正确”?软件是否保留每一份拷贝?发现过程是否在数据块级别工作?理解软件如何确定哪些数据是冗余的,哪些数据不是,这一点很重要。
3、是否有硬件要求或限制?
一些数据副本管理产品被设计成直接与组织的存储进行交互。对于这样的CDM产品来说,客户的存储必须与数据副本管理软件兼容。
与存储无关设计的数据副本管理产品,在操作系统级别或Hypervisor管理程序级别有所依赖。虽然这种方法消除了存储兼容性问题,但是直接与存储设备交互的产品可能具有性能优势。
4、CDM产品可与云一起工作吗?
组织同时在本地数据中心和公共云中存储数据的情况越来越普遍。尽管公共云常被称为提供“无限存储”,但大多数公共云服务提供商根据其使用的存储数量以及其他因素向客户收取月费。因此,数据简化技术(如数据副本管理)可能对云存储成本产生实际影响。
5、CDM具备怎样的报表功能?
数据副本管理产品的报表功能往往被视为相对无关紧要。但是,管理员必须能够监视存储消耗和存储性能情况。目前市场上有大量的数据管理产品,这些产品之间都具备细微差别。因此,在评估数据副本管理供应商之前,需要考虑哪些特性和功能对客户或组织最有好处。
领取专属 10元无门槛券
私享最新 技术干货