问题意识 1. 冷存隐形“小霸王”-磁带库进展
2. 磁带库存储方案TCO优势?
3. 磁带库应用面临的挑战?
磁带存储市场趋势
磁带市场概览
右图核心信息:
• 黄色柱状线在24年及以后呈现较快增长,AI元年(24)之后磁带交付量逐年递增,预测2030年将到达120EB; • 预计年增长率(YtY)达到2.5%; 品牌磁带收入份额:
• IBM占市场份额的38.0% • HPE(惠普企业版)占18.6% • Dell占12.1% • Quantum占9.2% • Spectralogic占5.1% • Overland占2.9% • 其他品牌占14.1% 左侧文字:
• 自2019年以来收入增长正常化 • 健康的生态系统参与 • 新一代磁带主导容量出货 • 2023年新磁带出货量占深度存档数据的18% • IBM在驱动器和图书馆市场份额中领先 磁带存储的TCO分析
左侧文字:
• 客户需求高度不一致: • 传统用户对磁带的需求不受容量限制。 • 超大型用户则需要更大容量的单一单位。 • 现代用例推动了磁带的采用: • 用于存档(Archiving)。 • 用作第二/第三份备份数据。 • 用于提升防篡改恢复能力(Airgap resiliency)。 • 磁带在总体拥有成本比较中继续保持领先地位。 右侧图展示了三种不同存储方案的总拥有成本(图注不同颜色代表企业场景TCO来源):
• IBM S3 Deep Archive on Diamondback 具有最低的总体拥有成本,约为$1,000,000左右。 • 高密度硬盘驱动器(HDD) 的总体拥有成本更高,是磁带存储的3.5倍。 • 托管存储提供商(Managed Storage Provider) 的总体拥有成本最高,是磁带存储的7倍。 放大图片观察TCO来源,比较分析:
• 高密度HDD存储方案的主要支出为:硬件、SDS软件和维护费用; • 相比之下磁带方案的主要支出为:SDS软件、磁带介质和配套硬件 提问:为什么磁带存储方案会区分Media和Hardware,而HDDs方案只有Hardware ?
磁带存储和硬盘驱动器(HDD)系统在设计和操作方式上的本质差异导致了对"media"和"hardware"的不同区分:
磁带存储系统
• 物理分离:磁带介质与硬件设备如磁带驱动器是分开的。这允许用户更换或升级磁带介质而不影响硬件设备。 • 成本与灵活性:磁带系统的这种分离设计带来了成本效益和操作灵活性,使得企业可以根据需要调整存储介质,而无需投资新的硬件。 硬盘驱动器系统
• 集成设计:HDDs将存储介质(磁盘)和读写设备(磁头)集成在一起,形成一个封闭的单元。这使得硬盘维护或升级时必须整体更换,而不是单独更换介质。 • 使用便捷性:硬盘的集成设计减少了介质管理的需求,提供了使用上的便捷性,但限制了灵活性。 磁带存储优势
为什么磁带存储再次成为关注焦点
成本节约 • 与大规模部署的硬盘驱动器(HDD)相比,磁带的成本要低3.7倍(数据来源:微软Azure, 2016年) 可持续性 • 磁带存储在可持续性方面表现突出。拥有27PB容量的磁带存档的二氧化碳排放量比同等容量的HDD低96% 安全性 • 磁带提供了增强的安全特性,包括隔空隔离(Airgap)、加密和对抗量子攻击的安全性(Quantum Safe)。这些特性使得磁带成为在面对高级持续性威胁(APT)和其他网络安全威胁时的一个安全的数据存储选择。 扩展性 • 图片中的图表显示了磁带容量的增长趋势,根据INSIC(International Magnetic Information Council)的数据,磁带的容量预计到2029年将以年复合增长率(CAGR)40%的速度增长。
提问:CAGR和YtY两个指标的计算方法有何差异?
Year to Year Growth (YtY)
• 定义 : YtY增长率是指从一年到下一年的增长百分比。 • 使用场景 : YtY增长率用来观察短期内的年度增长变化,通常用于年度报告中,反映从上一年到当前年度的具体变化。 Compound Annual Growth Rate (CAGR)
• 定义 : CAGR是指在给定的时间段内投资的平均年增长率,它假设增长是平滑和持续的。 • 使用场景 : CAGR用于衡量投资或业务增长的长期趋势,忽略期间的波动。它提供了一个平滑的年增长率,用于评估不同时间跨度的增长效果。 比较
• 简单性与复杂性 : YtY更直观、简单,直接比较两个连续年份的数据;而CAGR提供了一个期间内平均的年化增长率,计算上较为复杂。 • 适用性 : YtY适合分析短期业绩,如年度报告;CAGR更适合分析长期投资的回报,如多年的业务增长。 • 信息反映 : YtY反映具体年份间的变动,受单年度波动影响较大;CAGR则假设增长是均匀的,可以平滑这些波动,更适合长期评估。 磁带技术路线
磁带容量/带宽 路线图 磁带容量预测 • 2021年:磁带容量(单盘)为18TB。 • 未来预测:预测显示磁带容量将显著增加,到2030年及以后,容量将达到100+TB,甚至展示了580TB的容量已被演示。 • 增长率:磁带容量的年复合增长率(CAGR)为13.8%。 磁带驱动器数据传输速率 • 2021年:数据传输速率为每秒400Mbps。 • 未来预测:数据传输速率预计将增加,未来能达到每秒1000Mbps以上。 Note:这里的传输单位是Mbps,转化为MB(Mbps/8),磁带的速率确实慢。
磁带容量密度挑战
磁带库挑战-单位面积容量扩展 左侧表格显示:
自1952年 IBM 726 发布以来,磁带库容量密度快速增长,涵盖3个密度指标:
1. Areal Density (面密度)
- 定义 :面密度是指在单位面积内存储的数据量,通常以位/平方英寸(bits per square inch)来表示。
- 重要性 :这是评估磁带或任何存储介质存储容量能力的标准指标。面密度越高,同样大小的磁带能存储的数据就越多。
2. Linear Density (线性密度)
- 定义 :线性密度是指在磁带的长度方向上单位长度内存储的数据量,通常以位/英寸(bits per inch)来表示。
- 重要性 :这个指标衡量了磁带在其长度上的数据存储能力。线性密度增加意味着在同样的磁带长度上可以存储更多的数据。
3. Track Density (轨道密度)
- 定义 :轨道密度是指在磁带的宽度方向上单位长度内的轨道数,通常以轨道/英寸(tracks per inch)来表示。
- 重要性 :轨道密度决定了磁带可以同时读写的数据量。增加轨道密度可以显著提高磁带的总存储容量,因为它允许在同一物理空间内放置更多的数据轨道。
右侧柱状图:
展示了磁带与其他存储技术(如HDD和Flash存储)的位密度对比,突出了磁带在存储密度方面相较于其他技术的竞争优势及未来发展的可能性。
磁带存储易用性升级
磁带库挑战-易用性升级 左侧文字介绍早期磁带库存储面临的问题:
• 部署难度:磁带系统的部署相对复杂,需要特定的技术和过程。 • 磁带相关软件、流程和技能:使用磁带存储需要专门的软件和流程,操作人员也需要具备特定的技能。 • 非结构化数据整合有限:磁带系统在处理非结构化数据方面存在局限,这可能限制其在某些数据密集型应用中的使用。 右侧为现代磁带库
• 低成本的现场云存储解决方案:提供安全且耐用的数据存档和在线备份服务。 • 易于部署:支持简单的安装和启动操作。 • 简化的管理:管理过程简单,不需要具备磁带特定的技术技能。 • 标准化接口:如支持S3 Glacier兼容接口,这是亚马逊提供的一种低成本云存储服务,允许使用标准的web服务接口来存储和检索任意数量的数据。 • 数据耐用性:磁带提供的是非常耐用的存储选项。 • 高效能力:能在一小时内备份高达16.1TB的数据,最高容量可达27PB。 总结 1. 市场趋势:带库市场增长正常化,新型带库占据主导地位。 2. 用户需求多样化:传统用户不依赖带库容量,大型用户需要更大单体容量,现代用途驱动带库采用。 3. 带库优势:成本较低,可长期存储数据,适用于备份和灾难恢复等场景。 4. 技术挑战:扩展性、易用性和生态系统标准化等问题需解决。 5. 带库未来展望:预计到2029年,带库容量将实现40%的复合年增长率,并提供更高效的数据安全和可持续性解决方案。