Backblaze研究:现代机械硬盘使用寿命更长,故障更少

2025年10月20日,08时33分53秒 科技新知 阅读 1 views 次

IT之家 10 月 20 日消息,自 2013 年以来,云备份与存储服务公司 Backblaze 持续追踪其数据中心内硬盘驱动器(HDD)的年化故障率(AFR)。经过十余年的数据积累,该公司得出了一个明确结论:现代硬盘“使用寿命更长”,且出现的错误也更少。

Backblaze研究:现代机械硬盘使用寿命更长,故障更少

这一结论出自上周由 Backblaze 博客运营专家 Stephanie Doyle 和首席技术布道师 Pat Patterson 联合撰写的一篇博客文章。两位作者将当前数据中心中约 317,230 块硬盘的年化故障率,与 2013 年监测的 21,195 块硬盘以及 2021 年分析的 206,928 块硬盘的数据进行了对比。他们指出:“与前两次分析相比,我们在硬盘故障发生的年龄分布和故障率峰值上都观察到了相当显著的偏离。”

具体数据显示,2025 年硬盘故障率的峰值出现在使用约 10 年零 3 个月时,仅为 4.25%;相比之下,2013 年的峰值高达 13.73%,出现在使用约 3 年零 3 个月时;而 2021 年的峰值为 14.24%,出现在使用 7 年零 9 个月。这意味着,当前硬盘在生命周期末期才出现明显故障风险,且峰值故障率仅为过去两次观测值的三分之一左右。

IT之家注意到,Doyle 和 Patterson 在文中写道:“这不仅是硬盘寿命上的重大提升,更是我们首次观察到故障峰值出现在‘曲线末端’—— 即接近使用寿命极限的位置。而且这个峰值大约只有之前两次峰值的三分之一。”

今年分析所涉及的硬盘来自 HGST、Seagate、Toshiba 和 WDC 等制造商,容量范围从 4TB 到 24TB 不等,平均使用年限介于 3.7 个月至 103.9 个月(约 8.7 年)之间。作为对比,2021 年样本中的硬盘同样来自上述厂商,平均使用年限为 3.57 至 80.85 个月(约 6.7 年),最大容量为 16TB。

长期以来,Backblaze 一直采用工程领域著名的“浴盆曲线”(bathtub curve)模型来评估硬盘故障行为。该理论认为,电子元件的故障率随时间呈 U 型变化:初期因制造缺陷导致早期失效较多,随后进入稳定低故障期,最终因老化而故障率再次上升。

然而,如 Backblaze 发布的图表所示,其实际观测结果并未完全符合传统浴盆曲线。作者指出,在 2021 年及 2025 年的数据中,硬盘在整个生命周期的大部分时间内保持了相对稳定的低故障率,直到接近寿命终点时才出现明显的故障激增。

博客进一步解释道:“这意味着什么?简而言之,硬盘正在变得越来越好,也越来越耐用。鉴于 2021 年至 2025 年间趋势线形状基本一致,我们预计未来几年仍将持续这一模式。因此,等到 2029 年左右再回过头来看,很可能会发现故障峰值进一步向后推移。”

在接受 Ars Technica 采访时,Doyle 表示,Backblaze 的这项分析对消费者选购大容量硬盘具有积极意义:“这些设备比以往更持久了。”

她补充道:“从某种意义上说,数据中心对硬盘的使用可以被视为对其性能的终极考验 —— 硬盘长期处于通电运行状态,持续高速旋转,并频繁进行读写操作,其工作强度远超普通消费者的日常使用场景。行业整体趋势是硬盘单盘容量不断增大,用户所需购买的数量减少。因此,了解这些硬盘在严苛数据中心环境下的表现,能让我们更有信心地判断:无论你选择哪款硬盘,都是一项值得的投资。”

此外,硬盘寿命的延长也为消费者提供了一个重要理由:在面对更快但价格更高的固态硬盘(SSD)时,仍可认真考虑继续选用 HDD。

Doyle 强调:“有必要仔细评估延迟性能的提升是否真的物有所值。”她建议用户根据自身需求权衡成本与性能,而非盲目追求新技术。

尽管观测结果与经典理论存在差异,Doyle 和 Patterson 并不主张彻底抛弃“浴盆曲线”。他们并非否定该模型对 HDD 的适用性,而是强调其未能充分纳入影响硬盘故障率的多种现实因素,包括工作负载强度、制造工艺差异、固件更新情况以及运维过程中的动态变化。

文章指出,浴盆曲线基于以下假设:

所有设备完全相同;

运行环境一致;

故障主要由时间推移独立引发;

产品生命周期内外部条件恒定。

虽然数据中心环境已尽可能实现标准化,但作者坦言:“现实条件永远无法做到完美。”因此,在评估硬盘长期可靠性时,应将“浴盆曲线”作为一种参考框架,同时结合具体的使用方式和环境变量进行综合判断。

(来源:新浪科技)

标签:


用户登录