Datenwiederherstellung in Kiew

+38(097)5388783

https://www.dtm.com.ua

+38(066)9833019

Zuverlässigkeit von Speichermedien 

    Der Ausfall eines Speichermediums, einer Festplatte, eines Flash-Laufwerks oder einer SSD, ganz zu schweigen von mobilen tragbaren Geräten, ist ein ziemlich häufiges Ereignis, das mit der Zuverlässigkeit des Geräts und seinen Betriebsbedingungen zusammenhängt.

Die Zuverlässigkeit des Geräts hängt immer von der Qualität der verwendeten Teile ab, von der Qualität des Zusammenbaus einzelner Module zu einem voll funktionsfähigen Gerät. Der gesamte Produktionsprozess wird vom Technischen Überwachungsdienst überwacht.

    Die AFR- und MTBF- und MTTF-Metriken werden häufig verwendet, um eine relative Bewertung der Gerätezuverlässigkeit vorzunehmen.

 

AFR und MTBF/MTTF

AFR (Annualized Failure Rate – Ausfallrate pro Jahr)

MTTF (mittlere Zeit bis zum Ausfall)

MTBF (Mean Time Between Failure)

 

Je höher die MTBF, desto zuverlässiger das Gerät.

 

    MTTF wird in Stunden angegeben. Die MTTF kann auf verschiedene Weise ermittelt werden: unter Verwendung von Labortestdaten, unter Verwendung tatsächlicher Feldausfalldaten oder unter Verwendung von Modellen zur Vorhersage von Teileausfallraten.

MTTF = 1/(Summe der Ausfallraten aller Teile).

    Folgendes sagt TOSHIBA dazu.

„Statt MTTF (Mean Time To Failure) wird manchmal auch der Begriff MTBF (Mean Time Between Failures) verwendet. Die mittlere Zeit zwischen Fehlern bezieht sich auf die Zeit von einem Fehler zum nächsten, nachdem der erste Fehler behoben wurde. Da Speicherkomponenten in der Regel irreparabel sind, spielt MTBF keine Rolle; MTTF ist in diesem Fall also der richtige Begriff.“

Whitepaper September 2015

 

    Beispiel.

    Eine typische durchschnittliche Zeit zwischen Ausfällen von Speichersystemkomponenten von 1 Million Stunden bedeutet, dass bei einer Population von 1 Million Laufwerken, die in Systemen ausgeführt werden, erwartet werden kann, dass ein Gerät pro Stunde ausfällt, wenn es gemäß den Zuverlässigkeitsspezifikationen funktioniert. Bei 1000 Laufwerken würde dies bedeuten, dass alle 1000 Stunden ein Ausfall auftreten könnte.

    1 Million Stunden entsprechen 114 Jahren. Das bedeutet aber nicht, dass ein Laufwerk 114 Jahre hält, denn die MTTF-Spezifikation gilt nur für Laufwerke, die innerhalb der Garantiezeit funktionieren.

 

    Und hier heißt es auf der Website von Seagate, dass der Industriestandard „Mean Time Between Failures“ (MTBF) nicht mehr verwendet wird, um die durchschnittliche Ausfallrate von Festplatten zu quantifizieren. Seagate wechselt zu einem anderen Standard: Annual Failure Rate (AFR).

 

    Für Antriebe, die 24 Stunden am Tag, 7 Tage die Woche betrieben werden, kann die erwartete statistische Ausfallrate pro Jahr aus der MTTF mit der folgenden Formel berechnet werden:

    Die Abnahme um den exponentiellen Anteil ist darauf zurückzuführen, dass bereits ausgefallene Platten in der Statistik berücksichtigt werden sollen. Bei einem kleinen % AFR ist diese Reduzierung aufgrund bereits ausgefallener Antriebe jedoch vernachlässigbar, und die Formel kann wie folgt angenähert werden:

 

 

 

 

    Beispiel.

    Eine MTBF von 1 Million Stunden würde eine AFR von 0,876 % bedeuten, oder bis zu 9 Laufwerke von 1000 funktionierenden Laufwerken könnten innerhalb eines Jahres ausfallen. Rechenzentren müssen für so viele Laufwerksreparaturen oder -austausche budgetieren. Bei einer angegebenen MTTF von 1 Million Stunden beträgt die tatsächliche Ausfallrate etwa 9 Festplatten pro 1000 im Laufe des Jahres. Nehmen wir an, dass diese Laufwerke innerhalb der Garantiezeit waren und in Übereinstimmung mit den Betriebsbedingungen und Umgebungsbedingungen verwendet wurden.

    Eine höhere Ausfallrate bedeutet, dass der Hersteller die geforderten Zuverlässigkeitsanforderungen nicht erfüllt.

 

    Technische Dokumentation für einige Festplatten

 

    Beachten Sie die Dokumentation für WD Gold-Laufwerke.

    WD101KRYZ – 10ТB, WD8002FRYZ – 8ТB, WD6002FRYZ – 6ТB, WD4002FYYZ – 4ТB, WD2005FBYZ – 2ТB, WD1005FBYZ – 1ТB

    Hier sehen wir, dass Laufwerke von 1 TB bis 6 TB dieselbe MTFB = 2000000 Stunden und dementsprechend dieselbe AFR = 0,44 % haben. Das bedeutet, dass innerhalb eines Jahres von 2.000.000 Festplatten 8800 Festplatten ausfallen können. In der Tabelle über diesen Daten gibt es jedoch kleine Zahlen zur Verdeutlichung, Zahlen 5 und 6. Und es ist ersichtlich, dass MTFB und AFR für die 4-TB- und 6-TB-Modelle unter anderen Bedingungen mit einer geringeren jährlichen Datenübertragungslast berechnet werden. Daher sind sie weniger zuverlässig als 1-TB- und 2-TB-Modelle. Was zu erwarten ist.

Weiter interessanter. Basierend auf den Spezifikationen in dieser Tabelle haben WD101KRYZ- und WD8002FRYZ-Festplatten eine höhere Zuverlässigkeit (AFR = 0,35; 7 Platten und 14 Köpfe) als WD6002FRYZ (AFR = 0,35; 4 Platten 8 Köpfe). Aus welchen Gründen dies geschieht, ist nicht klar, die Dokumentation gibt nicht an.

    Ein wenig über jährliche Lasten.

In der Dokumentation unter Klarstellung 5 für 1-TB- und 2-TB-Festplatten:

„Die MTBF- und AFR-Spezifikationen des Produkts basieren auf einer Basisbetriebstemperatur von 40 °C und einer typischen Systemauslastung von 219 TB/Jahr. Workload ist definiert als die Menge an Benutzerdaten, die auf oder von der Festplatte übertragen werden. Das Produkt ist für Workloads von bis zu 550 TB pro Jahr ausgelegt.“

Sehen wir uns nun an, was das in der Praxis bedeutet. Wir berechnen die geschätzte Belastung für eine Festplatte an einem Tag: 360 Tage / 550 TB = 664 GB / Tag. Dies ist die Gesamtmenge der Daten, die an einem Tag von der Festplatte geschrieben und gelesen werden.

Mit einer Lese- oder Schreibgeschwindigkeit von 100 MB/s können Sie 360 ​​GB pro Stunde lesen oder schreiben, 8,64 TB pro 24 Stunden.

    Bei dieser Nutzungsintensität nimmt daher die Zuverlässigkeit der Festplatte ab, und es kann erforderlich sein, sie vor Ablauf der Garantiezeit auszutauschen.

    Verteilung von nur Torrents mit einer Geschwindigkeit von 5 MB / Sek. - 432 GB / Tag - 157.680 TB / Jahr, bei 10 MB / Sek. - 315.360 TB / Jahr. Bei WD Gold 1 TB WD1005FBYZ- und 2 TB WD2005FBYZ-Laufwerken liegt diese Last innerhalb der geschätzten 550 TB pro Jahr. Aber für Platten von 4 TB bis 10 TB passt es nicht mehr, da für sie alle Berechnungen mit einer typischen Belastung von 219 TB pro Jahr angegeben sind:

     „Die MTBF- und AFR-Spezifikationen des Produkts basieren auf einer Basisbetriebstemperatur von 40 °C und einer typischen Systemauslastung von 219 TB/Jahr. Workload ist definiert als die Menge an Benutzerdaten, die auf oder von einer Festplatte übertragen werden."

    Daher wird erwartet, dass die Zuverlässigkeit des Laufwerks innerhalb der Garantiezeit verringert wird.

Beim Arbeiten in stark ausgelasteten Systemen können die übertragenen Datenmengen um ein Vielfaches größer sein, was zu einem exponentiellen Abfall der Zuverlässigkeit führt.

 

    Und hier ist die WD Red Plus:

    WD140EFGX, WD140EFFX – 14ТB; WD120EFBX, WD120EFAX – 12ТB; WD101EFBX, WD10EFAX – 10ТB; WD80EFBX, WD80EFAX, WD80EFZX, WD80EFZZ – 8ТB; WD60EFZX – 6ТB; WD40EFZX – 4ТB;  WD30EFZX – 3ТB; WD20EFZX – 2ТB; WD10EFRX, WD10JFCX – 1ТB

    Aus irgendeinem Grund hat der WD Red Plus die AFR-Charakteristik aus der Spezifikation verloren. Aber es ist sehr einfach zu berechnen. AFR = 0,87 %. Und das bedeutet, dass die Zuverlässigkeit um ein Vielfaches geringer ist als die von WD Gold, da Fußnote 9 für diese Laufwerke sagt:

„Die MTBF-Spezifikationen basieren auf einer Stichprobenpopulation und werden durch statistische Messungen und Beschleunigungsalgorithmen unter typischen Betriebsbedingungen von 90 TB/Jahr und einer Festplattentemperatur von 40 °C geschätzt. Wenn diese Parameter überschritten werden und die Laufwerkstemperatur bis zu 65 °C beträgt, verschlechtert sich die MTBF. MTBF bestimmt nicht die Zuverlässigkeit eines einzelnen Laufwerks und ist keine Garantie."

    Daher wird die Verteilung von nur Torrents mit Geschwindigkeiten von 5 MB/s – 432 GB/Tag – 157.680 TB/Jahr bereits zu einer starken Verringerung der berechneten Zuverlässigkeit innerhalb der Garantiezeit für Laufwerke dieses Typs führen.

 

    Es gibt keine genauen AFR- und MTBF/MTTF-Zahlen für WD SSD-Laufwerke, die für den Betrieb in NAS-Systemen ausgelegt sind:

    Es steht geschrieben, dass MTTF-Schätzungen auf internen Tests durch den Telcordia-Stresstest basieren. In der MTTF-Spalte steht "bis zu 2M".

 

     WD Blue-Festplatten:

     WD80EAZZ – 8ТB; WD60EZAZ – 6ТB; WD40EZAZ – 4ТB; WD30EZAZ – 3ТB; WD20EZBX, WD20EZAZ – 2ТB; WD10EZRZ, WD10EZEX – 1ТB; WD5000AZRZ, WD5000AZLX – 500GB.

    In dieser Spezifikation gibt es keine Informationen zu AFR und MTBF/MTTF.

 

     WD Blue Mobile Festplatten:

    WD20SPZX – 2ТB; WD10SPZX -1ТB; WD5000LPZX – 500GB; WD320LPCX, WD320LPVX – 320GB.

Es liegen keine Daten zu AFR und MTBF/MTTF vor.

 

     AFR- und MTBF/MTTF-Berechnungen für SanDisk microSD-Speicherkarten sind nicht in der technischen Dokumentation enthalten:

    Kommen wir nun zum Hersteller Seagate.

     Beliebte 2,5-Zoll-Discs für Mobilgeräte:

ST2000LM010, ST2000LM007 (2 Platten 4 Köpfe) – 2ТB;

ST1500LM012 (2 Platten 4 Köpfe) – 1,5ТB;

ST1000LM038, ST1000LM035 (1 Platte 2 Köpfe) – 2ТB;

ST500LM033, ST500LM030 (1 Platte 2 Köpfe) – 2ТB;

    Wie Sie sehen können, sind die Modelle unterschiedlich und unterscheiden sich strukturell in der Anzahl der Arbeitsflächen, aber aus irgendeinem Grund sind die Zuverlässigkeitseigenschaften gleich.

    Leider werden AFR- und MTBF/MTTF-Zuverlässigkeitsberechnungen für Produkte dieser Stufe nicht bereitgestellt. Aber es heißt: „Schätzung der durchschnittlichen jährlichen Arbeitslast: <55 TB/Jahr. Die Produktspezifikationen gehen davon aus, dass die E/A-Arbeitslast die durchschnittliche jährliche Arbeitslastgrenze von 55 TB/Jahr nicht überschreitet. Workloads, die die Jahresrate überschreiten, können die Zuverlässigkeit des Geräts beeinträchtigen und beeinträchtigen. Die durchschnittliche jährliche Arbeitsbelastungsgrenze wird in Einheiten von TB pro Kalenderjahr angegeben.“

55 TB / Jahr - ist das viel oder wenig? Einheitliche Last 55 TB/Jahr = 150,7 GB/Tag.

 

    Schauen wir uns die SAS-Modelle von Seagate an:

ST4000NM0023, ST4000NM0043, ST4000NM0063 – 4ТB

ST3000NM0023, ST3000NM0043, ST3000NM0063 – 4ТB

ST2000NM0023, ST2000NM0043, ST2000NM0063 – 4ТB

ST1000NM0023, ST1000NM0043, ST1000NM0063 – 4ТB

 

    AFR = 0,63 %, MTBF = 1400000 Stunden. Das bedeutet, dass nach einem Jahr Betrieb unter den in der technischen Dokumentation angegebenen Bedingungen von 1000 Antrieben 0,63 %, also 6 - 7 Antriebe ausfallen können. Verwirrend ist, dass die Zuverlässigkeit bei allen Festplatten dieser Familie gleich ist.

 

     Einige SSD-Modelle von Seagate:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

    AFR = 0,58 %, unterliegt jedoch der „Total Terabytes Written (TBW) Over Warranty Period“.

Nehmen wir als Beispiel den ST480FP0021. Der Garantiezeitraum beträgt 5 Jahre, die gesamten geschriebenen Terabytes (TBW) während des Garantiezeitraums betragen 350 TB, d. h. die Zuverlässigkeit beträgt 0,58 % bei einer täglichen Durchschnittslast von (350 TB/5 Jahre = 70 TB pro Jahr; 70 TB/365 Tage = 192 GB pro Tag ) 192 GB pro Tag.