HINWEIS: Dieser Blog wurde am 26. September 2018 von Earle Philhower III aktualisiert, um die neuesten Fortschritte in der SSD-Technologie von Western Digital zu berücksichtigen.
Dies ist mein zweiter Beitrag in der Blogserie „Geschwindigkeiten, Zuführungen und Bedürfnisse“, mit der ich die eher technischen Elemente der Unternehmensspeicherung in allgemein verständlichen Begriffen erklären möchte. In meinem ersten Beitrag ging es um die Rolle der Latenzzeit in Speicherarchitekturen. In diesem Beitrag erörtere ich die SSD-Ausdauer und wie sich dies auf die Wahl der SSD auswirkt. Außerdem gebe ich Ihnen einige Faustregeln für die richtige Wahl.
- Die Wahl der richtigen SSD ist nicht einfach
- Nicht alle Flash-Speicher sind gleich
- Fehlerkorrektur, Overprovisioning und Firmware
- Die SSD-Ausdauer-Gleichung
- „1 DWPD“ ist nicht gleich „1 DWPD“
- Was passiert, wenn Sie sich bei der SSD-Ausdauer irren
- Das Richtige tun
- The SSD Endurance Cheat Sheet
- Weiteres Lesen
Die Wahl der richtigen SSD ist nicht einfach
Sie haben sich wahrscheinlich schon einmal ein SSD-Datenblatt angesehen und waren ein wenig überfordert. Die Wahl der richtigen SSD ist nämlich ein komplizierter Prozess. Sie müssen den richtigen Formfaktor wählen, damit das Laufwerk in Ihren Server passt. Sie müssen zwischen drei großen, inkompatiblen Schnittstellen wählen (SATA, SAS oder NVMe™). Natürlich müssen Sie auch die richtige Kapazität wählen, die von einigen 100 Gigabyte bis zu mehreren Terabyte reichen kann. Das ist alles, was Sie tun müssen, richtig? Falsch.
Es gibt noch eine weitere Entscheidung, die Sie treffen müssen, und zwar eine Entscheidung, die Sie bisher vielleicht noch nicht treffen mussten: die SSD-Ausdauer. Die SSD-Ausdauer ist die Gesamtdatenmenge, die eine SSD während der Garantiezeit garantiert schreiben kann. Sie wird oft in „TBW“ oder „DWPD“ angegeben (auf die wir etwas später eingehen werden). Die Physik der SSD-Ausdauer ist kompliziert, aber die Ergebnisse sind einfach: SSDs nutzen sich ab, wenn Sie auf sie schreiben. Wenn Sie sich für die falsche SSD-Ausdauer entscheiden, müssen Sie das Laufwerk vorzeitig austauschen oder zu viel für ein Laufwerk mit höherer Ausdauer als nötig bezahlen.
Nicht alle Flash-Speicher sind gleich
Die Ausdauer von SSDs ist begrenzt, weil der NAND-Flash, der SSDs betreibt, eine begrenzte Anzahl von „Programm/Lösch“-Zyklen (P/E) hat, bevor er nicht mehr verwendet werden kann. Diese Zyklen treten immer dann auf, wenn vorhandene Daten in einer Flash-Zelle überschrieben werden müssen. Da die Industrie von Multi Level Cell (MLC) zu Triple Level Cell (TLC) SSDs übergeht, die 3 Bits pro Zelle speichern, nehmen die verfügbaren P/E-Zyklen ab. Diese Verringerung der Zyklen ist natürlich schlecht für die Ausdauer.
Fehlerkorrektur, Overprovisioning und Firmware
Glücklicherweise wird die Ausdauer von SSDs nicht allein durch die P/E-Zyklus-Grenzen bestimmt. Die Technologie, die der Hersteller um den NAND herum anbringt, kann die Ausdauer ebenfalls verändern, zum Guten oder zum Schlechten. Western Digital verbessert die SSD-Ausdauer mit drei Haupttechnologien: Fehlerkorrektur, Overprovisioning und Firmware.
Fortgeschrittene Fehlerkorrekturtechniken wie die CellCare™ NAND-Verwaltungstechnologie von HGST oder die Guardian Technology™ von SanDisk® können dabei helfen, Daten selbst aus marginalen Flash-Zellen abzurufen, und können die nutzbare Lebensdauer der NAND-Zelle drastisch verlängern.
Overprovisioning fügt der SSD zusätzliche Flash-Kapazität hinzu. Dieser zusätzliche Flash-Speicher ist für den Benutzer nicht sichtbar, aber er ist für das Laufwerk sichtbar und wird verwendet, um die Lebensdauer zu erhöhen, indem er eine effizientere Datenverwaltung ermöglicht.
Schließlich kann das Programm, das in der SSD läuft, die Firmware, den Flash-Speicher im Inneren der SSD auf intelligente Weise verwalten. Je mehr Erfahrung ein Unternehmen mit den Arbeitslasten der Endnutzer und dem Flash selbst hat (SanDisk, eine Marke von Western Digital, kann auf eine über dreißigjährige Erfahrung in diesem Bereich zurückblicken!), desto mehr Intelligenz kann es in diese Firmware einbetten, um die Ausdauer zu maximieren.
Die SSD-Ausdauer-Gleichung
Die SSD-Ausdauer wird üblicherweise in Form von Schreibvorgängen pro Tag (DWPD) für einen bestimmten Garantiezeitraum (in der Regel 3 oder 5 Jahre) beschrieben. Mit anderen Worten: Wenn eine 1 TB SSD für 1 DWPD spezifiziert ist, kann sie während der Garantiezeit jeden Tag 1 TB an Daten schreiben. Wenn eine 1-TB-SSD für 10 DWPD spezifiziert ist, kann sie während der Garantiezeit täglich 10 TB an Daten schreiben.
Eine andere Metrik, die für die SSD-Schreibausdauer verwendet wird, ist Terabytes Written (TBW), die beschreibt, wie viele Daten während der Lebensdauer des Laufwerks auf die SSD geschrieben werden können.
Die Umrechnung zwischen TBW und DWPD ist einfach:
DWPD zu TBW: TBW = Capacity(TB) * DWPD * 365 * Warranty(Years)
TBW zu DWPD: DWPD = TBW / (365 * Garantie(Jahre) * Kapazität(TB) )
„1 DWPD“ ist nicht gleich „1 DWPD“
Eine häufige Falle, in die Nutzer beim Betrachten von SSD-Datenblättern tappen, ist die Annahme, dass „1 DWPD“ auf einem Laufwerk dasselbe bedeutet wie „1 DWPD“ auf einem anderen Laufwerk. Wenn SSDs unterschiedliche Kapazitäten haben, kann die Gesamtdatenmenge, die Sie auf sie schreiben können, drastisch variieren. Nehmen wir den Fall einer 15TB, „1 DWPD“ SSD und einer 1TB, „1 DWPD“ SSD, beide mit einer 5-Jahres-Garantie.
TBW(15TB) = 15TB * 1 DWPD * 365 Tage/Jahr * 5 Jahre = 27.375 TBW
TBW(1TB) = 1TB * 1 DWPD * 365 Tage/Jahr * 5 Jahre = 1.825 TBW
Was passiert, wenn Sie sich bei der SSD-Ausdauer irren
Die Wahl einer SSD mit zu hoher Ausdauer kann oft die Anfangskosten erhöhen. In einigen Fällen kann eine SSD mit höherer Ausdauer jedoch eine höhere Schreibleistung bieten als eine SSD mit geringerer Ausdauer. Wenn Ihre Anwendung also von zusätzlicher SSD-Leistung profitieren kann, sollten Sie ein Modell mit höherer Ausdauer in Erwägung ziehen.
Die Wahl einer zu niedrigen Ausdaueranforderung kann jedoch auf lange Sicht zu höheren Kosten und Problemen führen. Wenn die Gesamtmenge der geschriebenen Daten über die garantierte Lebensdauer hinausgeht, steigt die Wahrscheinlichkeit von Datenverlusten und SSD-Ausfällen. Die Kosten und die Frustration, die durch das Ersetzen ausgefallener Laufwerke oder den Umgang mit verlorenen Daten entstehen, können sich schnell summieren.
Das Richtige tun
Wenn Sie wissen, wie viele Daten Ihre Anwendung schreiben wird, ist die Wahl des Ausfallsicherheitsniveaus ganz einfach: Bestimmen Sie die durchschnittliche Datenmenge, die pro Tag geschrieben wird, multiplizieren Sie sie mit der Anzahl der Tage, an denen der Server in Betrieb ist, und verwenden Sie diese Zahl dann als untere Grenze für die Ausfallsicherheit. Diese Durchschnittszahl ist eine untere Grenze, da es ratsam ist, Spielraum für unerwartetes Wachstum hinzuzufügen.
The SSD Endurance Cheat Sheet
Wenn Arbeitslastmessungen nicht ohne weiteres verfügbar sind, gibt es einige Faustregeln, die stattdessen verwendet werden können. Die folgende Tabelle enthält eine Liste von Anwendungsfällen und einen verallgemeinerten Bereich von DWPD, angepasst an Top Considerations for Enterprise SSDs.
Da es sich hierbei nur um Faustregeln handelt (aus Gesprächen mit unseren Kunden und Produktteams), sollten sie einfach als Leitfaden für Gespräche mit Ihrem Anbieter bei der Auswahl eines SSD für Ihre eigene Anwendung verwendet werden.
Benutzungsfall | Beschreibung | ca. DWPD |
Bootlaufwerk | Server-Bootlaufwerk. Wird nur in regelmäßigen Abständen aktualisiert. Logs und alle permanenten Daten werden anderswo gespeichert. | 0.1 ~ 1.0 |
Content Distribution | Beschleunigung von CDN-Frontends. Medien werden je nach Beliebtheit migriert. | 0,5 ~ 2,0 |
Überwachung | Streaming von Schreibvorgängen von mehreren Kameras, kontinuierlicher Betrieb, periodisches Überschreiben des Laufwerks. | Kameras * BW |
Virtualisierung und Container | Tier-0-Speicher für Container und VMs in einem hyperkonvergenten System. SSDs stellen den gesamten lokalen Speicher für den Cluster bereit. | 1.0 ~ 3.0 |
OLTP-Datenbank | Datenintensive Workloads. Häufige Aktualisierungen von Datenbankprotokollen und Datendateien, oft Tausende Male pro Sekunde. | 3.0+ |
Hochleistungs-Caching | Beschleunigen Sie lokale Festplatten. Einige der höchsten Schreibarbeitslasten, die möglich sind. | 3.0++ |
Die Auswahl der richtigen SSD für Ihre Anwendung erfordert die Wahl der geeigneten Ausdauer, insbesondere bei den neueren Flash-Technologien von heute. Wenn Sie sich die Zeit nehmen, die Datenblätter und Ihre Arbeitslasten zu untersuchen, um die richtige Ausdauer für Ihre SSD auszuwählen, maximieren Sie deren Lebensdauer und minimieren Ihre Anschaffungs- und Betriebskosten.
Weiteres Lesen
- Tech Brief: Anpassung der SSD-Ausdauer an gängige Unternehmensanwendungen
- White Paper: Die wichtigsten Überlegungen zu SSDs für Unternehmen
- Blog: Die TCO-Implikationen der Ausdauer