NOTA: Acest blog a fost actualizat la 26 septembrie 2018 de Earle Philhower III pentru a reflecta cele mai recente progrese în tehnologia SSD de la Western Digital.
Aceasta este a doua mea postare din seria de bloguri „Speeds, Feeds, and Needs” (Viteze, alimentări și nevoi), concepută pentru a explica elementele mai tehnice ale stocării pentru întreprinderi în termeni care să fie pe înțelesul tuturor. Prima mea postare a discutat rolul latenței în arhitecturile de stocare. În această postare voi discuta despre rezistența SSD și despre modul în care aceasta afectează alegerea SSD-ului, plus vă voi oferi câteva reguli de bază pentru a face alegerea corectă.
Choosing the Right SSD Isn’t Easy
Probabil că v-ați uitat la o fișă tehnică SSD și ați fost puțin copleșit. Alegerea SSD-ului potrivit este un proces complicat, până la urmă. Trebuie să alegeți corect factorul de formă, astfel încât unitatea să se potrivească în serverul dumneavoastră. Trebuie să alegeți una dintre cele trei interfețe majore, incompatibile (SATA, SAS sau NVMe™). De asemenea, trebuie să alegeți capacitatea potrivită, desigur, oriunde, de la 100 de gigaocteți la mai mulți terabytes. Asta este tot ce trebuie să faceți, nu-i așa? Greșit.
Există încă o alegere pe care trebuie să o faceți, și este o alegere pe care s-ar putea să nu fi fost nevoit să o faceți până acum: nivelul de anduranță al SSD-ului. Anduranța SSD este cantitatea totală de date pe care un SSD este garantat că le poate scrie în garanție, adesea specificată în „TBW” sau „DWPD” (despre care vom discuta puțin mai târziu). Fizica rezistenței SSD este complicată, dar rezultatele sunt simple: SSD-urile se uzează pe măsură ce scrii pe ele. Alegeți o rezistență SSD greșită și veți ajunge să înlocuiți unitatea mai devreme sau să plătiți prea mult pentru o unitate cu o rezistență mai mare decât cea necesară.
Not All Flash Is Created Equal
Rezistența SSD este limitată deoarece flash-ul NAND care alimentează SSD-urile are un număr finit de cicluri de „programare/ștergere” (P/E) înainte de a nu mai putea fi utilizat. Aceste cicluri au loc ori de câte ori datele existente trebuie să fie suprascrise într-o celulă flash. Pe măsură ce industria face tranziția de la SSD-urile MLC (Multi Level Cell) la SSD-urile TLC (Triple Level Cell), care stochează 3 biți pe celulă, numărul de cicluri P/E disponibile scade. Această scădere a ciclurilor este, în mod evident, un lucru rău pentru anduranță.
Corecția erorilor, supraaprovizionarea și firmware-ul
În mod fericit, anduranța SSD nu este stabilită doar de limitele ciclurilor P/E. Tehnologia plasată în jurul NAND de către producător poate schimba și ea rezistența, în bine sau în rău. Western Digital îmbunătățește rezistența SSD cu ajutorul a trei tehnologii principale: corectarea erorilor, supraaprovizionarea și firmware.
Tehnicile avansate de corectare a erorilor, cum ar fi tehnologia de gestionare a NAND CellCare™ de la HGST sau Guardian Technology™ de la SanDisk®, pot ajuta la recuperarea datelor chiar și din celulele flash marginale și pot prelungi dramatic durata de viață utilă a celulei NAND.
Supraaprovizionarea adaugă o capacitate flash suplimentară la SSD. Acest flash suplimentar nu este vizibil pentru utilizator, dar este vizibil pentru unitate și este utilizat pentru a spori rezistența, permițând o gestionare mai eficientă a datelor.
În cele din urmă, programul care rulează în SSD, firmware-ul, poate gestiona în mod inteligent flash-ul din interiorul SSD-ului. Cu cât o companie are mai multă experiență cu sarcinile de lucru ale utilizatorilor finali și cu flash-ul, în sine, (SanDisk, o marcă Western Digital, are peste treizeci de ani de experiență în acest domeniu!), cu atât mai multă inteligență poate încorpora în acest firmware pentru a ajuta la maximizarea rezistenței.
Ecuația rezistenței SSD
Anduranța SSD este descrisă în mod obișnuit în termeni de Drive Writes Per Day (DWPD) pentru o anumită perioadă de garanție (de obicei, 3 sau 5 ani). Cu alte cuvinte, dacă un SSD de 1TB este specificat pentru 1 DWPD, acesta poate rezista la 1TB de date scrise pe el în fiecare zi pe durata perioadei de garanție. Alternativ, dacă un SSD de 1TB este specificat pentru 10 DWPD, acesta poate rezista la 10TB de date scrise pe el în fiecare zi pentru perioada de garanție.
O altă măsură utilizată pentru rezistența la scriere a SSD este Terabytes Written (TBW), care descrie câte date pot fi scrise pe SSD pe durata de viață a unității.
Convertirea între TBW și DWPD este simplă:
DWPD în TBW: TBW = Capacitate(TB) * DWPD * 365 * Garanție(ani)
TBW în DWPD: TBW = Capacitate(TB) * DWPD * 365 * Garanție(ani)
TBW în DWPD: DWPD = TBW / (365 * Garanție(Ani) * Capacitate(TB) )
„1 DWPD” nu este egal cu „1 DWPD”
O capcană frecventă în care cad utilizatorii atunci când se uită la fișele tehnice ale SSD-urilor este să presupună că „1 DWPD” pe o unitate înseamnă același lucru cu „1 DWPD” pe o altă unitate. Atunci când SSD-urile au capacități diferite, cantitatea totală de date pe care le puteți scrie pe ele poate varia dramatic. Să luăm cazul unui SSD de 15 TB, „1 DWPD” și al unui SSD de 1 TB, „1 DWPD”, ambele cu o garanție de 5 ani.
TBW(15TB) = 15TB * 1 DWPD * 365 zile/an * 5 ani = 27.375 TBW
TBW(1TB) = 1TB * 1 DWPD * 365 zile/an * 5 ani = 1.825 TBW
Ce se întâmplă atunci când alegeți greșit rezistența SSD-ului
Alegerea unui SSD cu o rezistență prea mare poate crește adesea costul inițial. Cu toate acestea, în unele cazuri, un SSD cu anduranță mai mare poate oferi o performanță de scriere mai mare decât un SSD cu anduranță mai mică. Așadar, dacă aplicația dvs. poate profita de o performanță suplimentară a SSD-ului, ar fi bine să luați în considerare posibilitatea de a vă uita la un model cu rezistență mai mare.
Alegerea unei cerințe de anduranță prea mici, cu toate acestea, vă poate crește costurile și problemele pe termen lung. Pe măsură ce cantitatea totală de date scrise depășește durata de anduranță garantată, crește posibilitatea pierderii de date și a defectării SSD-ului. Costurile și frustrările legate de înlocuirea unităților defecte sau de gestionarea datelor pierdute se pot aduna rapid.
Getting it Right
Când știți cât de multe date va scrie aplicația dumneavoastră, alegerea nivelului de anduranță este simplă: Determinați cantitatea medie de date scrise pe zi, înmulțițiți-o cu numărul de zile în care un server este în funcțiune și apoi utilizați acest număr ca limită inferioară de anduranță. Acest număr mediu este o limită inferioară deoarece, din moment ce este prudent să se adauge marjă de manevră pentru o creștere neașteptată.
The SSD Endurance Cheat Sheet
Când măsurătorile volumului de lucru nu sunt disponibile cu ușurință, există câteva reguli empirice care pot fi folosite în schimb. Următorul tabel conține o listă de cazuri de utilizare și o gamă generalizată de DWPD, adaptată din Top Considerations for Enterprise SSDs.
Pentru că acestea sunt doar reguli empirice (din conversațiile cu clienții și echipele noastre de produs), ar trebui să fie folosite doar ca ghiduri pentru a începe conversațiile cu furnizorul dvs. atunci când alegeți un SSD pentru propria aplicație.
Caz de utilizare | Descriere | Aprox. DWPD |
Unitate de boot | Unitate de boot pentru server. Actualizat doar periodic. Jurnalele și toate datele permanente stocate în altă parte. | 0.1 ~ 1.0 |
Distribuție de conținut | Accelerarea front-end-urilor CDN. Media migrat în funcție de popularitate. | 0.5 ~ 2.0 |
Supraveghere | Stringerea scrierilor de la mai multe camere, operând continuu, suprascriind periodic unitatea. | Camere * BW |
Virtualizare și containere | Stocare de nivel 0 pentru containere și VM-uri într-un sistem hiperconvergent. SSD-urile asigură toată stocarea locală pentru cluster. | 1.0 ~ 3.0 |
OLTP Database | Carburări de lucru intensive de date. Actualizări frecvente ale jurnalelor bazei de date și ale fișierelor de date, adesea de mii de ori pe secundă. | 3.0+ |
Caching de înaltă performanță | Accelerați hard disk-urile locale. Unele dintre cele mai mari sarcini de lucru de scriere posibile. | 3.0++ |
Selectarea SSD-ului corect pentru aplicația dvs. necesită alegerea rezistenței adecvate, în special cu cele mai noi tehnologii flash de astăzi. Dacă vă acordați timpul necesar pentru a examina fișele tehnice și sarcinile dumneavoastră de lucru pentru a selecta rezistența potrivită pentru SSD-ul dumneavoastră, veți maximiza durata de viață a acestuia și veți minimiza costurile de achiziție și cheltuielile de operare.
Lectură suplimentară
- Tech Brief: Matching SSD Endurance to Common Enterprise Applications
- White Paper: Considerații de top pentru SSD-urile pentru întreprinderi
- Blog: Implicațiile TCO ale rezistenței