NOTE: Questo blog è stato aggiornato il 26 settembre 2018 da Earle Philhower III per riflettere gli ultimi progressi nella tecnologia SSD di Western Digital.
Questo è il mio secondo post della serie di blog “Speeds, Feeds, and Needs”, progettato per spiegare gli elementi più tecnici dello storage aziendale in termini comprensibili a tutti. Il mio primo post ha discusso il ruolo della latenza nelle architetture di storage. In questo post parlerò della resistenza dell’SSD e di come questa influisce sulla scelta dell’SSD, oltre a darvi alcune regole empiriche per fare la scelta giusta.
- Scegliere il giusto SSD non è facile
- Non tutte le Flash sono uguali
- Correzione degli errori, Overprovisioning e Firmware
- L’equazione della resistenza dell’SSD
- “1 DWPD” non equivale a “1 DWPD”
- Cosa succede quando si sbaglia la resistenza di un SSD
- Fare le cose per bene
- The SSD Endurance Cheat Sheet
- Altra lettura
Scegliere il giusto SSD non è facile
Avrete probabilmente guardato una scheda tecnica dell’SSD e sarete stati un po’ sopraffatti. Scegliere il giusto SSD è un processo complicato, dopo tutto. Devi scegliere il giusto fattore di forma in modo che l’unità si adatti al tuo server. Devi scegliere tra tre interfacce principali e incompatibili (SATA, SAS o NVMe™). È anche necessario scegliere la giusta capacità, naturalmente, ovunque da 100 gigabyte a più terabyte. Questo è tutto quello che devi fare, giusto? Sbagliato.
C’è un’altra scelta che devi fare, ed è una scelta che forse non hai dovuto fare prima: il livello di resistenza dell’SSD. La resistenza di un SSD è la quantità totale di dati che un SSD è garantito per essere in grado di scrivere in garanzia, spesso specificata in “TBW” o “DWPD” (di cui parleremo più avanti). La fisica della resistenza degli SSD è complicata, ma i risultati sono semplici: Gli SSD si consumano man mano che si scrive su di loro. Scegliete la resistenza sbagliata dell’SSD e finirete per sostituire l’unità in anticipo o per pagare troppo per un’unità con una resistenza superiore al necessario.
Non tutte le Flash sono uguali
La resistenza dell’SSD è limitata perché la NAND flash che alimenta le SSD ha un numero finito di cicli “program/erase” (P/E) prima che non possa più essere usata. Questi cicli si verificano ogni volta che i dati esistenti devono essere sovrascritti in una cella flash. Con la transizione dell’industria da Multi Level Cell (MLC) a Triple Level Cell (TLC) SSDs, che memorizzano 3 bit per cella, i cicli P/E disponibili diminuiscono. Questa diminuzione dei cicli è ovviamente una cosa negativa per la resistenza.
Correzione degli errori, Overprovisioning e Firmware
Fortunatamente, la resistenza delle SSD non è stabilita solo dai limiti dei cicli P/E. La tecnologia posta intorno alla NAND dal produttore può cambiare anche la resistenza, in meglio o in peggio. Western Digital migliora la resistenza degli SSD con tre tecnologie principali: correzione degli errori, overprovisioning e firmware.
Tecniche avanzate di correzione degli errori come la tecnologia di gestione NAND CellCare™ di HGST o la Guardian Technology™ di SanDisk® possono aiutare a recuperare i dati anche da celle flash marginali e possono estendere notevolmente la vita utile della cella NAND.
Overprovisioning aggiunge ulteriore capacità flash all’SSD. Questa flash aggiuntiva non è visibile all’utente, ma è visibile all’unità e viene utilizzata per migliorare la resistenza consentendo una gestione dei dati più efficiente.
Infine, il programma che gira nell’SSD, il firmware, può gestire in modo intelligente la flash all’interno dell’SSD. Più esperienza ha un’azienda con i carichi di lavoro degli utenti finali e con la flash stessa (SanDisk, un marchio Western Digital, ha più di trent’anni di storia in questo!), più intelligenza può incorporare in questo firmware per aiutare a massimizzare la resistenza.
L’equazione della resistenza dell’SSD
La resistenza dell’SSD è comunemente descritta in termini di scritture al giorno (DWPD) per un certo periodo di garanzia (in genere 3 o 5 anni). In altre parole, se una SSD da 1TB è specificata per 1 DWPD, può sopportare 1TB di dati scritti ogni giorno per il periodo di garanzia. In alternativa, se una SSD da 1TB è specificata per 10 DWPD, può sopportare 10TB di dati scritti ogni giorno per il periodo di garanzia.
Un’altra metrica usata per la resistenza alla scrittura delle SSD è Terabytes Written (TBW), che descrive quanti dati possono essere scritti sulla SSD durante la vita del drive.
Convertire tra TBW e DWPD è semplice:
DWPD in TBW: TBW = Capacità (TB) * DWPD * 365 * Garanzia (anni)
TBW in DWPD: DWPD = TBW / (365 * Garanzia (anni) * Capacità (TB))
“1 DWPD” non equivale a “1 DWPD”
Una trappola comune in cui gli utenti cadono quando guardano le schede tecniche delle SSD è assumere che “1 DWPD” su un’unità significhi lo stesso di “1 DWPD” su un’altra unità. Quando le SSD hanno capacità diverse, la quantità totale di dati che si possono scrivere su di esse può variare drasticamente. Prendiamo il caso di una SSD da 15TB, “1 DWPD” e una SSD da 1TB, “1 DWPD”, entrambe con una garanzia di 5 anni.
TBW(15TB) = 15TB * 1 DWPD * 365 giorni/anno * 5 anni = 27.375 TBW
TBW(1TB) = 1TB * 1 DWPD * 365 giorni/anno * 5 anni = 1.825 TBW
Cosa succede quando si sbaglia la resistenza di un SSD
Scegliere un SSD con una resistenza troppo alta può spesso aumentare il costo iniziale. Tuttavia, in alcuni casi, un SSD di resistenza superiore può fornire prestazioni di scrittura superiori a quelle di un SSD di resistenza inferiore. Quindi, se la vostra applicazione può trarre vantaggio dalle prestazioni aggiuntive di un SSD, potreste prendere in considerazione l’idea di guardare un modello a più alta resistenza.
Scegliere un requisito di resistenza troppo basso, tuttavia, può aumentare il vostro costo e i problemi nel lungo periodo. Come la quantità totale di dati scritti va oltre la durata della garanzia, la possibilità di perdita di dati e di guasto dell’SSD aumenta. I costi e la frustrazione di sostituire le unità guaste o di avere a che fare con i dati persi possono sommarsi rapidamente.
Fare le cose per bene
Quando si conosce la quantità di dati che l’applicazione scriverà, la scelta del livello di resistenza è semplice: Determinate la quantità media di dati scritti al giorno, moltiplicatela per il numero di giorni in cui un server è in servizio, e poi usate questo numero come limite inferiore di resistenza. Questo numero medio è un limite inferiore perché è prudente aggiungere un margine per una crescita inaspettata.
The SSD Endurance Cheat Sheet
Quando le misurazioni del carico di lavoro non sono prontamente disponibili, ci sono alcune regole empiriche che possono essere usate invece. La seguente tabella contiene una lista di casi d’uso e una gamma generalizzata di DWPD, adattata da Top Considerations for Enterprise SSDs.
Perché queste sono solo regole del pollice (da conversazioni con i nostri clienti e team di prodotto), dovrebbero essere usate semplicemente come guide per iniziare le conversazioni con il vostro fornitore quando scegliete un SSD per la vostra applicazione.
Caso d’uso | Descrizione | Circa DWPD |
Boot Drive | Drive di avvio per server. Aggiornato solo periodicamente. Logs e tutti i dati permanenti memorizzati altrove. | 0.1 ~ 1.0 |
Distribuzione dei contenuti | Accelerazione dei front-end CDN. Media migrati a seconda della popolarità. | 0.5 ~ 2.0 |
Sorveglianza | Streaming di scritture da telecamere multiple, operando continuamente, sovrascrivendo il disco su base periodica. | Camere * BW |
Virtualizzazione e container | Stoccaggio di livello 0 per container e VM in un sistema iperconvergente. Gli SSD forniscono tutto lo storage locale per il cluster. | 1.0 ~ 3.0 |
OLTP Database | Carico di lavoro intenso. Frequenti aggiornamenti dei log del database e dei file di dati, spesso migliaia di volte al secondo. | 3.0+ |
Caching ad alte prestazioni | Accelerare gli hard disk locali. Alcuni dei più alti carichi di lavoro di scrittura possibili. | 3.0++ |
Selezionare il corretto SSD per la tua applicazione richiede la scelta della resistenza appropriata, specialmente con le nuove tecnologie flash di oggi. Prendersi il tempo di esaminare le schede tecniche e i carichi di lavoro per selezionare la giusta resistenza per il vostro SSD massimizzerà la sua durata e minimizzerà i costi di acquisto e le spese operative.
Altra lettura
- Tech Brief: Abbinare la resistenza degli SSD alle comuni applicazioni aziendali
- White Paper: Considerazioni principali per le SSD aziendali
- Blog: Le implicazioni TCO della resistenza