NOTE : Ce blog a été mis à jour le 26 septembre 2018 par Earle Philhower III pour refléter les dernières avancées de la technologie SSD de Western Digital.
C’est mon deuxième billet dans la série de blogs « Vitesses, alimentations et besoins », conçue pour expliquer les éléments plus techniques du stockage d’entreprise en termes compréhensibles par tous. Mon premier article traitait du rôle de la latence dans les architectures de stockage. Dans ce billet, j’aborderai l’endurance des SSD et la façon dont cela affecte votre choix de SSD, en plus de vous donner quelques règles empiriques pour faire le bon choix.
- Choisir le bon SSD n’est pas facile
- Not All Flash Is Created Equal
- Correction des erreurs, surprovisionnement et firmware
- L’équation de l’endurance des SSD
- « 1 DWPD » n’est pas égal à « 1 DWPD »
- Que se passe-t-il lorsque vous vous trompez sur l’endurance du SSD
- Getting it Right
- The SSD Endurance Cheat Sheet
- Lecture complémentaire
Choisir le bon SSD n’est pas facile
Vous avez probablement déjà regardé une fiche technique de SSD et été un peu dépassé. Choisir le bon SSD est un processus compliqué, après tout. Vous devez choisir le bon facteur de forme pour que le disque s’adapte à votre serveur. Vous devez choisir parmi trois interfaces principales et incompatibles (SATA, SAS ou NVMe™). Vous devez également choisir la bonne capacité, bien sûr, entre plusieurs centaines de gigaoctets et plusieurs téraoctets. C’est tout ce que vous avez à faire, non ? Faux.
Il y a un autre choix que vous devez faire, et c’est un choix que vous n’avez peut-être pas eu à faire auparavant : le niveau d’endurance du SSD. L’endurance d’un SSD est la quantité totale de données qu’un SSD est assuré de pouvoir écrire sous garantie, souvent spécifiée en « TBW » ou « DWPD » (dont nous parlerons un peu plus tard). La physique de l’endurance des SSD est compliquée, mais les résultats sont simples : Les SSD s’usent à mesure que vous écrivez sur eux. Choisissez la mauvaise endurance du SSD et vous finirez par remplacer le disque plus tôt ou par payer trop cher un disque à l’endurance plus élevée que nécessaire.
Not All Flash Is Created Equal
L’endurance des SSD est limitée parce que la flash NAND qui alimente les SSD a un nombre fini de cycles de « programme/effacement » (P/E) avant de ne plus pouvoir être utilisée. Ces cycles se produisent chaque fois que des données existantes doivent être écrasées dans une cellule flash. Au fur et à mesure que l’industrie passe des SSD MLC (Multi Level Cell) aux SSD TLC (Triple Level Cell), qui stockent 3 bits par cellule, les cycles P/E disponibles diminuent. Cette diminution des cycles est évidemment une mauvaise chose pour l’endurance.
Correction des erreurs, surprovisionnement et firmware
Heureusement, l’endurance des SSD n’est pas fixée par les seules limites de cycles P/E. La technologie placée autour de la NAND par le fabricant peut également modifier l’endurance, pour le meilleur ou pour le pire. Western Digital améliore l’endurance des SSD grâce à trois technologies principales : la correction des erreurs, l’overprovisioning et le micrologiciel.
Des techniques avancées de correction des erreurs, comme la technologie de gestion NAND CellCare™ de HGST ou la Guardian Technology™ de SanDisk®, peuvent aider à récupérer les données de cellules flash même marginales et prolonger considérablement la durée de vie utile de la cellule NAND.
L’overprovisioning ajoute une capacité flash supplémentaire au SSD. Cette flash supplémentaire n’est pas visible pour l’utilisateur, mais elle est visible pour le disque et utilisée pour améliorer l’endurance en permettant une gestion plus efficace des données.
Enfin, le programme qui s’exécute dans le SSD, le firmware, peut gérer intelligemment la flash à l’intérieur du SSD. Plus une entreprise a d’expérience avec les charges de travail des utilisateurs finaux et la flash, elle-même, (SanDisk, une marque de Western Digital, a plus de trente ans d’histoire dans ce domaine !), plus elle peut intégrer de l’intelligence dans ce micrologiciel pour aider à maximiser l’endurance.
L’équation de l’endurance des SSD
L’endurance des SSD est communément décrite en termes d’écritures de disque par jour (DWPD) pendant une certaine période de garantie (généralement 3 ou 5 ans). En d’autres termes, si un SSD de 1TB est spécifié pour 1 DWPD, il peut supporter 1TB de données écrites sur lui chaque jour pendant la période de garantie. Alternativement, si un SSD de 1 To est spécifié pour 10 DWPD, il peut supporter 10 To de données écrites sur lui chaque jour pendant la période de garantie.
Une autre métrique utilisée pour l’endurance en écriture des SSD est le téraoctet écrit (TBW), qui décrit la quantité de données pouvant être écrites sur le SSD pendant la durée de vie du disque.
La conversion entre TBW et DWPD est simple :
DWPD en TBW : TBW = Capacité(TB) * DWPD * 365 * Garantie(ans)
TBW en DWPD : DWPD = TBW / (365 * Garantie(années) * Capacité(TB) )
« 1 DWPD » n’est pas égal à « 1 DWPD »
Un piège commun dans lequel les utilisateurs tombent lorsqu’ils regardent les fiches techniques des SSD est de supposer que « 1 DWPD » sur un disque signifie la même chose que « 1 DWPD » sur un autre disque. Lorsque les SSD ont des capacités différentes, la quantité totale de données que vous pouvez y écrire peut varier considérablement. Prenons le cas d’un SSD de 15 To, » 1 DWPD » et d’un SSD de 1 To, » 1 DWPD « , tous deux garantis 5 ans.
TBW(15TB) = 15TB * 1 DWPD * 365 jours/année * 5 ans = 27,375 TBW
TBW(1TB) = 1TB * 1 DWPD * 365 jours/année * 5 ans = 1,825 TBW
Que se passe-t-il lorsque vous vous trompez sur l’endurance du SSD
Choisir un SSD à l’endurance trop élevée peut souvent augmenter le coût initial. Cependant, dans certains cas, un SSD à haute endurance peut fournir des performances d’écriture supérieures à celles d’un SSD à faible endurance. Ainsi, si votre application peut profiter de performances supplémentaires du SSD, vous pouvez envisager de regarder un modèle à plus haute endurance.
Choisir une exigence d’endurance trop faible, cependant, peut augmenter votre coût et vos ennuis à long terme. Lorsque la quantité totale de données écrites dépasse l’endurance de la garantie, la possibilité de perte de données et de défaillance du SSD augmente. Les coûts et la frustration liés au remplacement des disques défaillants ou à la gestion des données perdues peuvent s’additionner rapidement.
Getting it Right
Lorsque vous savez combien de données votre application écrira, le choix du niveau d’endurance est simple : Déterminez la quantité moyenne de données écrites par jour, multipliez-la par le nombre de jours où un serveur est en service, puis utilisez ce nombre comme limite inférieure d’endurance. Ce nombre moyen est une limite inférieure car depuis il est prudent d’ajouter de la marge pour une croissance inattendue.
The SSD Endurance Cheat Sheet
Lorsque les mesures de la charge de travail ne sont pas facilement disponibles, il existe certaines règles empiriques qui peuvent être utilisées à la place. Le tableau suivant contient une liste de cas d’utilisation et une gamme généralisée de DWPD, adaptée de Top Considerations for Enterprise SSDs.
Parce qu’il s’agit uniquement de règles empiriques (issues de conversations avec nos clients et nos équipes produits), elles doivent être utilisées simplement comme des guides pour entamer des conversations avec votre fournisseur lors du choix d’un SSD pour votre propre application.
Cas d’utilisation | Description | Approx. DWPD |
Lecteur de démarrage | Lecteur de démarrage de serveur. Mis à jour seulement périodiquement. Les journaux et toutes les données permanentes sont stockés ailleurs. | 0.1 ~ 1.0 |
Distribution de contenu | Accélération des frontaux CDN. Média migré en fonction de la popularité. | 0,5 ~ 2,0 |
Surveillance | Streaming écrit à partir de plusieurs caméras, fonctionnant continuellement, écrasant le disque sur une base périodique. | Caméras * BW |
Virtualisation et conteneurs | Stockage de niveau 0 pour les conteneurs et les VM dans un système hyperconvergé. Les SSD fournissent tout le stockage local pour le cluster. | 1.0 ~ 3.0 |
OLTP Database | Charge de travail intensive en données. Mises à jour fréquentes des journaux de base de données et des fichiers de données, souvent des milliers de fois par seconde. | 3.0+ |
Cache haute performance | Accélérer les disques durs locaux. Certaines des charges de travail en écriture les plus élevées possibles. | 3.0++ |
Sélectionner le bon SSD pour votre application nécessite de choisir l’endurance appropriée, en particulier avec les nouvelles technologies flash actuelles. Prendre le temps d’examiner les fiches techniques et vos charges de travail pour sélectionner la bonne endurance pour votre SSD maximisera sa durée de vie et minimisera vos coûts d’achat et vos dépenses d’exploitation.
Lecture complémentaire
- Tech Brief : Faire correspondre l’endurance des SSD aux applications d’entreprise courantes
- Livre blanc : Principales considérations pour les SSD d’entreprise
- Blog : Les implications de l’endurance sur le coût total de possession
.