ANMÄRKNING: Den här bloggen uppdaterades den 26 september 2018 av Earle Philhower III för att återspegla de senaste framstegen inom Western Digitals SSD-teknik.

Detta är mitt andra inlägg i bloggserien ”Speeds, Feeds and Needs”, som är utformad för att förklara de mer tekniska delarna av företagslagring i termer som är begripliga för alla. I mitt första inlägg diskuterades latensens roll i lagringsarkitekturer. I det här inlägget diskuterar jag SSD-uthållighet och hur detta påverkar ditt val av SSD, samt ger dig några tumregler för att göra rätt val.

Att välja rätt SSD är inte lätt

Du har förmodligen tittat på ett SSD-datablad och blivit lite överväldigad. Att välja rätt SSD är trots allt en komplicerad process. Du måste välja rätt formfaktor så att enheten får plats i din server. Du måste välja mellan tre stora, inkompatibla gränssnitt (SATA, SAS eller NVMe™). Du måste naturligtvis också välja rätt kapacitet, från 100 gigabyte till flera terabyte. Det är väl allt du behöver göra? Fel.

Det finns ytterligare ett val du måste göra, och det är ett val som du kanske inte har behövt göra tidigare: SSD-uthållighetsnivån. SSD-uthållighet är den totala mängden data som en SSD garanterat kan skriva under garantin, ofta specificerat i ”TBW” eller ”DWPD” (som vi diskuterar lite senare). Fysiken bakom SSD-uthållighet är komplicerad, men resultaten är enkla: SSD-enheter slits ut när du skriver på dem. Om du väljer fel SSD-uthållighet får du byta ut enheten i förtid eller betala för mycket för en enhet med högre uthållighet än vad du behöver.

Not All Flash Is Created Equal

SSD:s uthållighet är begränsad eftersom NAND-flashen som driver SSD:erna har ett begränsat antal P/E-cykler (program/erase) innan den inte längre kan användas. Dessa cykler inträffar när befintliga data måste skrivas över i en flashcell. När industrin övergår från MLC (Multi Level Cell) till TLC (Triple Level Cell) SSD-diskar, som lagrar 3 bitar per cell, minskar de tillgängliga P/E-cyklerna. Denna minskning av cykler är uppenbarligen en dålig sak för uthålligheten.

Felkorrigering, övertilldelning och fast programvara

Troligtvis bestäms SSD:s uthållighet inte enbart av gränserna för P/E-cykler. Den teknik som tillverkaren har placerat runt NAND kan också förändra uthålligheten, på gott och ont. Western Digital förbättrar SSD-uthålligheten med tre huvudtekniker: felkorrigering, overprovisioning och fast programvara.

Avancerade felkorrigeringstekniker som HGST:s CellCare™ NAND-hanteringsteknik eller SanDisk®:s Guardian Technology™ kan hjälpa till att hämta data från även marginella flashceller och kan dramatiskt förlänga NAND-cellens användbara livslängd.

Overprovisioning lägger till ytterligare flashkapacitet till SSD:en. Denna extra flashkapacitet är inte synlig för användaren, men den är synlig för enheten och används för att öka uthålligheten genom att möjliggöra effektivare datahantering.

För det sista kan programmet som körs i SSD-enheten, den inbyggda programvaran, på ett intelligent sätt hantera flashen inuti SSD-enheten. Ju mer erfarenhet ett företag har av arbetsbelastningar från slutanvändare och av själva blixten (SanDisk, ett varumärke från Western Digital, har över trettio års erfarenhet av detta!), desto mer intelligens kan det bädda in i den fasta programvaran för att maximera uthålligheten.

Den ekvation för uthållighet som gäller för SSD:s

Hållighet för SSD:er beskrivs vanligen i termer av DWPD (Drive Writes Per Day) under en viss garantiperiod (vanligen 3 eller 5 år). Med andra ord, om en SSD-enhet på 1 TB är specificerad för 1 DWPD kan den tåla 1 TB data som skrivs till den varje dag under garantiperioden. Alternativt, om en SSD-enhet på 1 TB är specificerad för 10 DWPD kan den tåla 10 TB data som skrivs till den varje dag under garantiperioden.

Ett annat mått som används för SSD:s skrivtålighet är Terabytes Written (TBW), som beskriver hur mycket data som kan skrivas till SSD-enheten under enhetens livstid.

Konverteringen mellan TBW och DWPD är enkel:

DWPD till TBW: TBW = Capacity(TB) * DWPD * 365 * Warranty(Years)

TBW till DWPD: DWPD = TBW / (365 * Warranty(Years) * Capacity(TB) )

”1 DWPD” är inte lika med ”1 DWPD”

En vanlig fälla som användarna går i när de tittar på datablad för SSD-enheter är att anta att ”1 DWPD” på en enhet betyder samma sak som ”1 DWPD” på en annan enhet. När SSD-enheter har olika kapacitet kan den totala mängden data du kan skriva till dem variera dramatiskt. Ta ett exempel på en SSD med 15 TB, ”1 DWPD” och en SSD med 1 TB, ”1 DWPD”, båda med 5 års garanti.

TBW(15TB) = 15TB * 1 DWPD * 365 dagar/år * 5 år = 27 375 TBW

TBW(1TB) = 1TB * 1 DWPD * 365 dagar/år * 5 år = 1 825 TBW

Vad som händer när du har fel på SSD:s uthållighet

Väljer du en SSD med för hög uthållighet kan du ofta öka den ursprungliga kostnaden. I vissa fall kan dock en SSD med högre uthållighet ge högre skrivprestanda än en SSD med lägre uthållighet. Så om din applikation kan dra nytta av ytterligare SSD-prestanda kan du överväga att titta på en modell med högre uthållighet.

Väljer du ett för lågt uthållighetskrav kan det dock öka dina kostnader och problem i det långa loppet. När den totala mängden skrivna data överskrider den garanterade uthålligheten ökar risken för dataförluster och SSD-fel. Kostnaderna och frustrationen för att byta ut felande enheter eller hantera förlorade data kan snabbt bli höga.

Göra rätt

När du vet hur mycket data din applikation kommer att skriva är valet av uthållighetsnivå okomplicerat: Bestäm den genomsnittliga mängden data som skrivs per dag, multiplicera den med antalet dagar som servern är i drift och använd sedan det antalet som en nedre gräns för uthållighet. Detta genomsnittliga antal är en nedre gräns eftersom det är klokt att lägga till utrymme för oväntad tillväxt.

The SSD Endurance Cheat Sheet

När arbetsbelastningsmätningar inte är lättillgängliga finns det några tumregler som kan användas i stället. Följande tabell innehåller en lista över användningsfall och ett generellt intervall för DWPD, anpassad från Top Considerations for Enterprise SSDs.

Då detta endast är tumregler (från samtal med våra kunder och produktteam) bör de endast användas som vägledning för att påbörja samtalen med din leverantör när du väljer en SSD för din egen applikation.

Användningsfall Beskrivning Ungefärlig DWPD
Boot Drive Boot Drive för servrar. Uppdateras endast med jämna mellanrum. Loggar och alla permanenta data lagras någon annanstans. 0.1 ~ 1.0
Innehållsdistribution Accelererande CDN front ends. Media migreras beroende på popularitet. 0,5 ~ 2,0
Övervakning Streaming av skrivningar från flera kameror, kontinuerlig drift, överskrivning av enheten med jämna mellanrum. Kameror * BW
Virtualisering och behållare Tier-0-lagring för behållare och virtuella maskiner i ett hyperkonvergerat system. SSD-enheter tillhandahåller all lokal lagring för klustret. 1.0 ~ 3.0
OLTP-databas Dataintensiva arbetsbelastningar. Frekventa uppdateringar av databasloggar och datafiler, ofta tusentals gånger per sekund. 3.0+
Högpresterande cachelagring Att påskynda lokala hårddiskar. Några av de högsta möjliga skrivbelastningarna. 3.0++

För att välja rätt SSD för din tillämpning måste du välja lämplig uthållighet, särskilt med dagens nyare flashteknik. Om du tar dig tid att undersöka databladen och dina arbetsbelastningar för att välja rätt uthållighet för din SSD kommer du att maximera dess livslängd och minimera dina inköpskostnader och driftskostnader.

Fördjupad läsning

  • Tech Brief: Matching SSD Endurance to Common Enterprise Applications
  • White Paper: Huvudöverväganden för SSD-enheter för företag
  • Blogg: TCO-implikationer av uthållighet

Lämna ett svar

Din e-postadress kommer inte publiceras.