POZNÁMKA: Tento blog byl aktualizován 26. září 2018 Earlem Philhowerem III, aby odrážel nejnovější pokroky v technologii SSD společnosti Western Digital.
Toto je můj druhý příspěvek v sérii blogů „Rychlost, výdrž a potřeby“, jejichž cílem je vysvětlit techničtější prvky podnikových úložišť srozumitelně pro každého. Můj první příspěvek pojednával o úloze latence v architekturách úložišť. V tomto příspěvku se budu zabývat výdrží SSD a tím, jaký to má vliv na výběr SSD, a navíc vám poskytnu několik pravidel pro správný výběr.
Výběr správného SSD není snadný
Jistě jste se už někdy podívali na katalogový list SSD a byli jste z toho trochu zaražení. Výběr správného SSD je přece jen složitý proces. Musíte vybrat správný tvarový faktor, aby se disk vešel do vašeho serveru. Musíte si vybrat ze tří hlavních, nekompatibilních rozhraní (SATA,SAS nebo NVMe™). Musíte také samozřejmě zvolit správnou kapacitu, a to od 100 gigabajtů až po několik terabajtů. To je vše, co potřebujete, že? Omyl.
Je tu ještě jedna volba, kterou musíte udělat, a to volba, kterou jste možná dosud nemuseli dělat: úroveň výdrže SSD. Výdrž SSD je celkové množství dat, které je SSD zaručeně schopen zapsat v rámci záruky, často udávané v „TBW“ nebo „DWPD“ (o kterých si povíme o něco později). Fyzika výdrže SSD je složitá, ale výsledky jsou jednoduché: SSD se opotřebovávají, když na ně zapisujete. Pokud zvolíte špatnou výdrž SSD, skončíte s předčasnou výměnou disku nebo s přeplatkem za disk s vyšší výdrží, než je potřeba.
Není všechna paměť flash stejná
Výdrž SSD je omezená, protože paměť NAND flash, která pohání disky SSD, má konečný počet cyklů „programování/mazání“ (P/E), než ji již nelze použít. K těmto cyklům dochází vždy, když je třeba přepsat stávající data v buňce flash. S přechodem průmyslu z víceúrovňových buněk (MLC) na tříúrovňové buňky (TLC) SSD, které ukládají 3 bity na buňku, se dostupný počet cyklů P/E snižuje. Tento pokles cyklů je samozřejmě pro výdrž špatný.
Oprava chyb, overprovisioning a firmware
Výdrž SSD naštěstí není dána pouze limity P/E cyklů. Výdrž může změnit i technologie umístěná výrobcem kolem paměti NAND, a to k lepšímu či horšímu. Společnost Western Digital zlepšuje výdrž SSD pomocí tří hlavních technologií: korekce chyb, overprovisioning a firmware.
Pokročilé techniky korekce chyb, jako je technologie správy NAND CellCare™ společnosti HGST nebo technologie Guardian Technology™ společnosti SanDisk®, mohou pomoci obnovit data i z okrajových buněk flash a mohou výrazně prodloužit použitelnou životnost buněk NAND.
Overprovisioning přidává do SSD další kapacitu flash. Tato dodatečná flash paměť není viditelná pro uživatele, ale je viditelná pro disk a používá se ke zvýšení odolnosti tím, že umožňuje efektivnější správu dat.
Nakonec program, který běží v SSD, firmware, může inteligentně spravovat flash paměť uvnitř SSD. Čím více zkušeností má společnost s pracovním zatížením koncových uživatelů a samotnou pamětí flash (SanDisk, značka Western Digital, má v této oblasti více než třicetiletou historii!), tím více inteligence může do tohoto firmwaru vložit, aby pomohla maximalizovat výdrž.
Rovnice výdrže SSD
Výdrž SSD se běžně popisuje jako počet zápisů za den (DWPD) po určitou dobu záruky (obvykle 3 nebo 5 let). Jinými slovy, pokud je 1TB SSD disk specifikován na 1 DWPD, vydrží 1TB dat zapsaných na něj každý den po dobu záruky. Alternativně, pokud je 1TB SSD specifikován pro 10 DWPD, vydrží 10 TB dat zapsaných na něj každý den po dobu záruky.
Další metrikou používanou pro výdrž SSD při zápisu je Terabytes Written (TBW), která popisuje, kolik dat lze na SSD zapsat během životnosti disku.
Převod mezi TBW a DWPD je jednoduchý:
DWPD na TBW: TBW = kapacita(TB) * DWPD * 365 * záruka(roky)
TBW na DWPD: DWPD = TBW / (365 * Warranty(Years) * Capacity(TB) )
„1 DWPD“ se nerovná „1 DWPD“
Častou pastí, do které se uživatelé dostávají při prohlížení datových listů SSD, je předpoklad, že „1 DWPD“ u jednoho disku znamená totéž co „1 DWPD“ u jiného disku. Pokud mají disky SSD různou kapacitu, může se celkové množství dat, které na ně můžete zapsat, výrazně lišit. Vezměme si případ 15TB SSD s kapacitou „1 DWPD“ a 1TB SSD s kapacitou „1 DWPD“, oba s pětiletou zárukou.
TBW(15TB) = 15TB * 1 DWPD * 365 dní/rok * 5 let = 27 375 TBW
TBW(1TB) = 1TB * 1 DWPD * 365 dní/rok * 5 let = 1 825 TBW
Co se stane, když špatně zvolíte výdrž SSD
Výběr příliš vysoké výdrže SSD může často zvýšit počáteční náklady. V některých případech však může SSD disk s vyšší výdrží poskytovat vyšší výkon zápisu než SSD disk s nižší výdrží. Pokud tedy vaše aplikace může využít dodatečný výkon SSD, můžete zvážit pořízení modelu s vyšší výdrží.
Výběr příliš nízkého požadavku na výdrž však může z dlouhodobého hlediska zvýšit náklady a problémy. S tím, jak celkové množství zapsaných dat přesahuje záruční výdrž, se zvyšuje možnost ztráty dat a selhání SSD. Náklady a frustrace spojené s výměnou nefunkčních disků nebo řešením ztracených dat se mohou rychle nasčítat.
Správné nastavení
Pokud víte, kolik dat bude vaše aplikace zapisovat, je volba úrovně odolnosti jednoduchá: Určete průměrný objem dat zapsaných za den, vynásobte jej počtem dní, kdy je server v provozu, a pak toto číslo použijte jako spodní hranici limitu výdrže. Toto průměrné číslo je dolní hranicí, protože je rozumné přidat rezervu pro neočekávaný růst.
The SSD Endurance Cheat Sheet
Když nejsou snadno dostupná měření pracovního zatížení, existují některá pravidla, která lze použít místo toho. Následující tabulka obsahuje seznam případů použití a zobecněný rozsah DWPD, upravený z knihy Top Considerations for Enterprise SSD.
Protože se jedná pouze o pravidla palce (z rozhovorů s našimi zákazníky a produktovými týmy), měla by sloužit pouze jako vodítko pro zahájení rozhovorů s dodavatelem při výběru SSD pro vlastní aplikaci.
Případ použití | Popis | Přibližně DWPD |
Základní disk | Základní disk serveru. Aktualizuje se pouze pravidelně. Protokoly a veškerá trvalá data uložena jinde. | 0.1 ~ 1.0 |
Distribuce obsahu | Zrychlení předních částí CDN. Média migrována v závislosti na popularitě. | 0.5 ~ 2.0 |
Dohled | Streaming zápisů z více kamer, nepřetržitý provoz, pravidelné přepisování disku. | Kamery * BW |
Virtualizace a kontejnery | Úložiště úrovně 0 pro kontejnery a virtuální počítače v hyperkonvergovaném systému. Disky SSD poskytují veškeré místní úložiště pro cluster. | 1.0 ~ 3.0 |
OLTP Databáze | Datově náročné pracovní zátěže. Časté aktualizace databázových protokolů a datových souborů, často tisíckrát za sekundu. | 3.0+ |
Vysoce výkonné ukládání do mezipaměti | Zrychlení lokálních pevných disků. Některé z nejvyšších možných zátěží zápisu. | 3.0++ |
Výběr správného SSD pro vaši aplikaci vyžaduje volbu vhodné výdrže, zejména u dnešních novějších flash technologií. Pokud věnujete čas prozkoumání datových listů a pracovní zátěže, abyste vybrali správnou výdrž pro váš SSD disk, maximalizujete jeho životnost a minimalizujete své pořizovací a provozní náklady.
Další čtení
- Tech Brief:
- Bílá kniha: Přizpůsobení výdrže SSD běžným podnikovým aplikacím: Top Considerations for Enterprise SSDs
- Blog: The TCO Implications of Endurance