Co je to vysoká dostupnost?

Vysoká dostupnost (HA) je součást technologického systému, která eliminuje jednotlivé body selhání, aby byl zajištěn nepřetržitý provoz nebo provozuschopnost po delší dobu.

Všechny organizace používají řadu kritických podnikových databází a aplikací, jako jsou datové sklady, aplikace elektronického obchodování, systémy pro řízení vztahů se zákazníky (CRM), finanční systémy, systémy pro řízení dodavatelského řetězce a systémy business intelligence. Při selhání systému, databáze nebo aplikace tyto organizace vyžadují ochranu s vysokou dostupností, aby systémy zůstaly v provozu a minimalizovalo se riziko ztráty příjmů, neproduktivních zaměstnanců a nespokojených zákazníků.

Vysoce dostupné systémy zahrnují pět principů návrhu:

  • Při selhání aktivní komponenty automaticky přejdou na redundantní systém, který operaci převezme. Tím se eliminují jednotlivé body selhání.
  • Dokážou automaticky detekovat selhání na úrovni aplikace, jakmile k němu dojde, bez ohledu na příčiny.
  • Zajišťují, aby při selhání systému nedošlo ke ztrátě dat.
  • Automaticky a rychle přecházejí na redundantní komponenty, aby se minimalizovaly prostoje.
  • Zajišťují možnost ručního převzetí a zpětného převzetí při selhání, aby se minimalizovaly prostoje během plánované údržby.

TechTarget definuje HA jako „systém nebo komponentu, která je nepřetržitě funkční po žádoucí dlouhou dobu. Dostupnost lze měřit vzhledem ke „100% provozuschopnosti“ nebo „nikdy neselže“. Všeobecně rozšířený, ale obtížně dosažitelný standard dostupnosti systému nebo produktu je známý jako dostupnost ‚pět devítek‘ (99,999 %).“

Definujme však vysokou dostupnost jednoduše:

Vysoká dostupnost zajišťuje, že vaše systémy, databáze a aplikace budou fungovat tehdy a tehdy, kdy to bude potřeba.

Výraz „kdy“ zohledňuje procento času, kdy musí být aplikace v provozu. „Podle potřeby“ bere v úvahu správný provoz systému, databáze a/nebo aplikací bez ztráty dat.

V závislosti na systému a/nebo aplikaci se bude vysoká dostupnost lišit. Například u kritických aplikací, jako jsou vaše systémy elektronického obchodování, se za průmyslový standard považují čtyři devítky (99,99 %) dostupnosti. Při 99,99% dostupnosti můžete očekávat maximálně 52,60 minut výpadku za rok nebo 8,64 sekund výpadku za den. U nekritických aplikací a systémů, jako je například výpadek jednoho stolního počítače, však může vysoká dostupnost činit dvě devítky (99 %), což odpovídá 8,77 hodinám výpadku za rok nebo 1,44 minutám výpadku za den. Při měření přijatelných prostojů je důležité zohlednit:

  • Neplánované prostoje (např, selhání hardwaru nebo softwaru)
  • Plánované prostoje potřebné pro běžnou údržbu hardwaru a softwaru
  • Provozní doba na úrovni databází a aplikací

Vaše rozhodnutí pro vysokou dostupnost závisí na mnoha faktorech, včetně toho, jak kritické jsou aplikace pro podnik, zda jsou ovlivněni zákazníci, jak často jsou aplikace provozovány, kolik uživatelů je ovlivněno, jak rychle musí databáze nebo aplikace přejít na redundantní systém a jak velká ztráta dat je tolerována.

Metriky vysoké dostupnosti:

  • RTO je maximální tolerovaná doba trvání jakéhokoli výpadku. Aplikace pro online zpracování transakcí mají obecně nejnižší RTO a ty, které jsou kritické, mají často RTO jen několik sekund.
  • RPO je maximální velikost ztráty dat, kterou lze tolerovat při výpadku. Pro HA je RPO často nulová, aby se určilo, že by mělo dojít k nulové ztrátě dat při všech scénářích selhání.

Je však rozdíl mezi tím, jakých RTO a RPO můžete dosáhnout pro podporu vysoké dostupnosti oproti obnově po havárii. Při HA může být replikace dat synchronní, protože vaše redundantní komponenty jsou v prostředí LAN. Aktivní a záložní databáze mohou být aktualizovány současně, což umožňuje úplné, automatické obnovení v reálném čase, které může splnit nejnáročnější RTO a RPO. Výsledkem je, že vaše záložní instance je „horká“ a synchronizovaná s aktivní instancí, takže je připravena okamžitě převzít řízení v případě selhání.

Obnovení systémů, softwaru a dat v případě havárie však vyžaduje, aby redundantní komponenty byly v rozsáhlé síti (WAN). To je důležité, protože redundantní komponenty musíte mít v geografické poloze mimo aktivní instanci. V síti WAN je však replikace dat asynchronní, aby nedošlo k negativnímu ovlivnění propustnosti. To znamená, že aktualizace záložních instancí se budou opožďovat za aktualizacemi prováděnými v aktivní instanci, což bude mít za následek zpoždění během procesu obnovy. Vzhledem k tomu, že katastrofy jsou vzácné, může být určité zpoždění tolerovatelné a závisí na tom, (a) jak kritické je pro vaši firmu dosažení co nejnižších hodnot RTO a RPO a (b) jaký rozpočet můžete vyčlenit na dosažení nejlepších hodnot RTO a RPO.

Jak vám systém SIOS pomůže dosáhnout vysoké dostupnosti

Systém SIOS nabízí jediné řešení, které splňuje potřeby vysoké dostupnosti i obnovy po havárii v široké škále operačních systémů, infrastrukturních prostředí a aplikací, včetně systémů SAP, SQL Server, Oracle a dalších prostředí provozovaných v konfiguracích sdílených úložišť založených na síti SAN nebo v konfiguracích lokálních datových úložišť bez sítě SAN.

  • Prostředí Windows: Po přidání do prostředí Windows Server Failover Cluster (WSFC) umožňuje SIOS DataKeeper vytvořit cluster bez SAN v případech, kdy sdílené úložné clustery nejsou možné nebo praktické, nebo přidat replikaci pro ochranu před havárií v clusterech Windows založených na SAN. Rychlá a efektivní replikace na bázi hostitele synchronizuje místní úložiště v místních a vzdálených uzlech clusteru a vytváří cluster SANLess v libovolné kombinaci fyzických, virtuálních nebo cloudových prostředí.
  • Prostředí Linux: SIOS Protection Suite pro Linux je balené softwarové řešení pro clustering, které využívá nástroje SIOS LifeKeeper a SIOS DataKeeper a poskytuje úzce integrovanou kombinaci clusteringu s vysokou dostupností při selhání, nepřetržitého monitorování aplikací, replikace dat a konfigurovatelných zásad obnovy pro ochranu kritických podnikových aplikací a dat před výpadky a haváriemi. Sada SIOS Protection Suite umožňuje vytvářet clustery SAN nebo SANLess pomocí široké škály úložných zařízení, včetně přímo připojených úložišť, iSCSI a Fibre Channel. Sada SIOS Protection Suite pro Linux podporuje všechny hlavní distribuce Linuxu, včetně Red Hat Enterprise Linux, SUSE Linux Enterprise Server, CentOS a Oracle Linux.

S řešeními SIOS je RPO vždy nulová a RTO závisí na aplikaci, ale u některých aplikací obvykle 30 sekund až několik minut. Probereme si případovou studii jednoho zákazníka „SIOS v akci“ v největší švýcarské maloobchodní společnosti.

Migros dosahuje kritické kontinuity provozu svého pokladního systému pomocí řešení vysoké dostupnosti SIOS

Migros je největší švýcarská maloobchodní společnost, největší řetězec supermarketů a největší zaměstnavatel s více než 100 000 zaměstnanci. Patří také mezi čtyřicet největších maloobchodních prodejců na světě. Ve spolupráci se společností Realstuff Informatik AG, švýcarským poskytovatelem IT služeb a prodejcem řešení SIOS, chtěl Migros nahradit svůj prodejní systém (POS) novou platformou, která by byla efektivnější na provoz a dokázala minimalizovat hrozbu výpadků.

Nový pokladní systém poskytuje informace o cenách a sortimentu v 650 prodejnách společnosti Migros a maloobchodní řetězec potřeboval řešení s vysokou dostupností pro podporu každodenního prodeje. Bez systému HA by zaměstnanci v případě výpadku systému nemohli nacenit produkty nebo zvážit zboží, což by vedlo k zastavení provozu. Po vyhodnocení možností se společnost Migros rozhodla, že chce serverové prostředí s otevřeným zdrojovým kódem, které nabízí vysokou dostupnost a nepřetržitou ochranu dat, je nezávislé na virtuálním prostředí a může být interně provozováno IT pracovníky společnosti. Pro splnění těchto požadavků si tým vybral pro replikaci k ochraně dat pokladen sadu SIOS Protection Suite for Linux.

Pro návrh systému, školení zákazníků a podporu v rodném jazyce spolupracovala společnost Realstuff s kompetenčním a podpůrným centrem SIOS pro střední a východní Evropu se sídlem v německých Drážďanech, které provozuje společnost Computer Concept. Pro společnost Migros bylo důležité získat od Competence and Support Center podporu 24x7x365 v době regionálního zastoupení.

Realstuff implementoval řešení vysoké dostupnosti SIOS Protection Suite, které neustále monitoruje pokladní servery a replikuje data. V každé prodejně se používají dva servery, které zajišťují nepřetržitou ochranu dat. Pokud jeden server selže, práci okamžitě převezme druhá instance. Oba servery navíc zrcadlí datové prostředky v monitorovacím systému. Celou případovou studii společnosti Migros si můžete přečíst zde.

Závěrečné myšlenky

Regionální kompetenční a podpůrné centrum konzultovalo se společností Realstuff, aby jí poskytlo náhled a pokyny ohledně implementace a spuštění, a provedlo třídenní školicí seminář, na kterém proškolilo tým společnosti Migros. Richard Huber, manažer a člen představenstva společnosti Realstuff, po nasazení uvedl, že výhodami řešení vysoké dostupnosti SIOS jsou jeho flexibilita, spolehlivost, snadné použití a jistota, že data jsou neustále synchronizována.

Dnes společnost Migros splnila své požadavky na HA díky snadno použitelnému řešení SIOS, které zajišťuje nepřetržité monitorování serverů, úložišť, aplikací, databází a síťových připojení s cílem odhalit místa výpadku, zkrátit prostoje, zachovat konektivitu klientů a zajistit nepřetržitý přístup k datům.

Další informace o řešeních SIOS a o tom, jak vám může SIOS pomoci dosáhnout HA v prostředí SQL Serveru, najdete v článku „Proč clustery pro vysokou dostupnost SQL Serveru“ zde.

Podívejte se na nedávné příspěvky na blogu o dostupnosti.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.