Mi a nagyfokú rendelkezésre állás?

A nagyfokú rendelkezésre állás (HA) egy technológiai rendszer olyan összetevője, amely kiküszöböli az egyes hibapontokat, és így biztosítja a folyamatos működést vagy az üzemidőt hosszabb ideig.

Minden szervezet számos üzletileg kritikus fontosságú adatbázist és alkalmazást használ, például adattárházakat, e-kereskedelmi alkalmazásokat, ügyfélkapcsolat-kezelő rendszereket (CRM), pénzügyi rendszereket, ellátási lánc-kezelő és üzleti intelligencia rendszereket. Ha egy rendszer, adatbázis vagy alkalmazás meghibásodik, ezeknek a szervezeteknek nagy rendelkezésre állású védelemre van szükségük, hogy a rendszerek működőképesek maradjanak, és minimalizálják a bevételkiesés, a nem produktív alkalmazottak és az elégedetlen ügyfelek kockázatát.

A nagy rendelkezésre állású rendszerek öt tervezési alapelvet tartalmaznak:

  • Az aktív komponens meghibásodása esetén automatikusan átállnak egy redundáns rendszerre a működés folytatására. Ez kiküszöböli az egyetlen hibapontokat.
  • Az alkalmazásszintű hibákat automatikusan észlelik, amint azok bekövetkeznek, függetlenül azok okától.
  • A rendszer meghibásodása esetén biztosítják, hogy ne legyen adatvesztés.
  • Az állásidő minimalizálása érdekében automatikusan és gyorsan átállnak redundáns komponensekre.
  • Szolgáltatják a manuális failover és failback lehetőségét, hogy minimalizálják az állásidőt a tervezett karbantartás során.

ATechTarget meghatározása szerint a HA “olyan rendszer vagy komponens, amely egy kívánatos hosszú ideig folyamatosan működőképes. A rendelkezésre állás mérhető a “100%-os üzemképességhez” vagy a “soha nem hibásodáshoz” viszonyítva. A rendszer vagy termék rendelkezésre állásának széles körben elterjedt, de nehezen elérhető szabványa az ‘öt 9-es’ (99,999%-os) rendelkezésre állás.”

De definiáljuk a magas rendelkezésre állást egyszerűbben:

A magas rendelkezésre állás biztosítja, hogy a rendszerek, adatbázisok és alkalmazások akkor és úgy működjenek, amikor és ahogyan szükséges.

A “amikor” azt veszi figyelembe, hogy az alkalmazásnak hány százalékban kell működnie. A “szükség szerint” a rendszer, az adatbázis és/vagy az alkalmazások megfelelő, adatvesztés nélküli működését veszi figyelembe.

A rendszertől és/vagy az alkalmazástól függően a magas rendelkezésre állás különböző lesz. Például a kritikus fontosságú alkalmazások, például az Ön e-kereskedelmi rendszerei esetében a négy 9-es (99,99%-os) rendelkezésre állás tekinthető ipari szabványnak. 99,99%-os rendelkezésre állás esetén évente legfeljebb 52,60 perc vagy naponta 8,64 másodperc leállásra számíthat. A nem kritikus alkalmazások és rendszerek esetében azonban, például egyetlen asztali számítógép meghibásodása esetén a magas rendelkezésre állás két 9-es (99%) lehet, ami évi 8,77 óra vagy napi 1,44 perc leállást jelent. Az elfogadható leállási idő mérésekor fontos, hogy figyelembe vegye:

  • A nem tervezett leállások (pl, hardver- vagy szoftverhibák)
  • A rutinszerű hardver- és szoftverkarbantartáshoz szükséges tervezett leállási időt
  • Az adatbázis- és alkalmazásszintű üzemidőt

A nagy rendelkezésre állás kiválasztása számos tényezőtől függ, többek között attól, hogy az alkalmazások mennyire kritikusak az üzlet szempontjából, hogy az ügyfelek érintettek-e, milyen gyakran futnak az alkalmazások, hány felhasználót érint, milyen gyorsan kell egy adatbázisnak vagy alkalmazásnak átállnia a redundáns rendszerre, és hogy mekkora adatvesztés tolerálható.

Nagyfokú rendelkezésre állás mérőszámai: RTO és RPO

A HA (és a katasztrófa utáni helyreállítás (DR) is) értékelésére általában használt két mérőszám a helyreállítási időcél (RTO) és a helyreállítási pontcél (RPO).

  • A RTO a kiesés maximálisan tolerálható időtartama. Az online tranzakciófeldolgozó alkalmazásoknak általában a legalacsonyabb az RTO-juk, a kritikus fontosságú alkalmazásoknak pedig gyakran csak néhány másodperces az RTO-juk.
  • RPO az a maximálisan tolerálható adatveszteség, ha meghibásodás történik. A HA esetében az RPO gyakran nulla, hogy minden meghibásodási forgatókönyv esetén nulla adatvesztés legyen.

Az között azonban különbség van, hogy milyen RTO-kat és RPO-kat lehet elérni a magas rendelkezésre állás és a katasztrófa utáni helyreállítás támogatása érdekében. HA esetén az adatreplikáció szinkronizálható, mivel a redundáns komponensek a LAN-környezetben vannak. Az aktív és a tartalék adatbázisok egyidejűleg frissíthetők, lehetővé téve a teljes, automatikus, valós idejű helyreállítást, amely a legigényesebb RTO-kat és RPO-kat is kielégíti. Ennek eredményeként a készenléti példány “forró” és szinkronban van az aktív példányával, így készen áll arra, hogy meghibásodás esetén azonnal átvegye a helyét.

A rendszerek, szoftverek és adatok katasztrófa esetén történő helyreállításához azonban szükség van arra, hogy a redundáns komponensek nagy kiterjedésű hálózaton (WAN) legyenek. Ez azért fontos, mert a redundáns komponenseket az aktív példánytól távoli földrajzi helyen kell tartani. WAN esetén azonban az adatreplikáció aszinkron, hogy ne befolyásolja negatívan az átviteli teljesítményt. Ez azt jelenti, hogy a tartalék példányok frissítései késnek az aktív példány frissítéseihez képest, ami késedelmet okoz a helyreállítási folyamat során. Mivel a katasztrófák ritkák, némi késedelem elviselhető, és attól függ, hogy (a) mennyire kritikus az Ön vállalkozása számára a lehető legalacsonyabb RTO és RPO elérése, valamint (b) mekkora költségvetést tud elkülöníteni a legjobb RTO és RPO eléréséhez.

Hogyan segít a SIOS a magas rendelkezésre állás elérésében

A SIOS egyetlen megoldást kínál mind a magas rendelkezésre állási, mind a katasztrófa utáni helyreállítási igények kielégítésére az operációs rendszerek, infrastrukturális környezetek és alkalmazások széles skáláján, beleértve az SAP, SQL Server, Oracle és más, SAN-alapú, megosztott tárolási konfigurációkban vagy SAN nélküli, helyi adattárolási konfigurációkban futó környezeteket.

  • Windows környezet: A Windows Server Failover Cluster (WSFC) környezethez hozzáadva a SIOS DataKeeper lehetővé teszi SAN nélküli fürtök létrehozását, ahol a megosztott tároló fürtök nem lehetségesek vagy nem praktikusak, vagy replikációt adhat hozzá a katasztrófavédelemhez a SAN-alapú Windows fürtökben. A gyors, hatékony host-alapú replikáció szinkronizálja a helyi tárolást a helyi és távoli fürtcsomópontokon, SANLess fürtöt hozva létre a fizikai, virtuális vagy felhő környezetek bármilyen kombinációjában.
  • Linux környezetek: A SIOS Protection Suite for Linux egy csomagolt fürtözési szoftvermegoldás, amely a SIOS LifeKeeper és a SIOS DataKeeper segítségével a nagy rendelkezésre állású failover fürtözés, a folyamatos alkalmazásfigyelés, az adatreplikáció és a konfigurálható helyreállítási házirendek szorosan integrált kombinációját biztosítja, hogy megvédje az üzleti szempontból kritikus alkalmazásokat és adatokat a leállásoktól és katasztrófáktól. A SIOS Protection Suite lehetővé teszi SAN vagy SANLess fürtök létrehozását a tárolóeszközök széles skáláját használva, beleértve a közvetlenül csatlakoztatott tárolókat, az iSCSI-t és a Fibre Channel-t is. A SIOS Protection Suite for Linux támogatja az összes főbb Linux disztribúciót, beleértve a Red Hat Enterprise Linuxot, a SUSE Linux Enterprise Server-t, a CentOS-t és az Oracle Linuxot.

A SIOS megoldásoknál az RPO mindig nulla, az RTO pedig az alkalmazástól függ, de egyes alkalmazásoknál jellemzően 30 másodperctől néhány percig terjed. Beszéljünk egy ügyfél “SIOS in action” esettanulmányáról Svájc legnagyobb kiskereskedelmi vállalatánál.

Migros elérte POS-rendszerének kritikus üzleti folytonosságát a SIOS nagy rendelkezésre állási megoldásaival

A Migros Svájc legnagyobb kiskereskedelmi vállalata, a legnagyobb szupermarketlánc és a legnagyobb munkaadó több mint 100 000 alkalmazottal. Emellett a világ negyven legnagyobb kiskereskedelmi vállalatának egyike. A svájci székhelyű Realstuff Informatik AG-val, a SIOS megoldások svájci IT-szolgáltatójával és viszonteladójával együttműködve a Migros az értékesítési pontrendszerét (POS) olyan új platformra kívánta lecserélni, amely hatékonyabban üzemeltethető, és minimalizálni tudja az állásidő veszélyét.

Az új POS-rendszer a Migros 650 üzletében ár- és termékválasztékinformációkat szolgáltat, és a kiskereskedőnek a mindennapi értékesítés támogatásához magas rendelkezésre állású megoldásra volt szüksége. HA rendszer nélkül az alkalmazottak nem tudták volna beárazni a termékeket vagy lemérni az árukat, ha a rendszer meghibásodik, ami a működés leállását eredményezte volna. A lehetőségek felmérése után a Migros úgy döntött, hogy olyan nyílt forráskódú szerverkörnyezetet szeretne, amely magas rendelkezésre állást és folyamatos adatvédelmet biztosít, független a virtuális környezettől, és amelyet a vállalat informatikai munkatársai belsőleg üzemeltethetnek. E követelmények teljesítése érdekében a csapat a SIOS Protection Suite for Linux-ot választotta a POS-adatok védelmét szolgáló replikációhoz.

A rendszertervezés, az ügyfélképzés és az anyanyelvi támogatás tekintetében a Realstuff a németországi Drezdában található, a Computer Concept által működtetett SIOS Közép- és Kelet-Európai Kompetencia- és Támogatóközpontjával működött együtt. A Migros számára fontos volt, hogy a regionális irodai idő alatt 24x7x365 támogatást kapjon a Kompetencia- és Támogatási Központtól.

A Realstuff a SIOS Protection Suite magas rendelkezésre állási megoldást valósította meg a POS-szerverek folyamatos felügyeletére és az adatok replikálására. Minden egyes üzlethelyszínen két szervert használnak a folyamatos adatvédelem biztosítása érdekében. Ha az egyik szerver meghibásodik, a második példány azonnal átveszi a munkát. Ezenkívül mindkét szerver tükrözi az adatvagyont a felügyeleti rendszerben. A Migros teljes esettanulmányát itt olvashatja el.

Végső gondolatok

A regionális kompetencia- és támogatási központ konzultált a Realstuffal, hogy betekintést és iránymutatást nyújtson a bevezetéshez és a bevezetéshez, és háromnapos képzési workshopot tartott a Migros csapatának képzéséhez. Richard Huber, a Realstuff vezetője és igazgatósági tagja a bevezetés után úgy nyilatkozott, hogy a SIOS nagy rendelkezésre állású megoldás előnyei a rugalmasság, a megbízhatóság, az egyszerű használat és a biztosíték, hogy az adatok mindig szinkronban maradnak.

Mára a Migros teljesítette a HA-ra vonatkozó követelményeit a SIOS könnyen használható megoldásával, amely a szerverek, tárolók, alkalmazások, adatbázisok és hálózati kapcsolatok folyamatos felügyeletét biztosítja a hibapontok felderítése, az állásidő csökkentése, az ügyfélkapcsolat fenntartása és a megszakítás nélküli adathozzáférés biztosítása érdekében.

A SIOS megoldásairól és arról, hogy a SIOS hogyan segíthet a HA elérésében egy SQL Server környezetben, itt olvashat “Miért a klaszterezés az SQL Server magas rendelkezésre állásához” címmel.

A rendelkezésre állásról szóló legutóbbi blogbejegyzések megtekintése.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.