Vad är hög tillgänglighet?

Hög tillgänglighet (HA) är en komponent i ett tekniskt system som eliminerar enstaka felpunkter för att säkerställa kontinuerlig drift eller drifttid under en längre tidsperiod.

Alla organisationer använder en mängd olika affärskritiska databaser och tillämpningar, t.ex. datalager, e-handelstillämpningar, system för hantering av kundrelationer (CRM), finansiella system, hantering av försörjningskedjan och system för affärsinformation. När ett system, en databas eller en applikation går sönder kräver dessa organisationer ett högtillgänglighetsskydd för att hålla systemen igång och minimera risken för förlorade intäkter, improduktiva anställda och missnöjda kunder.

Högtillgängliga system innehåller fem designprinciper:

  • De växlar automatiskt över till ett redundant system för att ta upp en operation när en aktiv komponent går sönder. Detta eliminerar enskilda felpunkter.
  • De kan automatiskt upptäcka fel på applikationsnivå när de inträffar, oavsett orsakerna.
  • De säkerställer att inga data går förlorade under ett systemfel.
  • De växlar automatiskt och snabbt över till redundanta komponenter för att minimera stilleståndstiden.
  • De ger möjlighet till manuell failover och failback för att minimera stilleståndstiden vid planerat underhåll.

TechTarget definierar HA som ”ett system eller en komponent som är kontinuerligt i drift under en önskvärd lång tid. Tillgänglighet kan mätas i förhållande till ’100 % fungerande’ eller ’aldrig felande’. En allmänt accepterad men svår att uppnå standard för tillgänglighet för ett system eller en produkt är känd som ’five 9s’ (99,999%) tillgänglighet.”

Men låt oss definiera hög tillgänglighet i enkla termer:

Hög tillgänglighet säkerställer att dina system, databaser och applikationer fungerar när och enligt behov.

Det ”när” tar hänsyn till hur stor andel av tiden som applikationen måste vara igång och fungera. ”Vid behov” tar hänsyn till att systemet, databasen och/eller programmen ska fungera korrekt utan dataförlust.

Hög tillgänglighet är olika beroende på system och/eller program. Till exempel, när det gäller verksamhetskritiska tillämpningar, som dina e-handelssystem, anses fyra nior (99,99 %) tillgänglighet vara en industristandard. Med 99,99 % tillgänglighet kan du förvänta dig högst 52,60 minuters driftstopp per år eller 8,64 sekunders driftstopp per dag. För icke-kritiska tillämpningar och system, som t.ex. fel på en enskild dator, kan hög tillgänglighet dock vara två nior (99 %), vilket motsvarar 8,77 timmars driftstopp per år eller 1,44 minuters driftstopp per dag. När man mäter acceptabel nedtid är det viktigt att man tar hänsyn till:

  • Oplanerad nedtid (t.ex, maskinvaru- eller programvarufel)
  • Den planerade nedtid som behövs för rutinmässigt maskinvaru- och programvaruunderhåll
  • Upptid på databas- och applikationsnivå

Ditt val av hög tillgänglighet beror på många faktorer, bland annat hur kritiska applikationerna är för verksamheten, om kunderna påverkas, hur ofta applikationerna körs, hur många användare som berörs, hur snabbt en databas eller ett program måste växla över till det redundanta systemet, och hur mycket dataförlust som är acceptabel.

Mätvärden för hög tillgänglighet: RTO och RPO

De två mått som normalt används för att bedöma hög tillgänglighet (och även katastrofåterställning (DR)) är Recovery Time Objective (RTO) och Recovery Point Objective (RPO).

  • RTO är den maximalt tolerabla längden på ett avbrott. Applikationer för transaktionsbehandling online har i allmänhet de lägsta RTO-tiderna, och de som är affärskritiska har ofta en RTO på bara några sekunder.
  • RPO är den maximala mängden dataförlust som kan tolereras när ett fel inträffar. För HA är RPO ofta noll för att ange att det ska vara noll dataförlust under alla felscenarier.

Det finns dock en skillnad mellan vilka RTO:er och RPO:er du kan uppnå för att stödja hög tillgänglighet kontra katastrofåterställning. Med HA kan datareplikering vara synkron eftersom dina redundanta komponenter finns i din LAN-miljö. Aktiva databaser och reservdatabaser kan uppdateras samtidigt, vilket möjliggör fullständiga, automatiska återställningar i realtid som kan uppfylla de mest krävande RTO- och RPO-tiderna. Som ett resultat av detta är din standby-instans ”varm” och synkroniserad med din aktiva instans, så att den är redo att omedelbart ta över i händelse av ett fel.

För att återställa system, programvara och data i händelse av en katastrof krävs dock att de redundanta komponenterna finns i ett WAN-nätverk (Wide Area Network). Detta är viktigt eftersom du måste ha redundanta komponenter på en geografisk plats bort från den aktiva instansen. Men med ett WAN är datareplikering asynkron för att undvika negativ påverkan på genomströmningsprestanda. Detta innebär att uppdateringar till reservinstanser kommer att släpa efter uppdateringar som görs till den aktiva instansen, vilket resulterar i en fördröjning under återställningsprocessen. Eftersom katastrofer är sällsynta kan en viss fördröjning vara tolerabel och beror på a) hur viktigt det är för din verksamhet att uppnå lägsta möjliga RTO och RPO och b) hur mycket budget du kan avsätta för att uppnå bästa möjliga RTO och RPO.

Hur SIOS hjälper dig att uppnå hög tillgänglighet

SIOS erbjuder en enda lösning för att tillgodose behoven av både hög tillgänglighet och katastrofåterställning i en mängd olika operativsystem, infrastrukturmiljöer och tillämpningar, inklusive SAP, SQL Server, Oracle och andra miljöer som körs i SAN-baserade, delade lagringskonfigurationer eller SAN-lösa, lokala datalagringskonfigurationer.

  • Windows-miljö: När SIOS DataKeeper läggs till i en Windows Server Failover Cluster-miljö (WSFC) kan du med hjälp av SIOS DataKeeper skapa ett SAN-löst kluster där kluster med delad lagring är omöjliga eller opraktiska, eller lägga till replikering för katastrofskydd i dina SAN-baserade Windows-kluster. Snabb, effektiv värdbaserad replikering synkroniserar lokal lagring på lokala och fjärrklusternoder och skapar ett SAN-löst kluster i alla kombinationer av fysiska, virtuella eller molnmiljöer.
  • Linux-miljöer: SIOS Protection Suite for Linux är en paketerad klusterprogramvarulösning som använder SIOS LifeKeeper och SIOS DataKeeper för att tillhandahålla en tätt integrerad kombination av högtillgänglig failover-klustering, kontinuerlig applikationsövervakning, datareplikering och konfigurerbara återställningsprinciper för att skydda dina affärskritiska applikationer och data från driftstopp och katastrofer. Med SIOS Protection Suite kan du bygga SAN- eller SANLess-kluster med hjälp av ett brett utbud av lagringsenheter, inklusive direktansluten lagring, iSCSI och Fibre Channel. SIOS Protection Suite för Linux har stöd för alla större Linuxdistributioner, inklusive Red Hat Enterprise Linux, SUSE Linux Enterprise Server, CentOS och Oracle Linux.

Med SIOS-lösningar är RPO alltid noll och RTO är beroende av applikationen, men vanligtvis 30 sekunder till några minuter för vissa applikationer. Låt oss diskutera en kunds fallstudie ”SIOS in action” på Schweiz största detaljhandelsföretag.

Migros uppnår kritisk affärskontinuitet för sitt kassasystem med SIOS högtillgänglighetslösningar

Migros är Schweiz största detaljhandelsföretag, landets största stormarknadskedja och den största arbetsgivaren med mer än 100 000 anställda. Det är också en av de fyrtio största detaljhandelsföretagen i världen. I samarbete med Realstuff Informatik AG, en schweizisk IT-tjänsteleverantör och återförsäljare av SIOS-lösningar, ville Migros byta ut sitt POS-system (Point of Sale) mot en ny plattform som var effektivare att använda och som kunde minimera hotet om driftsstopp.

Det nya POS-systemet tillhandahåller pris- och sortimentsinformation i Migros 650 butiker och detaljisten behövde en lösning med hög tillgänglighet för att stödja den dagliga försäljningen. Utan ett HA-system kunde de anställda inte prissätta produkter eller väga varor om det skulle uppstå ett systemfel, vilket skulle få verksamheten att stanna upp. Efter att ha utvärderat olika alternativ beslutade Migros att man ville ha en servermiljö med öppen källkod som erbjöd hög tillgänglighet och kontinuerligt dataskydd, som var oberoende av en virtuell miljö och som kunde drivas internt av företagets IT-personal. För att uppfylla dessa krav valde teamet SIOS Protection Suite for Linux för replikering för att skydda kassadata.

För systemdesign, kundutbildning och modersmålsstöd samarbetade Realstuff med SIOS Competence and Support Center for Central and Eastern Europe, som är baserat i Dresden i Tyskland och drivs av Computer Concept. Det var viktigt för Migros att få support 24x7x365 under den regionala kontorstiden från kompetens- och supportcentret.

Realstuff implementerade högtillgänglighetslösningen SIOS Protection Suite för att ständigt övervaka kassaservrarna och replikera data. På varje butiksplats används två servrar för att säkerställa ett kontinuerligt dataskydd. Om en server går sönder tar den andra instansen över arbetet omedelbart. Dessutom speglar båda servrarna datatillgångarna i övervakningssystemet. Läs hela Migros fallstudie här.

Sluttliga tankar

Det regionala kompetens- och supportcentret konsulterade Realstuff för att ge insikt och vägledning om implementering och lansering och genomförde en tredagars utbildningsworkshop för att utbilda Migros-teamet. Richard Huber, chef och styrelseledamot på Realstuff, kommenterade efter installationen att fördelarna med högtillgänglighetslösningen SIOS var dess flexibilitet, tillförlitlighet, användarvänlighet och försäkran om att data alltid hålls synkroniserade.

I dag har Migros uppfyllt sina krav på HA med SIOS lättanvända lösning, som ger kontinuerlig övervakning av servrar, lagring, applikationer, databaser och nätverksanslutningar för att upptäcka felpunkter, minska stilleståndstiden, upprätthålla klientanslutningen och ge oavbruten dataåtkomst.

För mer information om SIOS-lösningar och hur SIOS kan hjälpa dig att uppnå HA i en SQL Server-miljö kan du läsa ”Why Clustering for SQL Server High Availability” här.

Se senaste blogginlägg om tillgänglighet.

Lämna ett svar

Din e-postadress kommer inte publiceras.