Ce este disponibilitatea ridicată?

Disponibilitatea ridicată (HA) este o componentă a unui sistem tehnologic care elimină punctele unice de eșec pentru a asigura operațiuni continue sau timp de funcționare pentru o perioadă extinsă.

Toate organizațiile utilizează o varietate de baze de date și aplicații critice pentru afaceri, cum ar fi depozitele de date, aplicațiile de comerț electronic, sistemele de gestionare a relațiilor cu clienții (CRM), sistemele financiare, gestionarea lanțului de aprovizionare și sistemele de informații de afaceri. Atunci când un sistem, o bază de date sau o aplicație se defectează, aceste organizații au nevoie de o protecție de înaltă disponibilitate pentru a menține sistemele în funcțiune și pentru a minimiza riscul de pierdere de venituri, de angajați neproductivi și de clienți nemulțumiți.

Sistemele cu disponibilitate ridicată încorporează cinci principii de proiectare:

  • Sunt cu basculare automată la un sistem redundant pentru a prelua o operațiune atunci când o componentă activă se defectează. Acest lucru elimină punctele unice de eșec.
  • Pot detecta automat eșecurile de la nivelul aplicațiilor pe măsură ce acestea se produc, indiferent de cauze.
  • Asigură că nu se pierde nici o cantitate de date în timpul unei defecțiuni a sistemului.
  • Pot trece automat și rapid la componente redundante pentru a minimiza timpul de nefuncționare.
  • Aprovizionează posibilitatea de a face manual failover și failback pentru a minimiza timpul de nefuncționare în timpul mentenanței planificate.

TechTarget definește HA ca fiind „un sistem sau o componentă care este în permanență operațională pentru o perioadă de timp dezirabil de lungă durată. Disponibilitatea poate fi măsurată în raport cu ‘100% operațional’ sau ‘niciodată în pană’. Un standard de disponibilitate foarte răspândit, dar dificil de atins, pentru un sistem sau un produs este cunoscut sub numele de disponibilitate ‘cinci 9’ (99,999%).”

Dar să definim Înalta Disponibilitate în termeni simpli:

Înalta Disponibilitate asigură că sistemele, bazele de date și aplicațiile dumneavoastră funcționează când și cât este necesar.

„Când” ia în considerare procentul de timp în care aplicația trebuie să fie funcțională. „la nevoie” ia în considerare funcționarea corectă a sistemului, a bazei de date și/sau a aplicațiilor fără pierderi de date.

În funcție de sistem și/sau de aplicație, disponibilitatea ridicată va fi diferită. De exemplu, în cazul aplicațiilor critice, cum ar fi sistemele dvs. de comerț electronic, disponibilitatea de patru „9” (99,99%) este considerată un standard industrial. Cu o disponibilitate de 99,99%, nu vă puteți aștepta la mai mult de 52,60 minute de timp de nefuncționare pe an sau 8,64 secunde de nefuncționare pe zi. Cu toate acestea, pentru aplicațiile și sistemele care nu sunt critice, cum ar fi defectarea unui singur desktop, disponibilitatea ridicată poate fi de doi 9 (99%), ceea ce echivalează cu 8,77 ore de timp de nefuncționare pe an sau 1,44 minute de timp de nefuncționare pe zi. Atunci când măsurați timpul de nefuncționare acceptabil, este important să luați în considerare:

  • Timpuri de nefuncționare neplanificate (de ex, defecțiuni hardware sau software)
  • Timpurile de nefuncționare planificate necesare pentru întreținerea de rutină a hardware-ului și software-ului
  • Timpurile de nefuncționare planificate la nivelul bazei de date și al aplicației

Alegerea dvs. pentru disponibilitate ridicată depinde de mulți factori, inclusiv de cât de critice sunt aplicațiile pentru afacere, dacă clienții sunt afectați, cât de des rulează aplicațiile, câți utilizatori sunt afectați, cât de repede o bază de date sau o aplicație trebuie să treacă la sistemul redundant și cât de multă pierdere de date este tolerabilă.

Metrici de înaltă disponibilitate: RTO și RPO

Cei doi parametri utilizați în mod normal pentru a evalua HA (și, de asemenea, Recuperarea în caz de dezastru (DR)) sunt Obiectivul timpului de recuperare (RTO) și Obiectivul punctului de recuperare (RPO).

  • RTO este durata maximă tolerabilă a oricărei întreruperi. Aplicațiile de procesare a tranzacțiilor online au, în general, cele mai mici RTO, iar cele care sunt critice pentru misiune au adesea un RTO de numai câteva secunde.
  • RPO este valoarea maximă a pierderii de date care poate fi tolerată atunci când are loc o defecțiune. Pentru HA, RPO este adesea zero pentru a specifica faptul că ar trebui să existe o pierdere de date zero în toate scenariile de eșec.

Există însă o diferență între ce RTO și RPO puteți obține pentru a sprijini disponibilitatea ridicată față de recuperarea în caz de dezastru. Cu HA, replicarea datelor poate fi sincronă, deoarece componentele dvs. redundante se află în mediul LAN. Bazele de date active și de rezervă pot fi actualizate concomitent, permițând recuperări complete, automate, în timp real, care pot satisface cele mai exigente RTO și RPO. Ca urmare, instanța de rezervă este „fierbinte” și sincronizată cu instanța activă, astfel încât este pregătită să preia imediat controlul în cazul unei defecțiuni.

Cu toate acestea, pentru a recupera sistemele, software-ul și datele în cazul unui dezastru, este necesar ca componentele redundante să se afle pe o rețea de mare distanță (WAN). Acest lucru este important deoarece trebuie să păstrați componentele redundante într-o locație geografică departe de instanța activă. Dar în cazul unei rețele WAN, replicarea datelor este asincronă pentru a evita impactul negativ asupra performanțelor de procesare. Acest lucru înseamnă că actualizările la instanțele de rezervă vor întârzia actualizările efectuate la instanța activă, ceea ce duce la o întârziere în timpul procesului de recuperare. Având în vedere că dezastrele sunt rare, o anumită întârziere poate fi tolerabilă și depinde de (a) cât de critic este pentru afacerea dvs. să obțineți cel mai mic RTO și RPO posibil și (b) cât de mult buget puteți aloca pentru a obține cel mai bun RTO și RPO.

Cum vă ajută SIOS să obțineți disponibilitate ridicată

SIOS oferă o soluție unică pentru a satisface atât nevoile de disponibilitate ridicată, cât și cele de recuperare în caz de dezastru pentru o mare varietate de sisteme de operare, medii de infrastructură și aplicații, inclusiv SAP, SQL Server, Oracle și alte medii care rulează în configurații de stocare partajată bazate pe SAN sau în configurații de stocare locală a datelor fără SAN.

  • Mediu Windows: Atunci când este adăugat la un mediu Windows Server Failover Cluster (WSFC), SIOS DataKeeper vă permite să creați un cluster fără SAN, acolo unde clusterele de stocare partajată sunt imposibile sau nepractice, sau să adăugați replicare pentru protecția împotriva dezastrelor în clusterele Windows bazate pe SAN. Replicarea rapidă și eficientă, bazată pe gazdă, sincronizează stocarea locală pe nodurile de cluster locale și la distanță, creând un cluster SANLess în orice combinație de medii fizice, virtuale sau cloud.
  • Mediile Linux: SIOS Protection Suite pentru Linux este o soluție software de clustering împachetată care utilizează SIOS LifeKeeper și SIOS DataKeeper pentru a oferi o combinație strâns integrată de clustering failover de înaltă disponibilitate, monitorizare continuă a aplicațiilor, replicare de date și politici de recuperare configurabile pentru a proteja aplicațiile și datele critice de afaceri împotriva timpilor morți și a dezastrelor. SIOS Protection Suite vă permite să creați clustere SAN sau SANLess folosind o gamă largă de dispozitive de stocare, inclusiv stocare cu atașare directă, iSCSI și Fibre Channel. SIOS Protection Suite pentru Linux suportă toate distribuțiile Linux majore, inclusiv Red Hat Enterprise Linux, SUSE Linux Enterprise Server, CentOS și Oracle Linux.

Cu soluțiile SIOS, RPO este întotdeauna zero, iar RTO depinde de aplicație, dar de obicei de la 30 de secunde la câteva minute pentru unele aplicații. Să discutăm studiul de caz „SIOS în acțiune” al unui client de la cea mai mare companie de retail din Elveția.

Migros realizează continuitatea critică a activității sistemului său POS cu ajutorul soluțiilor SIOS de înaltă disponibilitate

Migros este cea mai mare companie de retail din Elveția, cel mai mare lanț de supermarketuri și cel mai mare angajator, cu peste 100.000 de angajați. Este, de asemenea, unul dintre cei mai mari patruzeci de retaileri din lume. În parteneriat cu Realstuff Informatik AG, un furnizor de servicii IT cu sediul în Elveția și revânzător al soluțiilor SIOS, Migros dorea să își înlocuiască sistemul POS (Point of Sale) cu o nouă platformă care să fie mai eficient de operat și care să reducă la minimum amenințarea de întrerupere a activității.

Noul sistem POS furnizează informații despre prețuri și sortimente de produse în cele 650 de magazine Migros, iar retailerul avea nevoie de o soluție cu disponibilitate ridicată pentru a susține vânzările zilnice. Fără un sistem HA, angajații nu puteau stabili prețul produselor sau cântări bunurile în cazul unei defecțiuni a sistemului, ceea ce ar fi dus la oprirea operațiunilor. După ce a evaluat opțiunile, Migros a decis că dorea un mediu de servere open-source care să ofere disponibilitate ridicată și protecție continuă a datelor, să fie independent de un mediu virtual și să poată fi operat la nivel intern de către personalul IT al companiei. Pentru a răspunde acestor cerințe, echipa a ales SIOS Protection Suite for Linux pentru replicare, pentru a proteja datele POS.

Pentru proiectarea sistemului, instruirea clienților și suportul în limba maternă, Realstuff a încheiat un parteneriat cu Centrul de competență și suport SIOS pentru Europa Centrală și de Est, cu sediul în Dresda, Germania și operat de Computer Concept. A fost important pentru Migros să beneficieze de asistență 24x7x365 în timpul programului biroului regional din partea Centrului de competență și asistență.

Realstuff a implementat soluția de înaltă disponibilitate SIOS Protection Suite pentru a monitoriza în mod constant serverele POS și a replica datele. La fiecare locație a magazinului, sunt utilizate două servere pentru a asigura protecția continuă a datelor. Dacă un server cedează, cea de-a doua instanță preia instantaneu activitatea. În plus, ambele servere reflectă activele de date pe sistemul de monitorizare. Citiți aici studiul de caz complet al Migros.

Cugetări finale

Centrul regional de competență și asistență s-a consultat cu Realstuff pentru a oferi informații și direcții privind implementarea și lansarea și a desfășurat un atelier de formare de trei zile pentru a instrui echipa Migros. Richard Huber, manager și membru al consiliului executiv la Realstuff, a comentat după implementare că avantajele soluției de înaltă disponibilitate SIOS au fost flexibilitatea, fiabilitatea, ușurința de utilizare și asigurarea că datele sunt menținute sincronizate în orice moment.

Astăzi, Migros și-a îndeplinit cerințele pentru HA cu ajutorul soluției SIOS ușor de utilizat, care oferă o monitorizare continuă a serverelor, a spațiilor de stocare, a aplicațiilor, a bazelor de date și a conexiunilor de rețea pentru a detecta punctele de defecțiune, a reduce timpul de nefuncționare, a menține conectivitatea clienților și a oferi acces neîntrerupt la date.

Pentru mai multe informații despre soluțiile SIOS și despre modul în care SIOS vă poate ajuta să obțineți HA într-un mediu SQL Server, puteți citi „Why Clustering for SQL Server High Availability” aici.

Vezi postările recente de pe blog despre disponibilitate.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.