Qu’est-ce que la haute disponibilité ?

La haute disponibilité (HA) est un composant d’un système technologique qui élimine les points uniques de défaillance pour assurer un fonctionnement continu ou un temps de disponibilité pendant une période prolongée.

Toutes les organisations utilisent une variété de bases de données et d’applications critiques pour l’entreprise, telles que les entrepôts de données, les applications de commerce électronique, les systèmes de gestion de la relation client (CRM), les systèmes financiers, la gestion de la chaîne d’approvisionnement et les systèmes de veille stratégique. Lorsqu’un système, une base de données ou une application tombe en panne, ces organisations ont besoin d’une protection à haute disponibilité pour que les systèmes restent opérationnels et minimisent le risque de perte de revenus, d’employés improductifs et de clients mécontents.

Les systèmes à haute disponibilité intègrent cinq principes de conception :

  • Ils basculent automatiquement vers un système redondant pour reprendre une opération lorsqu’un composant actif tombe en panne. Cela élimine les points de défaillance uniques.
  • Ils peuvent détecter automatiquement les défaillances au niveau des applications lorsqu’elles se produisent, quelles qu’en soient les causes.
  • Ils garantissent une perte de données sans quantité lors d’une défaillance du système.
  • Ils basculent automatiquement et rapidement vers des composants redondants pour minimiser les temps d’arrêt.
  • Elles offrent la possibilité de basculer et de revenir manuellement en arrière afin de minimiser les temps d’arrêt pendant la maintenance planifiée.

TechTarget définit HA comme « un système ou un composant qui est opérationnel en continu pendant une durée souhaitable. La disponibilité peut être mesurée par rapport à  » 100 % opérationnel  » ou  » jamais défaillant « . Une norme de disponibilité largement répandue mais difficile à atteindre pour un système ou un produit est connue sous le nom de disponibilité ‘cinq 9’ (99,999 %). »

Mais définissons la haute disponibilité en termes simples :

La haute disponibilité garantit que vos systèmes, bases de données et applications fonctionnent quand et selon les besoins.

Le « quand » prend en compte le pourcentage de temps pendant lequel l’application doit être opérationnelle. Le « au besoin » prend en considération le bon fonctionnement du système, de la base de données et/ou des applications sans perte de données.

Selon le système et/ou l’application, la haute disponibilité sera différente. Par exemple, avec les applications critiques, comme vos systèmes de commerce électronique, la disponibilité de quatre 9 (99,99 %) est considérée comme une norme industrielle. Avec une disponibilité de 99,99 %, vous ne pouvez pas vous attendre à plus de 52,60 minutes d’interruption par an ou 8,64 secondes d’interruption par jour. Cependant, pour les applications et les systèmes non critiques, comme la défaillance d’un seul ordinateur, la haute disponibilité peut être de deux 9 (99 %), ce qui équivaut à 8,77 heures d’interruption par an ou 1,44 minute d’interruption par jour. Lorsque vous mesurez le temps d’arrêt acceptable, il est important que vous preniez en compte :

  • Le temps d’arrêt non planifié (par ex, pannes matérielles ou logicielles)
  • Le temps d’arrêt planifié nécessaire pour la maintenance matérielle et logicielle de routine
  • Le temps d’arrêt au niveau de la base de données et de l’application

Votre choix pour la haute disponibilité dépend de nombreux facteurs, notamment le degré de criticité des applications pour l’entreprise, l’impact éventuel sur les clients, la fréquence d’exécution des applications, le nombre d’utilisateurs concernés, la rapidité avec laquelle une base de données ou une application doit basculer vers le système redondant et le niveau de perte de données tolérable.

Métriques de haute disponibilité : RTO et RPO

Les deux métriques normalement utilisées pour évaluer la HA (et la reprise après sinistre (DR) également) sont le Recovery Time Objective (RTO) et le Recovery Point Objective (RPO).

  • RTO est la durée maximale tolérable de toute panne. Les applications de traitement des transactions en ligne ont généralement les RTO les plus bas, et celles qui sont critiques ont souvent un RTO de quelques secondes seulement.
  • RPO est la quantité maximale de perte de données qui peut être tolérée lorsqu’une panne se produit. Pour HA, le RPO est souvent égal à zéro pour spécifier qu’il doit y avoir zéro perte de données dans tous les scénarios de défaillance.

Cependant, il existe une différence entre les RTO et RPO que vous pouvez atteindre pour prendre en charge la haute disponibilité par rapport à la reprise après sinistre. Avec HA, la réplication des données peut être synchrone car vos composants redondants sont sur votre environnement LAN. Les bases de données actives et de secours peuvent être mises à jour simultanément, ce qui permet des restaurations complètes, automatiques et en temps réel qui peuvent satisfaire les RTO et RPO les plus exigeants. Par conséquent, votre instance de secours est  » chaude  » et synchronisée avec votre instance active, de sorte qu’elle est prête à prendre immédiatement le relais en cas de panne.

Cependant, pour récupérer les systèmes, les logiciels et les données en cas de sinistre, il faut que les composants redondants soient sur un réseau étendu (WAN). Ceci est important car vous devez garder les composants redondants dans un emplacement géographique éloigné de l’instance active. Mais avec un WAN, la réplication des données est asynchrone pour éviter d’avoir un impact négatif sur les performances du débit. Cela signifie que les mises à jour des instances de secours seront décalées par rapport aux mises à jour de l’instance active, ce qui entraînera un retard dans le processus de récupération. Les catastrophes étant rares, un certain retard peut être tolérable et dépend (a) de l’importance pour votre entreprise d’obtenir le RTO et le RPO les plus bas possibles et (b) du budget que vous pouvez allouer pour obtenir le meilleur RTO et RPO.

Comment SIOS vous aide à atteindre la haute disponibilité

SIOS offre une solution unique pour répondre à la fois aux besoins de haute disponibilité et de reprise après sinistre sur une grande variété de systèmes d’exploitation, d’environnements d’infrastructure et d’applications, notamment SAP, SQL Server, Oracle et d’autres environnements fonctionnant dans des configurations de stockage partagé basées sur un SAN ou des configurations de stockage de données locales sans SAN.

  • Environnement Windows : Lorsqu’il est ajouté à un environnement Windows Server Failover Cluster (WSFC), SIOS DataKeeper vous permet de créer un cluster sans SAN, lorsque les clusters de stockage partagé sont impossibles ou peu pratiques, ou d’ajouter la réplication pour la protection contre les catastrophes dans vos clusters Windows basés sur SAN. La réplication rapide et efficace basée sur l’hôte synchronise le stockage local sur les nœuds de cluster locaux et distants, créant ainsi un cluster SANLess dans n’importe quelle combinaison d’environnements physiques, virtuels ou en nuage.
  • Environnements Linux : SIOS Protection Suite pour Linux est une solution logicielle de clustering packagée qui utilise SIOS LifeKeeper et SIOS DataKeeper pour fournir une combinaison étroitement intégrée de clustering de basculement haute disponibilité, de surveillance continue des applications, de réplication des données et de politiques de récupération configurables afin de protéger vos applications et données critiques des temps d’arrêt et des sinistres. SIOS Protection Suite vous permet de construire des clusters SAN ou SANLess en utilisant une large gamme de périphériques de stockage, y compris le stockage à attachement direct, iSCSI et Fibre Channel. SIOS Protection Suite pour Linux prend en charge toutes les principales distributions Linux, notamment Red Hat Enterprise Linux, SUSE Linux Enterprise Server, CentOS et Oracle Linux.

Avec les solutions SIOS, le RPO est toujours nul et le RTO dépend de l’application mais généralement de 30 secondes à quelques minutes pour certaines applications. Discutons de l’étude de cas « SIOS en action » d’un client de la plus grande entreprise de vente au détail de Suisse.

Migros réalise une continuité d’activité critique de son système POS avec les solutions de haute disponibilité SIOS

Migros est la plus grande entreprise de vente au détail de Suisse, sa plus grande chaîne de supermarchés et le plus grand employeur avec plus de 100 000 employés. C’est également l’un des quarante plus grands détaillants du monde. En s’associant avec Realstuff Informatik AG, un prestataire de services informatiques basé en Suisse et revendeur de solutions SIOS, Migros cherchait à remplacer son système de point de vente (POS) par une nouvelle plateforme plus efficace à exploiter et pouvant minimiser la menace de temps d’arrêt.

Le nouveau système POS fournit des informations sur les prix et l’assortiment de produits dans les 650 magasins de Migros et le détaillant avait besoin d’une solution à haute disponibilité pour soutenir les ventes quotidiennes. Sans un système HA, les employés ne pouvaient pas fixer le prix des produits ou peser les marchandises en cas de panne du système, ce qui paralysait les opérations. Après avoir évalué les options, Migros a décidé qu’elle voulait un environnement de serveur open-source offrant une haute disponibilité et une protection continue des données, indépendant d’un environnement virtuel et pouvant être exploité en interne par le personnel informatique de l’entreprise. Pour répondre à ces exigences, l’équipe a choisi SIOS Protection Suite for Linux pour la réplication afin de sauvegarder les données des points de vente.

Pour la conception du système, la formation des clients et le support dans la langue maternelle, Realstuff s’est associé au centre de compétence et de support SIOS pour l’Europe centrale et orientale, basé à Dresde, en Allemagne, et exploité par Computer Concept. Il était important pour Migros d’obtenir une assistance 24x7x365 pendant le temps de bureau régional de la part du centre de compétence et de soutien.

Realstuff a mis en œuvre la solution de haute disponibilité SIOS Protection Suite pour surveiller constamment les serveurs POS et répliquer les données. À chaque emplacement de magasin, deux serveurs sont utilisés pour assurer une protection continue des données. Si un serveur tombe en panne, la seconde instance prend instantanément le relais. En outre, les deux serveurs reproduisent les données sur le système de surveillance. Lisez l’étude de cas complète de Migros ici.

Pensées finales

Le centre régional de compétence et de soutien a consulté Realstuff pour fournir un aperçu et une orientation sur la mise en œuvre et le lancement et a organisé un atelier de formation de trois jours pour former l’équipe de Migros. Richard Huber, manager et membre de la direction de Realstuff, a commenté après le déploiement que les avantages de la solution de haute disponibilité SIOS étaient sa flexibilité, sa fiabilité, sa facilité d’utilisation et l’assurance que les données restent synchronisées à tout moment.

Aujourd’hui, Migros a répondu à ses exigences en matière de HA avec la solution SIOS facile à utiliser, qui fournit une surveillance continue des serveurs, du stockage, des applications, des bases de données et des connexions réseau pour détecter les points de défaillance, réduire les temps d’arrêt, maintenir la connectivité des clients et fournir un accès ininterrompu aux données.

Pour plus d’informations sur les solutions SIOS et sur la façon dont SIOS peut vous aider à atteindre la HA dans un environnement SQL Server, vous pouvez lire « Pourquoi la mise en cluster pour la haute disponibilité de SQL Server » ici.

Voir les récents articles de blog sur la disponibilité.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.