- Was ist Hochverfügbarkeit?
- Hochverfügbare Systeme basieren auf fünf Konstruktionsprinzipien:
- Hochverfügbarkeit stellt sicher, dass Ihre Systeme, Datenbanken und Anwendungen funktionieren, wenn und wie sie benötigt werden.
- Hochverfügbarkeitsmetriken: RTO und RPO
- Wie SIOS Ihnen hilft, Hochverfügbarkeit zu erreichen
- Migros erreicht kritische Geschäftskontinuität seines POS-Systems mit SIOS-Hochverfügbarkeitslösungen
- Final Thoughts
Was ist Hochverfügbarkeit?
Hochverfügbarkeit (HA) ist eine Komponente eines Technologiesystems, die einzelne Ausfallpunkte eliminiert, um den kontinuierlichen Betrieb oder die Betriebszeit über einen längeren Zeitraum zu gewährleisten.
Alle Unternehmen verwenden eine Vielzahl von geschäftskritischen Datenbanken und Anwendungen, wie z. B. Data Warehouses, E-Commerce-Anwendungen, Customer Relationship Management-Systeme (CRM), Finanzsysteme, Supply Chain Management und Business Intelligence-Systeme. Wenn ein System, eine Datenbank oder eine Anwendung ausfällt, benötigen diese Unternehmen einen Hochverfügbarkeitsschutz, um die Systeme in Betrieb zu halten und das Risiko von Umsatzeinbußen, unproduktiven Mitarbeitern und unzufriedenen Kunden zu minimieren.
Hochverfügbare Systeme basieren auf fünf Konstruktionsprinzipien:
- Sie greifen automatisch auf ein redundantes System zurück, um einen Vorgang fortzusetzen, wenn eine aktive Komponente ausfällt. Dadurch werden Single Points of Failure eliminiert.
- Sie können Ausfälle auf Anwendungsebene automatisch erkennen, sobald sie auftreten, unabhängig von den Ursachen.
- Sie stellen sicher, dass bei einem Systemausfall keine Daten verloren gehen.
- Sie sorgen für ein automatisches und schnelles Failover auf redundante Komponenten, um Ausfallzeiten zu minimieren.
- Sie bieten die Möglichkeit zum manuellen Failover und Failback, um Ausfallzeiten während geplanter Wartungsarbeiten zu minimieren.
TechTarget definiert HA als „ein System oder eine Komponente, das/die über einen wünschenswert langen Zeitraum kontinuierlich betriebsbereit ist. Die Verfügbarkeit kann im Verhältnis zu ‚100 % betriebsbereit‘ oder ’nie ausfallend‘ gemessen werden. Ein weit verbreiteter, aber schwer zu erreichender Verfügbarkeitsstandard für ein System oder Produkt ist die sogenannte ‚five 9s‘-Verfügbarkeit (99,999 %).“
Aber lassen Sie uns Hochverfügbarkeit in einfachen Worten definieren:
Hochverfügbarkeit stellt sicher, dass Ihre Systeme, Datenbanken und Anwendungen funktionieren, wenn und wie sie benötigt werden.
Das „wenn“ berücksichtigt den Prozentsatz der Zeit, in der die Anwendung betriebsbereit sein muss. Das „nach Bedarf“ berücksichtigt den ordnungsgemäßen Betrieb des Systems, der Datenbank und/oder der Anwendungen ohne Datenverlust.
Abhängig vom System und/oder der Anwendung ist die Hochverfügbarkeit unterschiedlich. Bei unternehmenskritischen Anwendungen, wie z. B. Ihren E-Commerce-Systemen, gilt beispielsweise eine Verfügbarkeit von vier 9s (99,99 %) als Industriestandard. Bei einer Verfügbarkeit von 99,99 % können Sie mit höchstens 52,60 Minuten Ausfallzeit pro Jahr oder 8,64 Sekunden Ausfallzeit pro Tag rechnen. Bei nicht kritischen Anwendungen und Systemen, wie z. B. dem Ausfall eines einzelnen Desktops, kann die Hochverfügbarkeit bei zwei 9en (99 %) liegen, was 8,77 Stunden Ausfallzeit pro Jahr oder 1,44 Minuten Ausfallzeit pro Tag entspricht. Bei der Messung akzeptabler Ausfallzeiten ist es wichtig, dass Sie Folgendes berücksichtigen:
- Ungeplante Ausfallzeiten (z. B., Hardware- oder Software-Ausfälle)
- Geplante Ausfallzeiten für routinemäßige Hardware- und Software-Wartung
- Laufzeit auf Datenbank- und Anwendungsebene
Die Entscheidung für Hochverfügbarkeit hängt von vielen Faktoren ab, z. B. davon, wie wichtig die Anwendungen für das Unternehmen sind, ob Kunden betroffen sind, wie oft die Anwendungen laufen, wie viele Benutzer betroffen sind, wie schnell eine Datenbank oder Anwendung auf das redundante System ausfallen muss und wie viel Datenverlust tolerierbar ist.
Hochverfügbarkeitsmetriken: RTO und RPO
Die beiden Metriken, die normalerweise zur Bewertung von HA (und auch Disaster Recovery (DR)) verwendet werden, sind das Recovery Time Objective (RTO) und das Recovery Point Objective (RPO).
- RTO ist die maximal tolerierbare Dauer eines Ausfalls. Online-Transaktionsverarbeitungsanwendungen haben in der Regel die niedrigsten RTOs, und geschäftskritische Anwendungen haben oft eine RTO von nur wenigen Sekunden.
- RPO ist die maximale Menge an Datenverlust, die bei einem Ausfall toleriert werden kann. Bei HA ist das RPO oft gleich Null, um anzugeben, dass es in allen Ausfallszenarien keinen Datenverlust geben sollte.
Es gibt jedoch einen Unterschied zwischen den RTOs und RPOs, die Sie erreichen können, um Hochverfügbarkeit und Disaster Recovery zu unterstützen. Bei HA kann die Datenreplikation synchron erfolgen, da sich die redundanten Komponenten in Ihrer LAN-Umgebung befinden. Aktive und Standby-Datenbanken können gleichzeitig aktualisiert werden, was vollständige, automatische Wiederherstellungen in Echtzeit ermöglicht, die auch die anspruchsvollsten RTOs und RPOs erfüllen können. Dadurch ist Ihre Standby-Instanz „heiß“ und mit der aktiven Instanz synchronisiert, so dass sie im Falle eines Ausfalls sofort einspringen kann.
Die Wiederherstellung von Systemen, Software und Daten im Katastrophenfall erfordert jedoch, dass sich die redundanten Komponenten in einem Weitverkehrsnetz (WAN) befinden. Dies ist wichtig, weil Sie redundante Komponenten an einem von der aktiven Instanz entfernten geografischen Standort aufbewahren müssen. In einem WAN erfolgt die Datenreplikation jedoch asynchron, um die Durchsatzleistung nicht zu beeinträchtigen. Dies bedeutet, dass die Aktualisierungen der Standby-Instanzen den Aktualisierungen der aktiven Instanz hinterherhinken, was zu einer Verzögerung während des Wiederherstellungsprozesses führt. Da Katastrophen selten sind, kann eine gewisse Verzögerung tolerierbar sein und hängt davon ab, (a) wie wichtig es für Ihr Unternehmen ist, eine möglichst niedrige RTO und RPO zu erreichen und (b) wie viel Budget Sie bereitstellen können, um die beste RTO und RPO zu erreichen.
Wie SIOS Ihnen hilft, Hochverfügbarkeit zu erreichen
SIOS bietet eine einzige Lösung, um sowohl Hochverfügbarkeits- als auch Disaster-Recovery-Anforderungen in einer Vielzahl von Betriebssystemen, Infrastrukturumgebungen und Anwendungen zu erfüllen, einschließlich SAP, SQL Server, Oracle und anderen Umgebungen, die in SAN-basierten, gemeinsamen Speicherkonfigurationen oder SAN-losen, lokalen Datenspeicherkonfigurationen ausgeführt werden.
- Windows-Umgebung: Wenn SIOS DataKeeper zu einer Windows Server Failover Cluster (WSFC)-Umgebung hinzugefügt wird, können Sie einen SAN-losen Cluster erstellen, wo Shared-Storage-Cluster nicht möglich oder unpraktisch sind, oder Replikation für den Katastrophenschutz in Ihren SAN-basierten Windows-Clustern hinzufügen. Schnelle, effiziente Host-basierte Replikation synchronisiert lokalen Speicher auf lokalen und entfernten Clusterknoten und schafft so einen SANLess-Cluster in jeder Kombination von physischen, virtuellen oder Cloud-Umgebungen.
- Linux-Umgebungen: SIOS Protection Suite für Linux ist eine Clustering-Softwarelösung, die SIOS LifeKeeper und SIOS DataKeeper verwendet, um eine eng integrierte Kombination aus Hochverfügbarkeits-Failover-Clustering, kontinuierlicher Anwendungsüberwachung, Datenreplikation und konfigurierbaren Wiederherstellungsrichtlinien zu bieten, um Ihre geschäftskritischen Anwendungen und Daten vor Ausfallzeiten und Katastrophen zu schützen. SIOS Protection Suite ermöglicht den Aufbau von SAN- oder SANLess-Clustern mit einer breiten Palette von Speichergeräten, einschließlich Direct-Attached Storage, iSCSI und Fibre Channel. SIOS Protection Suite für Linux unterstützt alle wichtigen Linux-Distributionen, einschließlich Red Hat Enterprise Linux, SUSE Linux Enterprise Server, CentOS und Oracle Linux.
Mit SIOS-Lösungen ist das RPO immer gleich Null und das RTO hängt von der Anwendung ab, beträgt aber bei einigen Anwendungen typischerweise 30 Sekunden bis wenige Minuten. Lassen Sie uns die Fallstudie „SIOS in Aktion“ eines Kunden beim größten Einzelhandelsunternehmen der Schweiz besprechen.
Migros erreicht kritische Geschäftskontinuität seines POS-Systems mit SIOS-Hochverfügbarkeitslösungen
Migros ist das größte Einzelhandelsunternehmen der Schweiz, die größte Supermarktkette und der größte Arbeitgeber mit mehr als 100.000 Mitarbeitern. Zudem gehört sie zu den vierzig größten Einzelhändlern der Welt. In Zusammenarbeit mit Realstuff Informatik AG, einem in der Schweiz ansässigen IT-Dienstleister und Wiederverkäufer von SIOS-Lösungen, wollte Migros sein Point of Sale (POS)-System durch eine neue Plattform ersetzen, die effizienter zu betreiben ist und die Gefahr von Ausfallzeiten minimieren kann.
Das neue POS-System liefert Preis- und Sortimentsinformationen in den 650 Migros-Filialen, und der Einzelhändler benötigte eine Hochverfügbarkeitslösung zur Unterstützung des täglichen Verkaufs. Ohne ein HA-System konnten die Mitarbeiter bei einem Systemausfall keine Preise ermitteln oder Waren wiegen, was den Betrieb zum Erliegen gebracht hätte. Nach einer Evaluierung der Optionen entschied sich die Migros für eine Open-Source-Serverumgebung, die Hochverfügbarkeit und kontinuierlichen Datenschutz bietet, unabhängig von einer virtuellen Umgebung ist und intern von den IT-Mitarbeitern des Unternehmens betrieben werden kann. Um diese Anforderungen zu erfüllen, entschied sich das Team für die SIOS Protection Suite für Linux zur Replikation der Kassendaten.
Für das Systemdesign, die Kundenschulung und den muttersprachlichen Support arbeitete Realstuff mit dem SIOS Kompetenz- und Supportzentrum für Mittel- und Osteuropa zusammen, das in Dresden, Deutschland, ansässig ist und von Computer Concept betrieben wird. Für die Migros war es wichtig, während der regionalen Geschäftszeiten 24x7x365 Unterstützung durch das Competence und Support Center zu erhalten.
Realstuff implementierte die Hochverfügbarkeitslösung SIOS Protection Suite, um die POS-Server ständig zu überwachen und Daten zu replizieren. An jedem Filialstandort werden zwei Server eingesetzt, um eine kontinuierliche Datensicherung zu gewährleisten. Fällt ein Server aus, übernimmt die zweite Instanz sofort die Arbeit. Darüber hinaus spiegeln beide Server die Datenbestände auf dem Überwachungssystem. Lesen Sie hier die vollständige Migros-Fallstudie.
Final Thoughts
Das regionale Kompetenz- und Supportzentrum hat Realstuff bei der Implementierung und Einführung beraten und einen dreitägigen Workshop zur Schulung des Migros-Teams durchgeführt. Richard Huber, Manager und Mitglied der Geschäftsleitung bei Realstuff, kommentierte nach der Einführung, dass die Vorteile der SIOS-Hochverfügbarkeitslösung in der Flexibilität, der Zuverlässigkeit, der Benutzerfreundlichkeit und der Sicherheit, dass die Daten jederzeit synchronisiert sind, liegen.
Heute hat die Migros ihre Anforderungen an HA mit der einfach zu bedienenden Lösung von SIOS erfüllt, die eine kontinuierliche Überwachung von Servern, Speichern, Anwendungen, Datenbanken und Netzwerkverbindungen bietet, um Fehlerpunkte zu erkennen, Ausfallzeiten zu reduzieren, die Client-Konnektivität aufrechtzuerhalten und einen ununterbrochenen Datenzugriff zu gewährleisten.
Weitere Informationen über SIOS-Lösungen und wie SIOS Ihnen helfen kann, HA in einer SQL Server-Umgebung zu erreichen, können Sie hier lesen: „Warum Clustering für SQL Server Hochverfügbarkeit“.
Siehe aktuelle Blogbeiträge über Verfügbarkeit.