高可用性とは?

高可用性 (HA) は、単一障害点を排除して、長期間にわたって継続的に運用または稼働できるようにするテクノロジー システムのコンポーネントです。

すべての組織は、データウェアハウス、電子商取引アプリケーション、CRM (Customer Relationship Management System) 、財務システム、サプライチェーン管理およびビジネス インテリジェンス システムなどのビジネスにとって不可欠なデータベースおよびアプリケーションをさまざまに使用しています。 システム、データベース、またはアプリケーションに障害が発生した場合、これらの組織はシステムを稼働させ続け、収益の損失、非生産的な従業員、および顧客の不幸のリスクを最小限に抑えるために高可用性の保護を必要とします。 これにより、単一障害点を排除します。

  • システムに障害が発生した場合、原因に関係なく、アプリケーションレベルの障害を自動的に検出します。
  • システム障害時のデータ損失を最小限に抑えるため、自動的かつ迅速に冗長コンポーネントにフェイルオーバーします。
  • 手動でフェイルオーバーとフェイルバックを行い、計画的なメンテナンス時のダウンタイムを最小にする。
  • TechTarget は HA を「望ましい長さの時間、継続して動作するシステムまたはコンポーネント」と定義しています。 可用性は「100%動作可能」または「絶対に故障しない」という相対的な基準で測定することができる。 しかし、高可用性を簡単な言葉で定義してみましょう。

    高可用性は、システム、データベース、およびアプリケーションが、必要なときに、必要なだけ動作することを保証します。 必要に応じて」というのは、システム、データベース、およびアプリケーションをデータ損失なく適切に動作させることを考慮したものです。 たとえば、e コマース システムのようなミッション クリティカルなアプリケーションでは、4 つの 9(99.99%)の可用性が業界標準と考えられています。 99.99%の可用性があれば、1年間のダウンタイムは52.60分、1日のダウンタイムは8.64秒を超えないと予想されます。 しかし、デスクトップが1台故障した場合など、重要でないアプリケーションやシステムでは、高可用性は9が2つ(99%)となる場合があり、これは年間8.77時間または1日1.44分のダウンタイムに相当する。 許容できるダウンタイムを測定する場合、次のことを考慮することが重要です:

    • 計画外ダウンタイム(例. 高可用性の選択は、アプリケーションがビジネスにとってどれほど重要か、顧客に影響があるか、アプリケーションの実行頻度、影響を受けるユーザーの数、データベースまたはアプリケーションが冗長システムにフェイルオーバーする速さ、許容できるデータ損失量など多くの要因によって決まります。

      高可用性の測定基準。 RTO と RPO

      HA (およびディザスタ リカバリ (DR)) の評価に通常使用される 2 つの指標は、復旧時間目標 (RTO) と復旧ポイント目標 (RPO) です。 オンライン トランザクション処理アプリケーションの RTO は一般に最も低く、ミッション クリティカルなアプリケーションの RTO は数秒であることがよくあります。

    • RPO は、障害が発生したときに許容されるデータ損失の最大量です。 HA の場合、RPO は、すべての障害シナリオでデータ損失がゼロであることを指定するためにゼロであることがよくあります。

    しかし、高可用性と災害復旧をサポートするために達成できる RTO と RPO には違いがあります。 HAでは、冗長化されたコンポーネントがLAN環境上にあるため、データのレプリケーションは同期的に行うことができます。 アクティブデータベースとスタンバイデータベースは同時に更新され、最も厳しいRTOとRPOを満たす完全な自動リアルタイムリカバリを可能にします。 その結果、スタンバイ インスタンスは「ホット」でアクティブ インスタンスと同期しているため、障害発生時にすぐに引き継ぐことができます。

    しかし、災害時にシステム、ソフトウェア、およびデータを復旧するには、冗長コンポーネントがワイド エリア ネットワーク (WAN) 上にあることが必要です。 これは、アクティブなインスタンスから離れた地理的な場所に冗長コンポーネントを配置する必要があるため、重要なことです。 しかしWANでは、スループット性能への悪影響を避けるため、データのレプリケーションは非同期で行われます。 つまり、スタンバイ・インスタンスへのアップデートは、アクティブ・インスタンスへのアップデートより遅れることになり、結果として復旧プロセスに遅れが生じます。 災害が発生することは稀であるため、多少の遅延は許容範囲内であり、(a)可能な限り低いRTOとRPOを達成することがビジネスにとっていかに重要であるか、(b)最高のRTOとRPOを達成するためにどの程度の予算が割り当てられるかによって決まります。

    SIOS による高可用性の実現方法

    SIOS は、SAP、SQL Server、Oracle、および SAN ベースの共有ストレージ構成または SAN レスのローカル データ ストレージ構成で稼働するその他の環境など、さまざまなオペレーティング システム、インフラストラクチャ環境、およびアプリケーションにおける高可用性と障害復旧のニーズを満たす単一のソリューションとして提供されます。 Windows環境: Windows Server Failover Cluster (WSFC) 環境にSIOS DataKeeperを追加すると、共有ストレージクラスタが不可能または実用的でない場合、SANレスクラスタを作成したり、SANベースのWindowsクラスタに災害対策のためのレプリケーションを追加することができます。 高速で効率的なホストベースのレプリケーションは、ローカルおよびリモートのクラスタノードのローカルストレージを同期し、物理、仮想、またはクラウド環境の任意の組み合わせでSANLessクラスタを作成します。 SIOS Protection Suite for Linux は、SIOS LifeKeeper と SIOS DataKeeper を使用し、高可用性フェイルオーバークラスタリング、継続的なアプリケーション監視、データレプリケーション、および設定可能な回復ポリシーを緊密に統合したパッケージ型クラスタリングソフトウェアソリューションで、ビジネスに不可欠なアプリケーションとデータをダウンタイムや災害から保護することが可能です。 SIOS Protection Suiteでは、直接接続型ストレージ、iSCSI、ファイバーチャネルなど、さまざまなストレージデバイスを使用して、SANまたはSANLessクラスタを構築することができます。 SIOS Protection Suite for Linux は、Red Hat Enterprise Linux、SUSE Linux Enterprise Server、CentOS、Oracle Linux など、すべての主要な Linux ディストリビューションをサポートします。

    SIOS ソリューションでは、RPO は常にゼロで、RTO はアプリケーションによって異なりますが、通常は 30 秒から数分のアプリケーションもあります。

    Migros、SIOS高可用性ソリューションによりPOSシステムの重要な事業継続性を達成

    Migrosはスイス最大の小売企業で、最大のスーパーマーケットチェーンであり、10万人以上の従業員を抱える最大の雇用主でもあります。 また、世界でも40本の指に入る大規模小売企業です。 スイスに拠点を置く IT サービス プロバイダーであり SIOS ソリューションの販売代理店でもある Realstuff Informatik AG と提携し、Migros は POS (Point of Sale) システムを、より効率的に運用できダウンタイムの脅威を最小化できる新しいプラットフォームへの置き換えを検討していました。

    新しい POS システムにより Migros の 650 店舗で価格と商品の品揃え情報を提供しており、小売業者は日々の販売をサポートする高可用性を必要とするソリューションがありました。 HAシステムなしでは、システム障害が発生した場合、従業員は商品の価格設定や商品の計量ができず、業務が停止してしまいます。 選択肢を検討した結果、Migros は高可用性と継続的なデータ保護を提供し、仮想環境に依存せず、社内の IT スタッフが運用できるオープンソースのサーバー環境を希望することにしました。 これらの要件に対処するため、チームは POS データを保護するためのレプリケーションに SIOS Protection Suite for Linux を選択しました。

    システム設計、顧客トレーニング、および母国語サポートについて、リアルスタッフテクノロジーは、ドイツのドレスデンに拠点を置き、コンピュータコンセプトが運営する SIOS Competence and Support Center for Central and Eastern Europe とパートナーシップを組んだそうです。 Migros にとって、コンピテンス&サポートセンターから地域のオフィス時間中に 24x7x365 のサポートを受けることは重要でした。

    Realstuff は POS サーバーを常に監視しデータを複製するために SIOS Protection Suite ハイアベイラビリティ ソリューションを導入しました。 各店舗では、継続的にデータを保護するために2台のサーバーが使用されています。 1台のサーバーに障害が発生した場合、2台目のインスタンスが瞬時に作業を引き継ぎます。 さらに、両サーバーは監視システム上でデータ資産をミラーリングしています。 Migrosのケーススタディの全文はこちら

    最後に

    地域のコンピテンス&サポートセンターは、導入と立ち上げに関する洞察と指示を提供するためにリアルスタッフに相談し、Migrosチームを訓練するために3日間のトレーニングワークショップを実施した。 Realstuff社のマネージャー兼執行役員であるRichard Huber氏は、導入後のコメントとして、SIOS高可用性ソリューションの利点は、柔軟性、信頼性、使いやすさ、そしてデータが常に同期していることを保証してくれることであると述べています。

    今日、Migrosは、サーバー、ストレージ、アプリケーション、データベース、ネットワーク接続を継続的に監視し、障害点を検出、ダウンタイムを短縮、クライアント接続を維持し、中断のないデータアクセスを提供するSIOSの使いやすいソリューションでHAの要件を満たした。

    SIOSソリューションの詳細と、SIOSがSQL Server環境におけるHAの実現にどのように役立つかについては、こちらの「SQL Serverの高可用性をクラスタリングする理由」をご覧ください。

    可用性に関する最近のブログ記事もご覧ください。

    コメントを残す

    メールアドレスが公開されることはありません。