サービスレベル契約と災害復旧 - TechRepublic

サービスレベル契約と災害復旧 - TechRepublic

トピック — プロジェクト管理

出版

ミケタロンの画像

災害復旧操作のサービス レベル契約を作成するときは、必ずユーザーの期待を管理してください。


災害対策計画において、おそらく最初に取り組むべき難しい側面の一つであり、
計画に含まれる他のすべての要素を決定づけるものは
、ユーザーと交渉するサービスレベル契約(SLA)です。SLAとは、
基本的に、緊急時にシステムをどれくらいの時間利用不可にするかをエンドユーザーと約束するものです
。SLAは、目標復旧時間(RTO)と目標復旧時点(RPO)で構成されており、 エンドユーザーの視点や偏見に
大きく左右されることが多く、 技術的なレベルでの対応が非常に難しい概念となっています。

RPO は、災害によって失われる可能性のあるデータ量の指標です
。例えば、1 日に 1 回テープ バックアップを使用している場合、
最悪のタイミングで災害が発生した場合でも、RPO は 1 日分のデータしか失われません。RTO は、
災害発生時にシステムがオフラインになっても許容される時間の長さの指標です。この例としては 、レプリケーションおよびフェイルオーバー ソリューションを使用して
スタンバイ システムをオンラインに戻すのにかかる時間があります。これら 2 つの指標 を活用することで、エンドユーザーに提示できる測定可能な SLA を作成し 、システムがいつオンラインに戻るのか、そして プロセス完了時にどのような状態になるのかを伝えることができます。ただし、エンドユーザーが DR システム に何を期待しているかを把握していなければ、これらの指標だけでは役に立ちません。





エンドユーザーの要件は諸刃の剣です。一方では、システムをオンラインに復旧させるまでの時間
を決定する際に、明確なガイドラインを提供してくれます
。他方では、エンドユーザーは
データ損失ゼロと即時フェイルオーバーという要求を非現実的に捉えがちです
。こうした要求はごく一部のケースでしか実現できませんが、大多数のデータシステムは、オペレーティングシステム、データシステムの構造、あるいは これらの操作を実行するために必要な ツールの性質 上、
こうしたフェイルオーバーの「要件」を満たすことは不可能です。


もちろん、SLAの
議論には予算も関係してきます。RTOとRPOがゼロロスに近づくほど、
ソリューション全体のコストは高くなります。コストカーブの計算方法上、 RTOまたはRPO
のいずれかが平均許容値を大幅に下回ると、
必要な資金が天文学的な額に跳ね上がる可能性があります。エンドユーザーは予算を確認すると
、SLA要件を大幅に見直すことが多く、 DR計画の
選択肢が広がります。


SLAは、緊急時に何が起こるか、そしてどれくらい早くオンラインに復旧できるかをエンドユーザーに正確に伝える優れた手段となります
。エンドユーザーを最初から関与させ、予算
とテクノロジーについて教育し、常に情報提供し続けることは、
有効なSLAを作成するために不可欠です。DR計画はこれらのエンドユーザーの利益のために行われるものであり、SLAはエンドユーザーの期待を現実的に設定し、 計画プロセス
における役割を定義することができます。

あなたの組織は緊急事態にどれだけうまく対処できますか?毎週火曜日に配信される無料の災害復旧ニュースレターに自動的に登録して、次の大災害に備えましょう。

記事をシェア
ミケタロンの画像

ミケタロン

Tagged: