ripjyr's blog

可用性を高める「サーバー多重化」（後編）：ITpro

IT セキュリティ

多重化サーバというのが最近進歩しているらしいです。

やっぱり、クラスタやコールドスタンバイを思いつきますが、多重化サーバ（FTかな？）も進んでるんですねぇ。

99.999％以上（年間平均停止時間5分以下）の可用性を目指すときは，サーバー全体の多重化を検討する。ハードウエアに加えて，ソフトウエアの障害に対応するときも，サーバー全体の多重化が不可欠である（図1）。
このうち進歩が目立つのは，多重化サーバーだ。基本的に2台分の部品が同期して動作する仕組みになっており，どの部品が故障してもサーバーは稼働を続ける。ハード障害ならサービス停止時間はゼロか数秒とほとんど無視できるくらい短い。多重化サーバーでは，全く同じ処理を複数の系統で実行している。障害時は部品を切り離すだけだからだ。

そして、三重化ですか・・・・すげぇなぁ、世の中は

三重化では演算ミスを検出可能

可用性をさらに上げていくときには，三重化されたサーバーを検討する。三重化なら同じ機能の部品が二つ壊れても稼働を続けられる。
さらに三重化には多数決方式でエラーを訂正できるという利点がある。二重化は，2系統ある部品のうち一つが機能しない障害には対処できるが，各系統が異なる演算結果を出す障害のときは処理をやり直すしかない。
HP Integrity NonStopサーバではプロセッサ・モジュールを三重化できる（図3）。このとき，同じ演算を3系統で処理して，2系統の結果が一致すれば，それを正しいと見なす。「三つとも異なる結果になるのは天文学的に少ない確率になる」（日本HP）。同サーバーはOSにも独自の工夫が盛り込まれており，三重化の場合，99.99999％以上（年間平均停止時間3秒以下）の可用性を実現できるとしている。