RAIDに関する”あまのじゃく?”的考察

 PC、サーバ、NAS等に採用されるRAID。近ごろでは専門メーカーのみならず、汎用周辺機器メーカーからも売り出されています。RAIDを使う目的はいろいろあります。
(1)データ記憶装置のシステムとしての信頼性を上げ、障害を発生しにくくするため
(2)データ記憶装置が故障したとき、復旧に要する時間を極力短くするため
(3)見かけ上のドライブ(ボリューム)の容量を増やすため
(4)データのアクセス時間を短くするため(OSやアプリの起動を速くするため)
ざっとこんなところだと思われます。
 でも、RAIDの役割について誤った認識を持っていますと、大切なデータを無くしてしまうことがありますので、お気を付け下さい。

・まず、RAIDは万能選手ではありません。実際に中小部署で使われるRAIDは上記の(1)~(4)のすべての機能を備えていることはほとんどありません。小規模(ディスクの構成台数が少ない)なRAIDシステムは、精々いずれか1つの機能を満たす程度です。また、(3)と(4)は、RAIDの本来の機能ではありません。構成台数の多いシステムで副次的に付く機能です。特に「RAIDでアクセスが速くなる」というのは幻想です。導入コストあるいは信頼性のいずれかが犠牲になります。期待すべきではありません。覚悟なしにRAID0を単独で使うべきではありません。
RAIDの本来の目的は、1台のハードディスクで済むようなシステムを、2台、3台、4台・・・の構成にすることによって、もしハードディスクが1台壊れたとしても、「残りのハードディスクが支え合って、壊れてしまったHDDの機能を補完して一時しのぎで運転を続ける」ことです。自動車で言えば、タイヤのパンクの後に自動的にスペアタイヤに切り替えて走っているようなものです。RAIDを導入されている方は、ハードディスクが故障していないかどうか毎日確認し、もし故障HDDがあれば速やかに、取扱説明書に書かれた手順通りにHDD交換及びリビルドを行って、一時しのぎの状態から回復してやってください。RAID装置の表示ランプの表示がいつもと違うときは直ちに調査が必要です。
電源だけ入っていてモニターさえもつながっていない放置してあるサーバーは有りませんか?前任者がいなくなってそのままになっているようなサーバーはありませんか?RAIDが組んであるハードディスクが知らないうちに故障しているかもしれません。
システムに故障したハードディスクを含んでいる時には、残りのハードディスクが、普段の業務に加え故障したHDDのフォローをして支えているわけですから、速やかにそのしんどい業務から解放してやってください。残りのHDDが支えきれなくなったら、システムの復旧ができなくなることがあります(2台構成のRAID1や、RAID5では、支えているHDDのうちの1台が故障した時点でお仕舞いになります)。なおホットスペアが実装されているシステムであれば、故障ディスクを交換したうえで次回起こりうる故障に備える操作をしてください。作業は早いに越したことはありません。RAIDに使用するハードディスクは同一機種、同一ロットである場合が多く、立て続けに故障することもあります。速やかにリビルドを行わないと、たちまち次のHDDも故障してシステムの復旧ができなくなります。実際そういった事例が多いです。
・RAIDは、システムの信頼性を高めるために用いられますが、バックアップの代替になると考えるべきではありません。上記のように、RAIDに使用しているHDDが立て続けに故障してリビルドに失敗する事例が結構あるのがその理由の一つ、もう一つは、RAIDは、データの誤消去やウイルス感染から保護しないからです。
バックアップは、別の記憶装置(磁気テープなり、光学ディスクなり、HDDなり)に行ってください。また誤消去やウイルス感染時にも対応できるよう世代管理をお勧めします(たとえば1週間毎フルバックアップ+1日1回増分バックアップ、これを4セット先入先出しで保存)。
・RAIDのシステムには、バッテリーまたは無停電電源/UPS の設置は必須です。バッテリーが劣化していないか時々確認して定期的に交換することも重要です。RAIDでは、データの読み書きを複雑な方法で行っておりますので、電源状態が不安定だと正しくデータが書き込みが出来なくなり信頼性が低下します。
・RAIDシステムは、パソコン、ワークステーション、サーバーに実装する場合、専用のインタフェースボードを使うか、マザーボード回路の機能を使うことが多いと思います(外付け機器やNASの場合は、内蔵回路が使われています)。RAIDを使うときは、これらのハードウエアが故障したときのことを考えておく必要があると思います。ハードディスクよりもRAIDコントローラが先に壊れたなんて笑い話もあります。RAIDシステムを組む時には、それらのハードウエアが壊れた時に、代替手段を容易に入手できるかどうかも考慮して機器の選定をしましょう。
・RAIDシステムは、意外に手間を要する機器です。日々の点検を怠らないこと、万一の際メンテナンスが速やかにできるよう取扱い説明書はすぐ取り出せる場所に仕舞うこと、メンテナンスの知識のある人を呼び出しやすい体制を整えておくこと、が必要です。知識のない人が誤操作を行うと、あっという間にデータがすべてダメになってしまいます。知識のある人でも慎重な操作が必要です。
・このように、RAIDシステムは面倒な機器であるため、万一の時の停止時間を最小限にする必要があるとか、膨大な容量のデータを管理する必要がある環境でない限り、RAIDシステムが必ず必要かどうか疑問です。ハードディスクが壊れた時のデータ損失が心配でしたらむしろバックアップをしっかり行うことが必要ではないかと思われます。またそのバックアップシステムもいつかは劣化故障しますから、日頃の点検を怠りなく。万一のときに元に戻せなかった、ということのないように、時々元に戻せるか確認することも必要だと思います。大切なデータですから。