RAIDに関する”あまのじゃく?”的考察

 PC、サーバ、NAS等に採用されるRAID。近ごろでは専門メーカーのみならず、汎用周辺機器メーカーからも売り出されています。RAIDを使う目的はいろいろあります。
(1)データ記憶装置のシステムとしての信頼性を上げ、障害を発生しにくくするため
(2)データ記憶装置が故障したとき、復旧に要する時間を極力短くするため
(3)見かけ上のドライブ(ボリューム)の容量を増やすため
(4)データのアクセス時間を短くするため(OSやアプリの起動を速くするため)
ざっとこんなところだと思われます。
 でも、RAIDの役割について誤った認識を持っていますと、大切なデータを無くしてしまうことがありますので、お気を付け下さい。

・まず、RAIDは万能選手ではありません。実際に中小部署で使われるRAIDは上記の(1)~(4)のすべての機能を備えていることはほとんどありません。小規模(ディスクの構成台数が少ない)なRAIDシステムは、精々いずれか1つの機能を満たす程度です。また、(3)と(4)は、RAIDの本来の機能ではありません。構成台数の多いシステムで副次的に付く機能です。特に「RAIDでアクセスが速くなる」というのは幻想です。導入コストあるいは信頼性のいずれかが犠牲になります。期待すべきではありません。覚悟なしにRAID0を単独で使うべきではありません。
RAIDの本来の目的は、1台のハードディスクで済むようなシステムを、2台、3台、4台・・・の構成にすることによって、もしハードディスクが1台壊れたとしても、「残りのハードディスクが支え合って、壊れてしまったHDDの機能を補完して一時しのぎで運転を続ける」ことです。自動車で言えば、タイヤのパンクの後に自動的にスペアタイヤに切り替えて走っているようなものです。RAIDを導入されている方は、ハードディスクが故障していないかどうか毎日確認し、もし故障HDDがあれば速やかに、取扱説明書に書かれた手順通りにHDD交換及びリビルドを行って、一時しのぎの状態から回復してやってください。RAID装置の表示ランプの表示がいつもと違うときは直ちに調査が必要です。
電源だけ入っていてモニターさえもつながっていない放置してあるサーバーは有りませんか?前任者がいなくなってそのままになっているようなサーバーはありませんか?RAIDが組んであるハードディスクが知らないうちに故障しているかもしれません。
システムに故障したハードディスクを含んでいる時には、残りのハードディスクが、普段の業務に加え故障したHDDのフォローをして支えているわけですから、速やかにそのしんどい業務から解放してやってください。残りのHDDが支えきれなくなったら、システムの復旧ができなくなることがあります(2台構成のRAID1や、RAID5では、支えているHDDのうちの1台が故障した時点でお仕舞いになります)。なおホットスペアが実装されているシステムであれば、故障ディスクを交換したうえで次回起こりうる故障に備える操作をしてください。作業は早いに越したことはありません。RAIDに使用するハードディスクは同一機種、同一ロットである場合が多く、立て続けに故障することもあります。速やかにリビルドを行わないと、たちまち次のHDDも故障してシステムの復旧ができなくなります。実際そういった事例が多いです。
・RAIDは、システムの信頼性を高めるために用いられますが、バックアップの代替になると考えるべきではありません。上記のように、RAIDに使用しているHDDが立て続けに故障してリビルドに失敗する事例が結構あるのがその理由の一つ、もう一つは、RAIDは、データの誤消去やウイルス感染から保護しないからです。
バックアップは、別の記憶装置(磁気テープなり、光学ディスクなり、HDDなり)に行ってください。また誤消去やウイルス感染時にも対応できるよう世代管理をお勧めします(たとえば1週間毎フルバックアップ+1日1回増分バックアップ、これを4セット先入先出しで保存)。
・RAIDのシステムには、バッテリーまたは無停電電源/UPS の設置は必須です。バッテリーが劣化していないか時々確認して定期的に交換することも重要です。RAIDでは、データの読み書きを複雑な方法で行っておりますので、電源状態が不安定だと正しくデータが書き込みが出来なくなり信頼性が低下します。
・RAIDシステムは、パソコン、ワークステーション、サーバーに実装する場合、専用のインタフェースボードを使うか、マザーボード回路の機能を使うことが多いと思います(外付け機器やNASの場合は、内蔵回路が使われています)。RAIDを使うときは、これらのハードウエアが故障したときのことを考えておく必要があると思います。ハードディスクよりもRAIDコントローラが先に壊れたなんて笑い話もあります。RAIDシステムを組む時には、それらのハードウエアが壊れた時に、代替手段を容易に入手できるかどうかも考慮して機器の選定をしましょう。
・RAIDシステムは、意外に手間を要する機器です。日々の点検を怠らないこと、万一の際メンテナンスが速やかにできるよう取扱い説明書はすぐ取り出せる場所に仕舞うこと、メンテナンスの知識のある人を呼び出しやすい体制を整えておくこと、が必要です。知識のない人が誤操作を行うと、あっという間にデータがすべてダメになってしまいます。知識のある人でも慎重な操作が必要です。
・このように、RAIDシステムは面倒な機器であるため、万一の時の停止時間を最小限にする必要があるとか、膨大な容量のデータを管理する必要がある環境でない限り、RAIDシステムが必ず必要かどうか疑問です。ハードディスクが壊れた時のデータ損失が心配でしたらむしろバックアップをしっかり行うことが必要ではないかと思われます。またそのバックアップシステムもいつかは劣化故障しますから、日頃の点検を怠りなく。万一のときに元に戻せなかった、ということのないように、時々元に戻せるか確認することも必要だと思います。大切なデータですから。

SSDに関する”あまのじゃく?”的考察

 SSDは、ハードディスクドライブ(HDD)と同様、パソコンの電源を消した状態でもパソコンのデータを記憶しておける装置(補助記憶装置)の一つです。HDDが記憶媒体として磁性体の円盤を使用しているのに対し、SSDはフラッシュメモリを用いております。SSDはHDDと比べて高価でありましたが、最近低価格化が進み、120GBタイプが1万円を切る価格のものも出てきております。
 SSDの特徴は(現時点においてHDDに比べて)
(1)データの読み出し/書込みが速い
(2)静か
(3)消費電力が低い
(4)機械的故障は無い
といわれます。
・HDDは、円盤内の目的のデータが書き込まれている位置までヘッドを移動してデータの読み書きを行うため、SSDより遅いです。
・SSDは、HDDのように円盤を回転させたり、ヘッドを動かしたりすることがないため、静かで省電力です。また機械的に動かす部分が無い為、機械的故障 は有りません。温度によって円盤やヘッドが歪んだり、湿気によって円盤の特性が低下するなどということはSSDでは有りません。

 しかし、機械的故障は無いけれども、故障そのものは有ります。しかも故障した場合のデータ復旧は非常に困難なことが多いと考えられます。SSDに機械的部分が無いということは、基板と電子部品と配線でほぼ完結しているということ。故障するとすれば基板パターンの劣化或いは電子部品の故障になります。故障個所が記憶素子の場合にはデータ復旧は無理ということになります。またHDDと比べて、前触れもなく突発的に故障することが多いようです。SSDの歴史はHDDと比べて浅いこともあり、メーカー、機種、ロット間の品質のばらつきについても否定できないと思います。要するに「当たり外れを覚悟しなければならない」ということです。

 またSSDは、USBメモリ同様書込み回数の制限があります。書込み消去を繰り返すことにより、使えなくなるセクタが増えます。これははっきりしています。

 巷では「SSDは故障が少ない」という宣伝を見かけますが、HDD故障原因の一面と比較してのことで、現時点において、実際にその通りかどうかは疑問が残ります。「壊れにくさ」という観点でSSDを選択するのは必ずしも賢明とは言えないと思います。HDDであれ、SSDであれ、バックアップは書くことができないものであります。

 またSSDは、未使用のセクタにデータを書き込む速度に比べ、一度使用されたセクタへのデータの書き込み速度は低下することに注意が必要です。データ書込み消去を繰り返すと、だんだん遅くなってきます。Trim、SecureErase、Deflag(SSDの特性を考慮したアルゴリズムによる) などの対策を、周期的に講じる必要が有ると思われます。

 現時点では、
・大容量のデータを扱いたい・・・HDD
・ノートPCのバッテリーを長持ちさせたい・・・SSD
・静かさを追求したい・・・SSD 
・更新頻度の高いデータを扱う・・・HDD
・読み出しの多いデータを扱う・・・SSD
・装置の温度上昇を抑えたい・・・SSD