本当にあった怖いお話

社内にあったRAIDがいきなり動かなくなりました! 数日前にあった体験談をご紹介します。

pixta_1768338_S

 

最近では社内にデータサーバーを置かず、クラウド環境を利用している企業も多くなって来ています。とは言え、コールドデータ(ほとんど使用又はアクセスされないデータ)などはクラウドに上げず、社内サーバーやNASなどにデータを保存している方も多いことでしょう。

今回は数日前に社内で本当にあった怖いお話を紹介しましょう。

1.事の発端は引越し

事業所を移転する際には大量の書類が出てきます。当社もご多分に漏れず、引越し準備の最中に大量の書類が出てきたため、タイムスタンプや電子署名を必要としない書類については、スキャナーを使って全て電子化する事にしました。全部でファイル容量は数TB。そのほとんどがコールドデータに属するものなのでクラウドに上げることはせず、まずは社内のNASに保存し、バックアップも社内の別のNASに保存しました。この時ふと、以前社内の研究開発データや実験データをアーカイブしてRAIDに保存していたのを思い出し、せっかくなのでこのRAIDにあるデータも全てNASに移してしまおうと考え、久々にRAIDの電源を入れたのですが、HDDが動いている気配がまるでなし。何度電源を入れ直してもうんともすんとも言わないではないですか!

気づかぬ間にRAIDが壊れていたのです。。。

2.大切なデータはどうなった?

第1回目のコラムにも書いていますが、大切なデータを確実に保存するお勧めの方法は、

・『HDD』

・『長期保存用光ディスク』

この二つを併用することです。当社もRAID(HDD)と長期保存用光ディスクの二つにデータを保存していましたので、RAIDが壊れたからと言ってデータ喪失の危機感は全くありませんでした。早速、別地保管していた長期保存用光ディスクを全て取り寄せ、無事にNASにデータを保存することが出来ました。まさに長期保存用光ディスクのお手本のような使い方です!

3.動かなくなった原因は何?

動作しなくなったRAIDにはHDDが2台搭載されており、RAIDレベル1(ミラーリング)で運用していました。RAIDと言えど所詮はHDD、5年以上前に購入したものなので、いつ壊れてもおかしくない状態だったのかも知れませんが、2台のHDDが同時に壊れる確率はかなり低いはずです。となるとHDD以外の箇所が壊れた可能性が高いと思われるので、筐体のカバーを外して中の様子を見てみる事にしました。

RAID_s

筐体カバーを外した状態

 

HDD_s

取り外したHDD

 

 

筐体の中には、以下のものが入っていました。

・スイッチングレギュレーター(電源)

・RAIDコントロール基板

・HDD 2台

もう一度RAIDの電源を入れてHDDが動作していない事を確認後、HDDを取り外してデスクトップPCのDC電源コネクタをHDDに差込んだところ、無事スピンドルモータの回転音がしました(2台共に)。つまりHDDに電源が正しく供給されていなかった事が原因だったようです。壊れた箇所はスイッチングレギュレーターかRAIDコントロール基板という事になります。

 

4.過信は禁物

ハードウェアRAIDの怖いところは今回のような事象です。当社では長期保存用光ディスクにもデータを保存していたので無事でしたが、別々のHDDにミラーリングしているから大丈夫だろうなどとRAIDを過信して、別媒体にデータを保存していないと、とんでもない事になります。悲劇が起きる前に、皆様のデータ保存の状況を今一度ご確認されることをお勧めします。