ダイナミックディスクでエラー発生


はじめに

2013年から現サーバーの運用をしてきたが,ダイナミックディスクのミラーボリュームで「冗長の失敗」となった。もう1台のサーバーは,サーバー内蔵のRAID機能を使用して両者を比較する為,あえて違う機能のRAIDとした経緯がある。起動はダイナミックディスクの方が早いが,扱いが面倒な面があり,どちらも一長一短というところだ。

 

データ修復検討

データ修復の手順はいろいろあると思うが,もう一方のディスクは問題なくアクセスできるので,あまりごちゃごちゃしないで単純に一旦通常フォーマットを実施して再度ダイナミックディスクのミラーボリュームにする方法で復旧することとしたが,フォーマットが途中で終わってフォーマット出来ない現象が発生。
完全にディスクが故障しているようだ。このディスクでの復旧はあきらめて,新ディスクに交換することにした。ダイナミックディスクは2020年にサポート終了しているので,この機会にダイナミックディスクから完全に撤退することにした。ベーシックディスクに戻して,サーバー機能のRAIDを使うこととする。

 

復旧方法

ダイナミックディスクはベーシックディスクに直接戻すことは出来ないので,健全ディスクから一旦USBディスクにバックアップを取ってからベーシックディスクに初期化して,サーバーのRAID機能でミラー設定(RAID1)後にUSBからデータを戻す。その際,システムのCドライブディスクは再インストールか,他のRAIDシステムのディスクからコピーして使用することとなる。ちなみに通常使用のベーシックディスクとRAIDディスクとでは一部のエリア(セグメント)にRAID設定情報が書き込まれている(RAIDシグネチャ)ので互換性がない。ただし,サーバー内蔵のRAIDではデータのみアクセスできるようだが,システムディスクはBOOT不可。

RAID1のディスクを通常のベーシックディスクとして接続して,ディスクの管理画面で見ると,未割り当てパーティションが作成されている。

 

使用HDD

サーバーで使用するハードディスクは導入当初(2013年)からWestern Digital ウエスタンデジタルの「WD Red」シリーズを使用してきたが,9年目にして初めて故障した。24時間365日稼働のHDD8台中最初の1台目の故障で以前使用の別HDDの故障率と比較してもかなり優秀な成績だ。通常5年程度と言われているので偶然なのかもしれないが。
交換HDDも同シリーズの「WD Red Plus」で検討。 コスパは2TBか4TBがいいようだが,
現サーバーで使用可能な最大容量の4TBで決定。
「DISK TO DISK」や「PC TO USB」のコピーは「SSD/HDDスタンド」を使用しており重宝している。
 
  WD Red Plus    SSD/HDDスタンド

 

移行作業

BIOSでRAID1構成後の初期化はOS立ち上げ後に「ServerView RAID Manager」から実施したが終了まで数十時間(表示はMAXの99時間)だったので初期化キャンセルして,OS上からクイックフォーマットした。
サーバー~USB間のコピーはデーター数・量によりかなり時間が掛かる。RAID設定直後はシステムのCドライブ以外のSATA接続データディスクは空の状態なので,プログラムアクセスさせるため,USBディスクにドライブレターD・Eを割り当ててサーバー運用しながらのコピーとなる。USBディスクを使用せずに,直接D・Eドライブにデータを入れたままでもRAID構成が可能のようだが,今回は一旦クリアしてから移行することとした。
dドライブにmysqlのdataフォルダーを移しているので,mysql実行ユーザー network serviceにフルコントロール権限を設定。dドライブのフォルダーに環境変数pathを設定している場合(php,imagick)は設定を確認。これでwordpressは動くはず。他に共有設定していたフォルダーの設定実施。フォルダーのアクセス権限設定は,コピー後も必要。
コピー中は当然外部からのホームページ閲覧時間も遅延して影響を受ける。
コピー完了まで数日(5日)かかるのでのんびり待つことに(放置)する。
コピー完了したら,内部SATA接続のHDDに正規のドライブレターを割り当てて,dドライブのフォルダーに設定したアクセス権設定や共有設定を確認して完了。

 

おわりに

HDDの故障は,今までの経験からやはり夏の暑い時期に多いような気がする。当然か!
サーバー設置場所は自宅なので特に空調も無い非居住空間で,最近では最高気温は40度近くになることもある。暑くなりそうな日にはスポットクーラーを動作させるようにしているが,9年間は故障無く動き続けてくれた。以前は自作のPCをサーバーとしてHDDもPC用を使用していたが,本体は数年で故障していた。HDDに関しては1年持たないときもあった。サーバー専用機に専用HDDの使用は流石に違うな。しかし今回の故障をきっかけにして今後バタバタと逝きそうな気がする。
今回,複数のPCからSERVERに接続して「ServerView RAID Manager」を起動する機会があったが,PCによっては起動しない(画面が表示されない)現象が発生した。「ServerView RAID Manager」はブラウザがIEでのみ動くようでjavaを使用している。表示されなかったPCのjavaを最新にしたが現象は変わらず。対策をネット検索してjavaのキャッシュクリアで表示された。後からわかったが,「ServerView RAID Manager補足情報」にも記載があった。