2013/6/22 土曜日

6月16日からのサーバ障害について

Filed under: HP関係,お知らせ,メンテナンス — GRN @ 0:04:36  

6月16日から起こっているサーバ障害についてですが、一部復旧しましたが現在もまだ続いています。

 

一時、OSのが立ち上がらない状態になっていましたが、今は問題がないため、原因はHDDにあると考えています。
HDDテストで通常200Mbyt/sほどの読み込み速度があるのですが、障害時は、4kbyte/sしか出ていなくて、いろいろな機能が停止していました。

サーバはRAID1+0を組んでいるのですが、どうもそのうち1つのHDDが完全に壊れず、壊れ変えており、沢山の読み込みがあると急激に落ちるようです。

完全に壊れていれば、RAIDの機能でこんな状態にはならなかったはず。

復旧操作時にも、HDDの読み込みが極端に遅くなることがあり、HDDかRAIDのコントローラが原因っぽいです。

ただ、読み込み量がすくないとこれまでと同じようなHDDの読み込み速度がでるため、HDDに負荷がかからないように、サイトの機能を制限しています。

とりあえず、サイトの機能を制限すれば完全に落ちずに動いているのですが、このまま放置しておくと、他のHDDが壊れると完全にサーバが沈黙してしまう恐れがあるため、壊れてそうなHDDを新品HDDと交換します。

そのため、RAIDのHDD交換するため、6月22日か23日にHDD交換のメンテを行う予定です。(22日が有力)

サーバが一時停止しますが、よろしくお願い致します。

 

サーバ完全復旧の流れとしては、現在壊れているとおもわれるHDDが原因だった場合、

交換して、RAIDビルドが終われば、完全復旧します。

RAIDビルドは、終わるのに1日~2日かかるのではないかと予想しています。

(仮にRAIDのコントローラであった場合、さらに時間とお金がかかりそうです)

 


TrackBack URI :

1件のコメント »

  1. HDDに関して興味深いサイトがありましたので、何かの参考になれればと。
    ttp://hddbancho.co.jp/deteriorationandmeasuresof_hdd.html

    Comment by とある一般人 — 2013/6/29 土曜日 @ 11:38:21

この投稿へのコメントの RSS フィード。 TrackBack URI

コメントする

  • ブログSEO対策 : track word 
  • SEO 
  •  
  •  
  •  
RSS feed meter for http://blog.guron.net  
39 queries. HTML convert time: 0.214 sec. © 2004-2007 GRN All rights reserved