近頃版/another blog@hatena/Wiki/BBS
< 仕事 | 最近のついカッとなって >
最近不調だった家のLinuxBox by Terminator Tualatinのメンテナンス。
pdumpfsがOS凍らせたりapt-rpmがまともに動いてくれなかったりrpmdbがすげえ勢いで破壊されていたり、ってな具合にHDD上のデータがアレなことになっている例が続いていたので家のLinuxBoxをメンテナンスする必要には迫られていた。しかも外部へのルータとか兼ねてる基幹機が、である。
少し前に代替ディスクを買ってきて別PCにてVine-3.1をインストールの上で旧システムの/etc以下を無理矢理新システムに展開しておく、という準備作業はしていたのだが、仕事が忙しくてまとまった時間が取れないので本番作業が延び延びになっていた。この週末にようやく時間ができたので作業。
_電源を落とし構成を「旧システムHDD+旧バックアップHDD」から「新システムHDD+旧システムHDD」に換装。(安物だけど)リムーバブルフレームにしてあるのでこのへんの作業は楽だ。
さて起動、するんだがなんかおかしい。一応起動はするんだが動かない(failedになる)daemonがいたりする。とりあえず旧システムと新システムの間でdiff取ってみると、新システムのetc以下が化けている。旧システムではないのが怪しい。
しかし止まるわけにはいかないので旧システムから新システムへと/home以下をrsync開始。ときどき「ファイルチェックに失敗したぜ」とかいうメッセージを吐きつつも、わりあい快調に走っているように見えた。が、しばらくしてカーネルがpanicを起こした。
ナニ? と思って画面のダンプ内容を見てみると、メモリ回りのエラーっぽい内容が出ている。以前から出ていたものと同種のもの。てっきり実行バイナリかswapパーティションがどうにかなっていて…と想像していたのだが、更のHDD側のバイナリ、swapをもってしても発生するということは……本当にメモリが悪いのか!
_しかも立上り直後からではなく、ある程度負荷をかけると始めて問題が起こるという症状からして、使用頻度の低い高領域のメモリが疑わしい、ということで電源を落として2本ささっていたSDRAMのうちDIMM1を抜いて再起動、再度rsync…注意メッセージすら吐かずに快調に走る。ビンゴ。
推測するに、旧HDD自体に障害はなく、単にそこに書かれた論理情報がときどき破壊されるという現象が発生していたのだろう。それも比較的高負荷なプロセスが走ったときだけ発生するという形で。
_そこまでわかってしまえば後は対した問題もなし。/etc以下は再度旧システムから新システムにコピー、その他のデータも適当にコピーしてやった。実はsambaが標準でインストールされていなかったとか、perlのあれこれのモジュールがなくなっていたとかの問題もあれったが、その種の話は必要になったら解消されると思うので気にしない。
あとは折を見てディスク構成を「新システムHDD+旧バックアップHDD」にしてやりサルベージ作業、更に「新システムHDD+新バックアップHDD」にして、当面旧システムは保管待機ということにしてやればよかろう。