いやー、サーバーっていつ止まるか分かりませんよ。
なんの支障も無く、何年も安定稼働していたのに、
本日、44(死死)の誕生日当日に突然アクセス不能に。
SSHもアクセスできないので、再起動しかないかなーと思っていたら、突然load averageが下がりだしたので、「うむむ…」と唸りながらtopコマンドの表示するプロセスの様子を見ていたんだが、なんかなー、この「kswapd0」ってのが気になるなーと思ってググったら、ビンゴだったみたいで、メモリ圧迫してスワップした結果CPUに負荷がかかってどーのこーのと書いてあります。
【続】フリーズの原因は”kswapd0″と共有メモリだった話
助かりました、ありがとうございます。
で、
負荷が落ちてきてSSH出来るようになった所で、すかさず
echo 3 > /proc/sys/vm/drop_caches
で、何とか解消。
まぁこうやって書くと、チャチャッと数分で終わったみたいな感じですが、実際は調査も含め、
2時間ほどかかってます。
ほんと、新規サービスでコストを削減したいのはわかるけど、
出す所には出さないと、不測の事態で痛い目にあっても知らないよーって話でした。