とある汎用機技術者(メインフレーマー)の障害復旧記録(ログデータセット)

と、仰々しいタイトルにしてみたけど、特に何があるというわけじゃなくて、金曜からの記録と、今思うところをちょっと残しておこうと思っただけです。


まずは、金曜日。
2011/3/11、14:46ころ、もうそろそろ今作ってるドキュメントのレビューでもしようかなぁ、なんて考えているとき、揺れが始まりました。
とはいえ、震度3くらいなら慣れてるし、たいしたこともないだろうと思ってたんですけど、揺れは収まらないし、それどころかだんだんと激しくなり、スライド式のキャビネもがたがたと揺れてました。
一旦収まったところで、部長の指示で近所の公園まで避難。
周囲の会社からも、同じように避難してきた人がたくさんいて、公園は満杯でした。
Twitterなどで情報を集めながら、どうやら大変なことになってると認識。


しばらくして事務所に戻ってからが、本番です。
データセンターに連絡を付けようにも、電話は繋がらない。
顧客に連絡しようにも、電話は繋がらない。
とりあえず、代表して顧客先(歩いて5分かからない)に、情報収集&連絡係として行く人がいたり、どうにかしてデータセンターをはじめとする関係箇所に連絡を付けようと、メール、電話などあらゆる手を尽くしてる人がいたり。
16時くらいになって、ようやく状況が整理され始めて、障害状況の全容が見えてくる。
ここからが、ITエンジニア──メインフレームエンジニアの力の見せ所。
データセンターの保守員によるハードウェアの確認、リモートログインしての障害切り分け。
とりあえず、CPUは落ちてないことが確認できたので、最悪の状況(マシンダウンによるデータの論理不正)だけは免れたことに、ほっと胸を撫で下ろす。
そこからも、通信状況の復旧、周辺システムの再起動、デバイス類の接続確認、OSからの認識確認etc……
ぼくは、次の日を考えて、24:30くらいに、なんとか動き出していた東京メトロで帰宅。


そして、決戦の土曜日(3/12)。
朝、電車が動いていないことも想定していたけど、無事8:00に事務所着。
──朝までがんばっていた組のおかげで、メインフレームの基盤自体は、通常状態にまで復帰。
つまり、ぼくの出番はほぼなし……
決戦とか、がんばっていったけど、特にマシン操作してやることはないという、若干寂しいことに……
となったものの、まだまだ周辺のシステムでは確認取れてないものも多いし、そもそもメインフレームに載ってるシステムは、金曜夕方の状態。
これを、すべて確認とって、金曜の夜間バッチ、土曜日の追いつきをやって、あるべき姿にまで持って来なきゃ行けない!
とりあえず、各システム担当者に連絡を付けて、状態確認を依頼。
それをさらに上の統括に上げたり、そこから流れてきたのをまた担当者に流したり。
まぁ、つまりは電話番して何か来たらまとめて……という、ハブというかルータのようなことをやってたら、いつの間にか主任が顧客先に人質にとられてたりしたけど、メインフレーム基盤には特に問題も出ずに(というより、問題が出なかったからそういうことができてたんだけど)、夜(21:30)時点で、次のシフトに引き継ぎ。


という感じで、気がついてみたらずっとばたばたして、あんまり落ち着いてなかったんだけど、ちらちらワンセグで情報を見たり、ネットのニュースでの呆然とするしかないような東北の被害を目の当たりにして、現実感というものがなかったのが正直なところ。
で、正直、ぼくも結構ハイになってて、テンション上がって、あんまり疲れてる、という感覚がなくて、Twitterでいろいろpostしてたりもしてたし、Twitterで流れてくるみんなの暖かさというか、そういうもので、とにかく、自分のできることを、できる限り、全力でやろう! と、転がるようにまわってました。
合間で東北地方の知人に連絡をとって、なんとか無事であることが確認できて本当にほっとして、泣きそうになったりして。
それでも、泣かなかったのは、なんでなんだろうな?


で、事務所を出て、ZOID行って、唯衣さんとマスターがいて、いつものようにお酒飲んで、安心して帰ってきて、日曜はひたすら休んでて、今日、輪番停電にがくぶるしながら仕事行って、データセンターのある地域の停電が回避された! ということで、体制とってる今日のうちにやって欲しかったなぁ、と不謹慎なことを考えたりしながら、なんとか帰ってきて、今に至る。


こうして書いてみると、なんかばたばたしてただけだし、特にエンジニアっぽいこともやってないんだけどな!


でも、たぶん、ぼくと同じように、いや、もっと大変な想いをして、なんとか今の事態をまわしてるエンジニアはいっぱいいると思うんです。
金曜日、あんな大きな地震のあと、たった数時間で首都圏の電車が動き始めたのは誰ががんばったのか?
被災地の発電所に大きな被害が出ているのに、首都圏に電気があるのは誰ががんばっているのか?
──予定されていた停電を回避できたのは、事態が発生してからたった数日で輪番停電なんていう今までにやったこともないような計画をたてられたのは、誰ががんばったのか?
首都圏の物流が途絶えないのは、誰ががんばっているのか?
被災地に救援に行く人たちを後方で支えているのは、誰なのか?


今の時代、人が集まり、動き、何かをなそうとしているとき、そこには必ずと言っていいほど、コンピュータ、ITシステムがあります。そして、ITシステムがあるところには、ITエンジニアがいます。
ITというと、どうしてもGoogleなどのWebシステムを思い浮かべがちだと思います。
もちろん、そういうWebシステムが、今回の地震でも、大きな役割を果たしているのは、言うまでもないと思います。
でも、それ以外の場所にも、ITエンジニアはいるんです。
プロとして、毎日を動かしている、ITエンジニアもいるんです。
例えば鉄道会社でも、

  • 供給される電力の想定をたてる
  • その中で安定して動かせる電車の本数を出す
  • その電車をどういうふうに動かすのか?

というところすべてを、数時間のうちにはじき出して、さらには、それを確実に安全に実行するという、すごいことをやっています。
そこには、ITシステムがあります。


だから、SIerのすみっこにいるぼくからの、お願いです。
今、いろいろ対策されているのは、そういったプロたちが、本気で全力でなんとか算出した、考えうる限り、最も首都圏に不便をかけずに、被災地を救うための方策だと思います。
それを、「停電するって言ってたのにしないのはどういうことだ!」なんて言わずに、可能な限り協力してください。


最後になりましたが、ITエンジニア以外にも、プロはたくさんいます。
原発でなんとか事態を収拾しようとしている人たちもプロです。
現地で、一人でも多くの人を救おうとしている人たちもプロです。
そして、東京からそれを指揮している人もプロです。
彼らを信じて、彼らを支援すれば、それが間接的にでも、被災者の方々を助けることになるんじゃないか、と思います。