問題解決思考ことはじめ

ITエンジニアの目線から、問題解決のための思考方法について考察してゆくブログです。

YAPC::Asia 2014 トークレポート 8/30

YAPC初参加。トークレポートをしてみようと思います。

自社サービスの運用設計を今やっていて、体系的な情報をスピーディに収集する必要もありましたので、 こえむさんのトークに関する話を書きます。以下、気になった箇所です。

運用監視

閾値(メトリクス)を決める

これまでのインフラの仕事で概要は把握していましたが、改めて言われると、なるほど出来ていない

実は、サービスのリソース見積もりからまだ出来ていないのでメトリクス監視まで辿り着けていないです。。でも必要

サービスサーバと監視サーバはデータセンタ等を分けて物理的に位置を離す。

今までの現場では出来ていない、ていうかやったことがなかったです。地味に目から鱗。 構築してきて、DBサーバの真上に監視サーバがあるサーバラックを何度も見てきました。

連絡体制の構築

イメージはあったけど、言われると爪の甘い所が続々。 特に、金銭に関する意思決定者への連絡方法を2つは持つことが大事だというのはその通りで、自分の脇の甘さを感じました。

とりいそぎ書いてきましたが、トーク全体を通して思ったのは、自分の脇の甘さをとことん痛感したということです。かつ、サービスにかかわる人に迷惑を掛けないというあたりまえのことを当たり前にやるのが監視の王道なのだと感じました。

とはいえ、スタートアップ等人員リソースが少ない中でやりくりする上では、最大限やれることをやるしかなく、予め対応できる時間帯に制限を掛けるのも重要。

できないことをできないと言うのも責任

上記の言葉はとても印象に残りました。