失敗事例に学ぶ運用性能品質向上策 − @IT情報マネジメント

情報収集ツールはOSの物だけでなく各ミドルウエアのツールも入っていたら本当によいですよねぇ。

1. データ取得

sarやvmstat、システムモニタといったOSのコマンドや、ミドルウェア標準の統計情報取得ツールのことです。標準のコマンドやツールは簡単に使えますが、それらを使いこなすスキルを持つ専門家が必要になります。

2. データ解析/表示

シェルスクリプトによるデータ整形、Excelによるグラフ化などが一般的です。可視化により、データ解析のスピードは大きく向上します。スクリプトやマクロを作り込むことで、ある程度自動化することも可能です。

3. チューニングアドバイス

有償の解析ツールには、解析効率を上げるための便利機能だけでなく、問題点を改善するためのチューニングアドバイスを提示してくれるものもあり、専門家不在でもある程度の対応が可能になります。必ず正解が提示されるとは限りませんが、人間では避けられないチェック漏れ、確認ミス等は確実に防止できます。また【ポイント2 】でご紹介した診断も、ツールのレポート機能を利用することで工数削減が可能です。

この機能なら、アレを入れておく、これならあれ、、って一覧があれば良いんですけどねぇ。

診断ツールの有無により、解析時間は大きく変わってきます。極端な場合、ツールが導入されていれば本番環境を10分解析すれば終わるところを、再現試験込みで1カ月かかることもありました。また、スローダウンしている本番サーバに新しいツールをインストールすると、ほかのトラブルを誘発するリスクがあるため、診断ツールはトラブルが発生してから導入するのは非常に難しいです。そのため、ツール類はシステム構築の際に導入しておくのが賢明な選択といえます。