住友林業情報システム株式会社 様

住友林業情報システム株式会社 様 導入事例

住友林業情報システム株式会社 様

http://www.sumirin.co.jp/


運用管理部 インフラ運用グループ
グループリーダー
 
茶木 建一

※ご部署、お役職は2012年当時のものです。

業務に応じた最適な閾値設定による性能管理体制を確立

会社概要

弊社は、住友林業グループ唯一のIT企業として、ITを駆使してグループの進化を支えるべく、そのシステム開発・運用を一手に担っています。


ES/1 NEO CSシリーズ導入の経緯


1999年から基幹業務が稼働するメインフレームに「ES/1 NEO MFシリーズ」を導入して性能管理を行ってきました。その後、メインフレームからオープン系へ基幹業務の移行が進み、オープン系でも性能管理の必要性が高まりました。そこで、メインフレームと同等の性能管理が実施できる点と、IIMのサポート力の高さが決め手となり、2001年に「ES/1 NEO CSシリーズ」を導入しました。

「ES/1 NEO CSシリーズ」を導入したことで、下記の効果がありました。

1. サーバリソース稼働状況の可視化
2. 投資前後の評価と導入効果の測定
3. 月次報告書の工数削減

性能管理体制の見直し

ES/1導入後、管理サーバ数の増加や、仮想化環境への移行作業の増大、ベテランSEの定期異動による経験値の減少など運用環境が大きく変化して、SEの作業負荷が増大しました。

その結果、性能管理にかけられる工数が減少し、ES/1の活用頻度も低下しました。本来ならば障害の未然防止に活用すべきところが、問題発生後の事象確認のみにとどまり、後手後手の対応になっていました。中には、事前にES/1を確認していれば防げた障害もありました。

月次報告書についても管理項目の見直しを行う余裕がなく、報告書の内容が形骸化していました。これらの問題を解決するため、IIMに性能管理体制について相談しました。

IIMからは他社で行っているPDCAの事例をご紹介いただき、弊社に取り入れられるよう落としこみを行いました。また、ES/1の閾値チェック機能を利用して、異常を検出する仕組みを構築することにしました。



閾値チェックによる異常検出の仕組み構築  
ES/1導入済みサーバについては、過去6ヶ月分のデータをIIMに送付して適切な閾値を決定しました。新規導入のサーバについてはIIMが推奨する閾値を設定したあと、1ヶ月後と6ヶ月後に閾値の妥当性を判断して、必要に応じて見直しを行いました。定期的な閾値の見直しを経て、現在は本格運用を行っています。

異常値が検出された場合、ES/1から自動的に担当者へメールが送信されます。担当者はES/1のWeb閲覧機能であるPerformance Web Serviceでサーバの状況を確認します。内容によってはチューニングやハード増強などの対策を検討して対応します。

このような閾値を超えたサーバと対策内容は全てロギングしており、過去の対応実績や自社のノウハウとして蓄積しています。ロギングすることで過去の状況がいつでも確認でき、サーバの特性を把握することにもつながっています。今後さらにPDCAを続けることで、より精度の高いチェックが可能になると感じています。(図1)

ES/1導入による効果
導入前は経験による対応を行っていたので、原因特定に時間がかかっていましたが、
ES/1を導入したことで根本的な原因切り分けを実現でき、複雑な問題でも解決するべきポイントが明確になりました。また、リソース情報の蓄積から将来的な障害発生の予測が可能になり、障害予防の対策検討が容易になりました。