【5】増強コストの適正化

【5】増強コストの適正化

夜間バッチ処理の遅延が発生してオンラインに影響
メーカ提案のCPU増強ではなく他の解決策が判明


きっかけ

バッチ処理の遅延が発生

業務ピーク日における夜間バッチ処理が長引いてしまい、オンラインの開始時刻までに終了しない現象が発生しました。本来ならば5時間で終わらなければならない処理が6時間も掛かっており、オンライン業務が開始できない状況に陥っていました。

システム部門の対応

メーカからはCPU増強の提案

メーカに夜間バッチ処理の短縮について相談したところ、CPUの増強を提案されました。

しかし、CPU増強には膨大なコストが発生するため、その結果としてバッチ処理の遅延が本当に解消するのかどうか見極める必要がありました。

そこで、IIMにご相談いただき、CPU増強を行うことでバッチ処理の短縮が実現するかについて検証することになりました。


IIMによる性能評価

ES/1による性能評価を実施し、出力されたチューニングヒントとSEコンサルティングの結果、以下のことが判明しました。

性能評価結果

通常日とピーク日の業務量を比較し、それぞれの一日のシステムログを分析した結果、通常日に比べてピーク日では、以下の現象が見受けられました。

①特定のディスク装置Aに負荷が集中
②CPUを活用できない「I/Oウェイト時間」が発生
③ディスク装置Aを頻繁に使用している業務プロセスを検知
④CPUおよびメモリに問題はなし


上記4点から、IIMでは夜間バッチ処理の遅延は、ディスク装置Aに負荷が集中していることが原因と考えました。よって、CPUを増強してもバッチ処理の短縮は不可能と判断いたしました。

(グラフ1:ピーク日におけるI/Oウェイト)



IIMからの改善案

改善案

ディスク装置Aに対する負荷を分散させることがボトルネックの解消に繋がるため、IIMからは下記3点の改善案を提示しました。

①アプリケーション改善による負荷分散
②ディスク装置A内のファイルを分散
③より高速なキャッシュ付ディスク装置への移行




システム部門のご判断

対応策

メーカからの提案では問題が解決しないことをご納得いただき、CPUの増強は見送ることになりました。

IIM提示の改善案を社内で慎重に検討された結果、「より高速なキャッシュ付ディスク装置への移行」を採択されました。

それぞれの改善案でも効果が見込めますが、実施する工数やコストを勘案した結果、最も効果的であると判断されたのが高速なキャッシュ付ディスク装置への移行でした。

結論

より高速なキャッシュ付ディスク装置へ移行した結果、6時間掛かっていた夜間バッチ処理が4時間で終了し、2時間短縮することができました。

また、今回は採択しなかった他の改善案は次期システム構築時の貴重な参考情報となり、アプリケーションの見直しやファイルの再配置を実施することで、よりスループットの高いシステムの実現が可能となります。

(グラフ2:バッチ処理時間短縮)



結果

バッチ処理短縮とCPU増強回避を実現

メーカ提案の検証が不十分なまま、CPUの増強を行なっていたら、多大なコストが発生したにも関わらず、夜間バッチ処理の遅延が解消しないという結果になっていたと思われます。

キャッシュ付ディスク装置を購入されたため費用は発生しましたが、CPUの増強に比べて非常に安価に済んだことで、お客様は非常に喜ばれておりました。

それ以外にも、今まで気付かなかったアプリケーションやファイルの配置の問題も検知することができ、IIMの技術力を高く評価いただきました。