【5】HPのアクセス集中に伴うエラーの解消

【5】HPのアクセス集中に伴うエラーの解消

ホームページへのアクセス集中に伴いエラーが発生
IIMの分析により開発部門へ改善を依頼
 


きっかけ:自社ホームページでのエラー発生


登録ユーザーに毎月お送りしているメールマガジンからのリンクにより、自社ホームページへのアクセスが集中し、応答が返ってこないというエラーが発生しました。

システム部門の対応:原因究明ができず、CPUの増強を検討


ご自社で分析を行いましたが原因が分からず、毎月のメールマガジン送付後にお客様や営業部門からクレームが寄せられました。対応策としてCPUの増強を検討しましたが、原因不明のままでは予算を確保することができず、IIMに分析をご依頼いただきました。

IIMによる性能評価①:アクセス数が非常に多いURLを発見


まず始めにURL毎のレスポンス時間とアクセス数を確認したところ、他のURLに比べて、アクセス数が非常に多いURL「/flash/image/abc」を発見しました。(図1)

お客様に確認させていただいたところ、「/flash/image/abc」とはホームページへのアクセスが集中して画像の表示が遅れた場合に、画像表示スペースに「×」を表示する処理を行うためのURLでした。

(図1:URL毎のレスポンス時間とアクセス数)



IIMによる性能評価②:アクセス件数とレスポンスの相関


次にCPU、メモリ、I/Oのリソース使用状況を確認しましたが、特に問題はありませんでした。

しかし、ホームページへのアクセス件数とレスポンス時間の相関判定を行ったところ、アクセス件数が1秒当たり1件を超えるとレスポンスが非常に遅くなることが分かりました。(図2)

メールマガジン送付後の状況では1秒当たり3件のアクセスがありましたが、この相関判定の結果、1秒当たり1件が処理の限界であることが判明しました。

(図2:アクセス件数とレスポンス時間の相関)


上記の結果より、以下の2点をお客様にご報告させていただきました。

1.「/flash/image/abc」のみ非常にアクセス件数が多く、恐らく処理に何らかの問題があると考えられ、
  アプリケーションの改善が必要と思われること。
2.現状のシステムでは、1秒当たり1件のアクセスが処理の限界であること。


お客様の対応①:メールマガジンの分割配信


IIMからご報告した結果を受けて、暫定的な対応として、1秒当たり1件の処理に留めるためにールマガジンの配信を3回に分けて配信したところ、エラーの発生は回避できました。(図3)

(図3:レスポンス時間の改善)


しかし、営業部門よりメールマガジンの分割配信は好ましくないとの声が上がったこともあり、恒久的な対応として「/flash/image/abc」の処理改善を開発部門に依頼しました。

開発部門が確認すると、「/flash/image/abc」の処理がループしてしまうという問題があることが分かり、アプリケーションの改善を行いました。


結果:処理件数の向上


その結果、1秒当たりの処理件数が3件まで向上し、メールマガジンも一括で配信することができるようになりました。(図4)

(図4:1秒当たりの処理件数の増加)


アクセス件数とレスポンス時間の相関判定を行うことで適切な処理件数を把握することができ、アプリケーションの改善に結び付けられたことを大変お喜びいただけました。