[misc] I have a performance problem

私が受け取る性能に関する問い合わせの95%はこんなふうに始まります。
統計情報などを採取した(例えば、サポートドキュメントNote 1285485.1記載のgudsツールなどを通して)んだけど、これで問題の原因ってわかる?
って、これで原因がわかるわけないですよ。
こうした類の質問をされても、期待値、境界条件、そしてアプリケーションすらわかってない状態ではどうしようもないのです。
そこで、どういう表現をすれば問題に取りかかりやすいかをお伝えします。問題があることを疑っているのではありません。単に何が原因かを突き止めるために必要な事柄を伝えて欲しいだけなのです。
  • どのような振る舞いが望ましいのか
具体的に、ビジネスメトリックを使って説明してください。例えば、「ランタイム」「応答時間」「スループット」などです。こうした内容があって初めて終了基準がわかります。

それでは問題を抱えているシステムを見てみましょう。
  • どんなふうに、何が違って見えるのか
同じようにビジネスメトリックで説明してください。これらの2つの回答から支援の長い道が始まります。以下にあげる質問に対して回答してもらうと問題解決に近づきます。
  • このシステムは望ましい振る舞いをしてきたのか
  • もしそうなら、いつこのような動きをみせるようになったのか
  • その問題はいつも起きるのか、それともたびたびなのか
  • たびたび発生する事象の場合、その問題を見かけるのはいつか。識別可能な発生パターンがあるか
  • 問題の影響は少なくなっているか、大きくなっているか、それとも今までずっと同じか
  • 現象発生時とそうでない通常時の間にどのような違いがあるか
  • 同じ現象(使用率、負荷など)を確認できる他のマシンがあるか。あるとすれば、差異はどのようなっているか
このように情報を収集して、調査対象を絞り込み、質問者および調査者共々が問題が解決したと一致する終了基準を定めていきます。
現在私が受ける問い合わせのうち95%が、事象や症状の説明がずさんなので、この割合を減らせるよう、もっと的確な表現、具体的な数字で説明してくださいませ。どうぞよろしくお願いします。


原文はこちら。
http://blogs.oracle.com/tpenta/entry/i_have_a_performance_problem

0 件のコメント:

コメントを投稿