Я пишу сценарій, який аналізує час запуску процесів. Я не впевнений у їх розподілі, але хочу знати, чи процес триває "занадто довго". Поки що я використовував 3 стандартні відхилення останніх періодів запуску (n> 30), але мені сказали, що це не дає нічого корисного, якщо дані не є нормальними (що, здається, не є). Я знайшов ще один тест, що говорить:
Знайдіть інтерквартильний діапазон, який є IQR = Q3 - Q1, де Q3 - третій квартал, а Q1 - перший квартиль. Потім знайдіть ці два числа:
а) Q1 - 1,5 * IQR b) Q3 + 1,5 * IQR
Суть - це вибірка, якщо <a або> b
Мої дані мають тенденцію бути такими як 2sec, 3sec, 2sec, 5sec, 300sec, 4sec, .... там, де 300sec, очевидно, більше.
Який метод краще? Метод IQR або метод відхилення std?