Які стандартні статистичні тести можна побачити, чи слід за експоненціальними або нормальними розподілами?
Які стандартні статистичні тести можна побачити, чи слід за експоненціальними або нормальними розподілами?
Відповіді:
Здається, ви намагаєтеся вирішити, чи моделювати ваші дані, використовуючи звичайний або експоненціальний розподіл. Мені це здається дещо дивним, оскільки ці дистрибуції сильно відрізняються один від одного.
Нормальний розподіл симетричний, тоді як експоненціальний розподіл сильно перекошений вправо, без негативних значень. Зазвичай зразок експоненціального розподілу буде містити багато спостережень, порівняно близьких до та декілька спостережень, які відхиляються далеко від правої частини від . Цю різницю часто легко помітити графічно.0
Ось приклад, де я моделював спостережень із нормального розподілу із середнім значенням та дисперсією та експоненціальним розподілом із середнім значенням та дисперсією :2 4 2 4
Симетрію нормального розподілу та косості експоненціалу можна побачити за допомогою гістограми, боксерських і розсипних схем, як показано на малюнку вище.
Ще один дуже корисний інструмент - QQ-сюжет . У наведеному нижче прикладі точки повинні приблизно слідувати лінії, якщо вибірка виходить із нормального розподілу. Як бачите, це стосується звичайних даних, але не для експоненціальних даних.
Якщо графічного обстеження з якихось причин недостатньо для вас, ви все одно можете скористатися тестом, щоб визначити, нормальний чи експоненціальний ваш розподіл. Оскільки звичайний розподіл є сімейством масштабів та місцеположень, ви хочете використовувати тест, інваріантний за зміною масштабу та місця розташування (тобто результат тесту не повинен змінюватися, якщо ви зміните вимірювання на дюйми до сантиметрів або додасте до всіх ваших спостережень).
Коли нульова гіпотеза полягає в тому, що розподіл є нормальним, а альтернативна гіпотеза полягає в тому, що вона експоненціальна, найпотужніший тест на інваріантне розташування та масштаб дається статистикою де - середня вибірка, - найменше спостереження у вибірці, а - стандартне відхилення вибірки. Нормальність відхиляється на користь експоненціальності, якщо занадто великий.ˉ x x(1)sTE,N
Цей тест насправді є односторонньою версією тесту Груббса для людей, що вижили . Ви знайдете це в більшості статистичних програм (але переконайтеся, що ви використовуєте правильну версію - є кілька альтернативних статистичних даних тесту, які використовуються для випробування поза межами!).
Посилання на є найпотужнішим тестом: Розділ 4.2.4 Тестування на нормальність HC Thode.
Для експоненціального розподілу можна використовувати тест, який називається тестом Морана або Бартлетта. Тестова статистика включає середнє значення вибірки , а також середнє значення вибірки зареєстрованого Під нульовою гіпотезою маємо приблизно і працює двостороння тестова робота. Цей тест розроблений проти гамма-альтернатив.¯ Y ·· увійти Y Y я В п = б п × { журнал ˉ Y - ¯ увійти Y } B n ∼ χ 2 ( n - 1 )
Дивіться KC Kapur та LR Lamberson Надійність в інженерному дизайні . Wiley 1977.
Для нормальності Андерсон-Дарлінг та Шапіро-Вілк вважаються найкращими. Для експоненціального тесту Ліллефорса розроблений спеціально для нього.
Чи розглядали ви графічні методи, щоб побачити, як поводяться дані?
Методи графіка ймовірності зазвичай передбачають ранжування даних, застосування зворотного CDF, а потім побудову результатів на декартовій площині. Це дозволяє вам побачити, чи відхиляється кілька значень від гіпотезованого розподілу і, можливо, враховувати причину відхилення.