Перестановочні тести: критерії вибору статистики тесту


9

Я регулярно використовую тести на перестановку і люблю їх простоту. Я найбільше дізнався з книги "Методи перестановки" Good, в якій автор здається досить креативним у виборі статистики тестів на всіх прикладах. Також цей пост створює враження, що існує велика свобода вибору тестової статистики.

Мені цікаво, чи є теоретичні вимоги, якими повинна відповідати статистика тесту . Або ми можемо просто використовувати будь-яку статистику, якщо вона інтуїтивно має сенс і має хороші показники помилок типу I / II?

Наприклад, коли замість t-тесту використовується тест на перестановку через ненормальну сукупність, я неодноразово бачив, що р-значення тесту перестановки все ще отримується з t-статистики. Хоча це не обов'язково неправильно, це здається дивним вибором з огляду на походження розподілу Student t.

Відповіді:


8

T-статистика має багато сенсу як тестова статистика; багато людей вважають це інтуїтивно зрозумілим. Якщо я навожу t-статистику 0,5 або 5,5, вона щось говорить - скільки стандартних помилок, крім засобів.

Складність - принаймні з помірною ненормальністю - не стільки з використанням статистики, скільки з використанням t-розподілу для його розподілу під нулем. Статистика досить розумна.

Звичайно, якщо ви очікуєте, що набагато важчі хвости, ніж звичайні, більш міцна статистика зробила б краще, але t-статистика не дуже чутлива до м'яких відхилень від нормальності (наприклад, вона менш чутлива, ніж статистика коефіцієнта дисперсії).

Якщо ви хочете використовувати лише чисельник статистики, це чудово, це має сенс як статистика перестановки, якщо вас цікавить різниця в засобах. Якщо ви зацікавлені в більш загальному розумінні зміни місця розташування, це відкриває безліч інших можливостей.

Ви правильно вважаєте, що існує велика свобода вибору статистики та її підлаштування під конкретні обставини - яким альтернативам ви хочете владу чи які можливі проблеми, які ви хочете бути надійними (забруднення, наприклад, може потужність удару).

Насправді обмежень майже немає - ви можете вибирати майже все, включаючи марну тестову статистику. Звичайно, є кілька міркувань, над якими вам слід подумати, вибираючи тести, але ви вільні цього не робити.

-

Однак, є деякі критерії, які можна застосувати за різних обставин.

Наприклад, якщо вас особливо цікавить конкретний вид гіпотези, ви можете скористатись статистикою, яка відображає це - наприклад, якщо ви хочете перевірити різницю в сукупності засобів, часто має сенс зробити свій тест статистичним пов'язані з різницею у зразкових засобах.

Якщо ви знаєте щось про тип розповсюдження, який у вас може бути - важкі хвости, косий або навмисне легкий хвостик, але з певним ступенем забруднення, або бімодальний, ... ви можете розробити тестову статистику, яка могла б справитись за таких обставин, наприклад, вибір статистики, яка повинна бути ефективною в очікуваній ситуації, але має певну стійкість до забруднення.

-

Моделювання - це один із способів дослідження влади в різних ситуаціях.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.