Я читав про t-тест Стьюдента, але, здається, він працює, коли можна припустити, що оригінальні дистрибутиви зазвичай розподіляються. У моєму випадку їх точно немає.
Крім того, якщо у мене є 13 розподілів, чи потрібно робити 13^2
тести?
Я читав про t-тест Стьюдента, але, здається, він працює, коли можна припустити, що оригінальні дистрибутиви зазвичай розподіляються. У моєму випадку їх точно немає.
Крім того, якщо у мене є 13 розподілів, чи потрібно робити 13^2
тести?
Відповіді:
Є кілька почуттів, в яких "це залежить".
(Одна з потенційних проблем полягає в тому, що схоже, що оригінальні дані можуть бути дискретні; це слід уточнити.)
Залежно від розміру вибірки, ненормальність може бути не такою серйозною проблемою, як все, що стосується t-тесту. Принаймні, для великих зразків загалом є хороша надійність рівня - на помилки типу I не слід надто сильно впливати, якщо це не дуже далеко від норми. Сила може бути більшою проблемою для важких хвостів.
Якщо ви шукаєте будь-які відмінності в розподілі, може бути придатним тест на придатність для двох зразків, такий як двопробний тест Колмогорова-Смірнова (хоча замість цього можна зробити інші тести).
Якщо ви шукаєте відмінності типу локації в сім'ї місцеположень або відмінності в масштабі сімейства масштабів, або навіть просто співвідношення типу P (X> Y)> P (Y> X), Wilcoxon-Mann-Whitney два зразки тесту можуть бути придатні.
Ви можете розглянути тести перекомплектування, такі як перестановка перестановки або завантажувальний тест, якщо ви зможете знайти відповідну статистику за типом відмінностей, до яких ви хочете мати чутливість.
Крім того, якщо у мене є 13 розподілів, чи потрібно робити 13 ^ 2 тестів?
Ну, ні .
Ці дві речі скоротили парні порівняння з 169 до 78.
По-третє, було б набагато звичнішим (але не обов'язковим) тестувати колективно на наявність будь-яких відмінностей, а потім, можливо, дивитися на парні відмінності в пост-хокових парних тестах, якщо перша нуль буде відхилена.
Наприклад, замість Вілкоксона-Манна-Вітні, як у пункті 3. вище, можна зробити тест Крускала-Уолліса, який чутливий до будь-яких відмінностей у розташуванні між групами.
Існують також k-зразкові версії тесту Колмогорова-Смірнова , і подібні тести деяких інших двопробних придатностей тестів на придатність можуть існувати або бути побудовані.
Існують також k-зразкові версії тестів на перекомпонування та t-тесту (тобто ANOVA, що може бути добре, якщо розміри вибірки досить великі).
Було б дуже приємно отримати більше інформації про те, з чим ми маємо справу, і які види відмінностей вас найбільше цікавлять; або якщо цього не вдалося переглянути графіки QQ деяких зразків.
Так, я думаю, ви не можете зробити краще, ніж тестувати кожен розподіл на інші ...
Якщо ви думаєте, що ваше питання пов'язане з цим: Порівняння двох розподілів
Радимо скористатися тестом Колмогорова-Сминорва або тестом Крамера-Фон Мізеса. Вони обидва дуже класичні тести адекватності.
В R
, функція ks.test
в пакеті статистики реалізує перший. Другий можна знайти в таких пакетах cramer
.
Щоб дізнатися про ці два тести: http://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test http://en.wikipedia.org/wiki/Cram%C3%A9r%E2%80%93von_Mises_criterion
Ви можете спробувати однобічний аналіз дисперсії Крускала – Уолліса
"Він використовується для порівняння більш ніж двох зразків, незалежних або не пов'язаних"
Порушення нормальності в ANOVA обговорювалося в
Резерфорді, представляючи Anova і Ancova: підхід GLM 9.1.2 Порушення нормальності
Перший рядок - "Хоча більшість джерел повідомляє, що ANOVA ... є надійним щодо порушень припущення про нормальність ..."