Як перевірити, чи відрізняються два (ненормальні) розподіли?

Я читав про t-тест Стьюдента, але, здається, він працює, коли можна припустити, що оригінальні дистрибутиви зазвичай розподіляються. У моєму випадку їх точно немає.

Крім того, якщо у мене є 13 розподілів, чи потрібно робити 13^2тести?

Ось зразок двох дистрибуцій. Є 13 дистрибуцій.

r hypothesis-testing distributions

— Мартін Велес
джерело

@Glen_b Дані не дискретні. Значення варіюються від -2 до 2.

— Мартін Велес

Відповіді:

Є кілька почуттів, в яких "це залежить".

(Одна з потенційних проблем полягає в тому, що схоже, що оригінальні дані можуть бути дискретні; це слід уточнити.)

Залежно від розміру вибірки, ненормальність може бути не такою серйозною проблемою, як все, що стосується t-тесту. Принаймні, для великих зразків загалом є хороша надійність рівня - на помилки типу I не слід надто сильно впливати, якщо це не дуже далеко від норми. Сила може бути більшою проблемою для важких хвостів.
Якщо ви шукаєте будь-які відмінності в розподілі, може бути придатним тест на придатність для двох зразків, такий як двопробний тест Колмогорова-Смірнова (хоча замість цього можна зробити інші тести).
Якщо ви шукаєте відмінності типу локації в сім'ї місцеположень або відмінності в масштабі сімейства масштабів, або навіть просто співвідношення типу P (X> Y)> P (Y> X), Wilcoxon-Mann-Whitney два зразки тесту можуть бути придатні.
Ви можете розглянути тести перекомплектування, такі як перестановка перестановки або завантажувальний тест, якщо ви зможете знайти відповідну статистику за типом відмінностей, до яких ви хочете мати чутливість.

Крім того, якщо у мене є 13 розподілів, чи потрібно робити 13 ^ 2 тестів?

Ну, ні .

$A$ $B$ $B$ $A$

$A$ $A$

Ці дві речі скоротили парні порівняння з 169 до 78.

По-третє, було б набагато звичнішим (але не обов'язковим) тестувати колективно на наявність будь-яких відмінностей, а потім, можливо, дивитися на парні відмінності в пост-хокових парних тестах, якщо перша нуль буде відхилена.

Наприклад, замість Вілкоксона-Манна-Вітні, як у пункті 3. вище, можна зробити тест Крускала-Уолліса, який чутливий до будь-яких відмінностей у розташуванні між групами.

Існують також k-зразкові версії тесту Колмогорова-Смірнова , і подібні тести деяких інших двопробних придатностей тестів на придатність можуть існувати або бути побудовані.

Існують також k-зразкові версії тестів на перекомпонування та t-тесту (тобто ANOVA, що може бути добре, якщо розміри вибірки досить великі).

Було б дуже приємно отримати більше інформації про те, з чим ми маємо справу, і які види відмінностей вас найбільше цікавлять; або якщо цього не вдалося переглянути графіки QQ деяких зразків.

— Glen_b -Встановити Моніку
джерело

(+1) Так само хочеться додати, що тест WMW несе інтерпретацію як тест на стохастичне домінування, якщо ви готові припустити, що популяційні CDF не перетинаються. Люди ІМО частіше хочуть цього, якби вони знали про це.

— Scortchi

P (X < Y) \neq \frac{1}{2}

$P(X<Y) \neq \frac{1}{2}$

@Glen_b Дані не дискретні. Значення варіюються від -2 до 2.

— Мартін Велес

Вау - важлива інформація! Чи обмежені вони до цього діапазону (2.1 неможливо), чи просто так сталося, що значення знаходяться в цьому діапазоні?

— Glen_b -Встановіть Моніку

Вони обмежені цим діапазоном.

— Мартін Велес

Так, я думаю, ви не можете зробити краще, ніж тестувати кожен розподіл на інші ...

Якщо ви думаєте, що ваше питання пов'язане з цим: Порівняння двох розподілів

Радимо скористатися тестом Колмогорова-Сминорва або тестом Крамера-Фон Мізеса. Вони обидва дуже класичні тести адекватності.

В R, функція ks.testв пакеті статистики реалізує перший. Другий можна знайти в таких пакетах cramer.

Щоб дізнатися про ці два тести: http://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test http://en.wikipedia.org/wiki/Cram%C3%A9r%E2%80%93von_Mises_criterion

— Поп
джерело

Ви можете спробувати однобічний аналіз дисперсії Крускала – Уолліса

"Він використовується для порівняння більш ніж двох зразків, незалежних або не пов'язаних"

Порушення нормальності в ANOVA обговорювалося в
Резерфорді, представляючи Anova і Ancova: підхід GLM 9.1.2 Порушення нормальності

Перший рядок - "Хоча більшість джерел повідомляє, що ANOVA ... є надійним щодо порушень припущення про нормальність ..."

— abbat_VL
джерело

Спасибі! Здається, що слід запустити цей тест, перш ніж робити парні порівняння.

— Мартін Велес