Я знаю, що непараметричні покладаються на медіану замість середньої
Навряд чи будь-які непараметричні тести насправді "покладаються" на медіанів у цьому сенсі. Я можу подумати лише про пару ... і єдиний, на який я сподіваюся, що ви, ймовірно, навіть чули, - це тест на знаки.
порівнювати ... щось.
Якби вони покладалися на медіанів, імовірно, це було б порівняння медіанів. Але - незважаючи на те, що намагаються сказати вам ряд джерел - тести, такі як підписаний тест на ранг, або Вілкоксон-Ман-Уїтні або Крускал-Уолліс насправді взагалі не є випробуванням медіанів; якщо ви зробите деякі додаткові припущення, ви можете розцінювати Вілкоксона-Манна-Вітні та Крускал-Уолліса як тести медіанів, але за тих же припущень (доки існують засоби розповсюдження) ви могли б однаково вважати їх випробуванням засобів .
Фактична оцінка місцеположення, що відповідає тесту підписаного рангу, є медіаною парних середніх значень у зразку, середня для Вілкоксона-Манна-Вітні (і, як наслідок, у Крускал-Уолліса) є медіаною парних різниць між зразками .
Я також вважаю, що вона спирається на "ступінь свободи?" замість стандартного відхилення. Виправте мене, якщо я помиляюся.
Більшість непараметричних тестів не мають "ступенів свободи", хоча розподіл багатьох змінюється залежно від розміру вибірки, і ви можете вважати, що це дещо схоже на ступінь свободи в тому сенсі, що таблиці змінюються з розміром вибірки. Зразки, звичайно, зберігають свої властивості і мають у цьому сенсі n ступенів свободи, але ступінь свободи в розподілі тестової статистики, як правило, не є тим, що нас стосується. Може статися, що у вас є щось схоже на ступінь свободи - наприклад, ви, безумовно, можете зробити аргумент, що у Крускала-Уолліса є рівні свободи в основному в тому ж сенсі, що і в квадраті чі, але на нього зазвичай не дивляться таким чином (наприклад, якщо хтось говорить про ступінь свободи Крускала-Уолліса, вони майже завжди означатимуть
Добре обговорення ступенів свободи можна знайти тут /
Я провів досить хороші дослідження, або так думав, намагаючись зрозуміти концепцію, що працює за цим, що насправді означають результати тестування та / або що навіть робити з результатами тесту; однак, здається, ніхто ніколи не заходив у цю область.
Я не впевнений, що ти маєш на увазі під цим.
Я міг би запропонувати деякі книги, як-от практична непараметрична статистика Коновера , і якщо ви можете їх отримати, книга Нева та Уортінгтона ( Тести без розповсюдження ), але є багато інших - наприклад, Мараскуїло та Максвейні, Голландер і Вулф або книга Даніеля. Я пропоную вам прочитати щонайменше 3 чи 4 з тих, хто найкраще розмовляє з вами, бажано з тих, що пояснюють речі якомога інакше (це означало б хоча б прочитати трохи, можливо, 6 чи 7 книг, щоб знайти, наприклад, 3, що підходить).
Заради простоти дозволяємо дотримуватися тесту Mann Whitney U, який я помітив, є досить популярним
Саме це мене спантеличило у вашій заяві: "Ніхто, здається, ніколи не заходив у цю область" - багато людей, які використовують ці тести, роблять "заїзд у ту область", про яку ви говорили.
- а також, здавалося б, неправомірним та зловживаним
Я б сказав, що непараметричні тести, як правило, не використовуються, якщо що-небудь (включаючи Вілкоксона-Манна-Вітні) - більшість тестів на перестановку / рандомізацію, хоча я не обов'язково заперечую, що їх часто використовують (але так само параметричні тести, навіть тим більше).
Скажімо, я запускаю непараметричний тест зі своїми даними і отримую цей результат назад:
[сніп]
Я знайомий з іншими методами, але чим тут відрізняється?
Які ще методи ви маєте на увазі? З чим ти хочеш, щоб я порівняв це?
Редагувати: регресію ви згадуєте пізніше; Тоді я припускаю, що вам знайомий двопробний t-тест (оскільки це справді особливий випадок регресії).
Згідно з припущеннями для звичайного двопробного t-тесту, нульова гіпотеза передбачає, що дві сукупності однакові, проти альтернативи, що один з розподілів змістився. Якщо ви подивитесь на перший із двох наборів гіпотез Вілкоксона-Манна-Вітні нижче, то основне, що тестується там, майже однакове; просто t-тест базується на припущенні, що вибірки походять з однакових нормальних розподілів (крім можливого зрушення місця). Якщо нульова гіпотеза правдива, а супутні припущення є істинними, статистика тесту має t-розподіл. Якщо альтернативна гіпотеза вірна, то статистика тесту стає більшою ймовірністю приймати значення, які не виглядають узгодженими з нульовою гіпотезою, але виглядають узгодженими з альтернативою - ми зосереджуємось на найбільш незвичайному,
Ситуація дуже схожа з Вілкоксоном-Манном-Вітні, але відхилення від нуля воно вимірює дещо інакше. Насправді, коли припущення t-тесту є істинними *, це майже так само добре, як найкращий можливий тест (який є t-тестом).
* (що на практиці ніколи не буває, хоча це насправді не стільки проблема, скільки звучить)
Дійсно, можна вважати Вілкоксона-Манна-Уітні ефективним «t-тестом», виконаним у рядах даних, хоча тоді він не має t-розподілу; статистика - це монотонна функція двопробної t-статистики, обчисленої на рядах даних, тому вона індукує те саме впорядкування ** на вибірковому просторі (тобто "t-тест" для рангів - належним чином виконується - генерував би ті ж значення p, що і у Вілкоксона-Манна-Вітні), тому він відкидає абсолютно ті самі випадки.
** (суворо, часткове замовлення, але залишимо це осторонь)
[Ви б могли подумати, що просто використання рангів викидає багато інформації, але коли дані беруться з звичайних груп з однаковою дисперсією, майже вся інформація про зміщення місцеположення знаходиться у шаблонах рангів. Фактичні значення даних (залежно від їх рангів) додають до цього дуже мало додаткової інформації. Якщо ви переходите на більш важкий, ніж звичайний, незадовго до того, як тест Вілкоксона-Манна-Вітні отримає кращу потужність, а також збереже свій номінальний рівень значущості, так що "зайва" інформація над званнями з часом стає не просто неінформативною, а в деяких почуття, введення в оману. Однак майже симетрична великоваговість - це рідкісна ситуація; те, що ви часто бачите на практиці, - це перекос.]
Основні ідеї досить схожі, p-значення мають таку ж інтерпретацію (ймовірність результату як, або більш екстремальна, якщо нульова гіпотеза була правдивою) - аж до інтерпретації зміни місця, якщо ви зробите необхідні припущення (див. обговорення гіпотез наприкінці цієї публікації).
Якби я зробив те саме моделювання, що і на графіках вище для t-тесту, графіки виглядали б дуже схоже - шкала на осях x і y виглядала б інакше, але базовий вигляд був би подібним.
Чи потрібно, щоб значення р було нижчим за 0,05?
Вам нічого не потрібно "бажати". Ідея полягає в тому, щоб з'ясувати, чи є зразки більш різними (в локальному сенсі), ніж можна пояснити випадково, а не "бажати" конкретного результату.
Якщо я кажу : «Можете чи ви піти подивитися , що колір автомобіля Raj є будь ласка?», Якщо я хочу об'єктивну оцінку цього я не хочу , щоб ви збираєтеся «Людина, я дуже, дуже сподіваюся , що це синій! Він просто повинен бути синій ». Найкраще просто побачити, яка ситуація, а не вступати з якимось «мені потрібно, щоб це було щось».
Якщо обраний вами рівень значущості становить 0,05, ви відкинете нульову гіпотезу, коли значення р буде нижче 0,05. Але відмова відхилити, якщо у вас достатньо великий розмір вибірки, щоб майже завжди виявляти відповідні розміри ефектів, принаймні так само цікаво, оскільки це говорить про те, що будь-які існуючі відмінності невеликі.
Що означає число "mann whitley"?
Манна-Уїтні статистики .
Це дійсно важливо лише порівняно з розподілом значень, яке він може приймати, коли нульова гіпотеза є істинною (див. Вищевказану діаграму), і це залежить від того, яке з декількох конкретних визначень може використовувати будь-яка конкретна програма.
Чи є для цього користь?
Зазвичай вам не байдуже точне значення як таке, але де воно лежить в нульовому розподілі (будь то більш-менш типовий для значень, які ви повинні бачити, коли нульова гіпотеза є правдивою чи більш екстремальною)
П( X< Y)
Чи ці дані тут просто підтверджують чи не підтверджують, що певне джерело даних, яке я маю, повинно бути чи не слід використовувати?
Цей тест нічого не говорить про "певне джерело даних, які я маю потрібно або не слід використовувати".
Дивіться мою дискусію щодо двох способів розгляду гіпотез WMW нижче.
У мене є достатній досвід досвіду регресії та основ, але мені дуже цікаво про цей "особливий" непараметричний матеріал
У непараметричних тестах немає нічого особливого (я б сказав, що "стандартні" багато в чому навіть більш базові, ніж типові параметричні тести) - якщо ви насправді розумієте тестування гіпотез.
Це, мабуть, тема для іншого питання.
Існує два основні способи вивчення тесту гіпотези Вілкоксона-Манна-Вітні.
i) Потрібно сказати: "Мене цікавить зміна місця розташування - тобто, за нульовою гіпотезою, дві групи мають однаковий (безперервний) розподіл , проти альтернативи, яку" зміщують "вгору або вниз відносно інший"
Wilcoxon-Mann-Whitney працює дуже добре, якщо ви зробите це припущення (що ваша альтернатива - це лише зміна місця розташування)
У цьому випадку Вілкоксон-Манн-Вітні насправді є тестом для медіанів ... але в рівній мірі це випробування на засоби, або взагалі будь-яку іншу статистику, еквівалентну за місцем розташування (наприклад, 90-й відсоток, або підстрижені засоби, або будь-яку кількість інші речі), оскільки всі вони однаково впливають на зміну місцезнаходження.
Приємно в цьому те, що це дуже легко інтерпретувати - і легко створити інтервал довіри для цього зрушення місця.
Однак тест Вілкоксона-Манна-Вітні чутливий до інших видів різниці, ніж зміна місця розташування.
1212