Що саме робить непараметричний тест & Що ви робите з результатами?


22

У мене є відчуття, що це, можливо, просили в іншому місці, але не дуже з типом базового опису, який мені потрібен. Я знаю, що непараметричні покладаються на медіану замість середнього для порівняння ... чогось. Я також вважаю, що він покладається на "ступінь свободи" (?) Замість стандартного відхилення. Виправте мене, якщо я помиляюся.

Я провів досить хороші дослідження, або я так подумав, намагаючись зрозуміти концепцію, що працює за цим, що насправді означають результати тестування та / або що навіть робити з результатами тесту; однак, здається, ніхто ніколи не заходив у цю область.

Для простоти давайте дотримуємось U-тесту Манна-Уітні, який я помітив, є досить популярним (а також, здавалося б, неправомірним і занадто зловживаним, щоб змусити свою «квадратну модель» у отвір для кола). Якщо ви хочете описати інші тести, так само почувайтеся вільними, хоча я відчуваю, що колись я розумію, я можу зрозуміти інші аналогічно до різних тестів тощо.

Скажімо, я запускаю непараметричний тест зі своїми даними і отримую цей результат назад:

2 Sample Mann-Whitney - Customer Type       

Test Information        
H0: Median Difference = 0       
Ha: Median Difference ≠ 0       

Size of Customer    Large   Small
Count                    45    55
Median                    2     2

Mann-Whitney Statistic: 2162.00 
p-value (2-sided, adjusted for ties):   0.4156  

Я знайомий з іншими методами, але чим тут відрізняється? Чи потрібно, щоб значення р було нижчим за 0,05? Що означає "статистика Манна-Вітні"? Чи є для цього користь? Чи тут ця інформація просто підтверджує чи не підтверджує, що певне джерело даних, яке я маю, повинно бути чи не слід використовувати?

У мене є достатній досвід роботи з регресією та основами, але мені дуже цікаво про цей "особливий" непараметричний матеріал - який, я знаю, матиме свої недоліки.

Уявіть собі, що я п’ятикласник, і подивіться, чи можете ви мені це пояснити.


4
Так, я читав це багато разів. Іноді жаргон, який використовує вікіпедія, може стати непосильним, і хоча він має точний опис - він не обов'язково має чіткий опис того, хто починає намагатися вивчити цю область. Не впевнений, хто підкорив, але я законно хочу просто базового, ЧИСТОГО пояснення, який майже кожен міг зрозуміти. Так, я дуже намагався знайти когось вірити чи ні. Немає необхідності миттєво заступати мене та посилати на wikipedia. Хтось коли-небудь помічав, як деякі вчителі кращі за інших? Я шукаю хорошого «вчителя» для концепції, на якій я застряг.
Таал

1
Потім перейдіть до хорошого базового непараметричного тексту статистики, такого як Шпрент і Смітон, Голландер і Вулф, Коновер. або знайти вступний текст, який включає Манн-Вітні.
Нік Кокс

1
Перегляд вашого запитання та іншого питання, яке ви задали нещодавно, використовуючи лише Інтернет, не працює для вас, оскільки ви, очевидно, дуже заплутані. Ось чому @Peter Flom і я рекомендуємо книги. Я не маю інших пропозицій у запасі. Я також рекомендую - щиро і в інтересах Вашого - спробувати написати набагато більш стислі, менш балакачі запитання. Ваш дигресивний стиль не допомагає зрозуміти ваші запитання.
Нік Кокс

1
Сам Інтернет фактично працює краще, ніж будь-яка книга чи клас, коли-небудь робив для мене чесність - і це стосується будь-якої теми. Прошу вибачення за написання "балаканих" питань.
Таал

3
Ні, це, здається, не працює так добре, як хороша книга. Перефразовуючи Стівена Сенна, дивно, що статистика - це єдина наука, яку люди вимагають, щоб вона була зрозумілою на перший погляд.
Френк Харрелл

Відповіді:


41

Я знаю, що непараметричні покладаються на медіану замість середньої

Навряд чи будь-які непараметричні тести насправді "покладаються" на медіанів у цьому сенсі. Я можу подумати лише про пару ... і єдиний, на який я сподіваюся, що ви, ймовірно, навіть чули, - це тест на знаки.

порівнювати ... щось.

Якби вони покладалися на медіанів, імовірно, це було б порівняння медіанів. Але - незважаючи на те, що намагаються сказати вам ряд джерел - тести, такі як підписаний тест на ранг, або Вілкоксон-Ман-Уїтні або Крускал-Уолліс насправді взагалі не є випробуванням медіанів; якщо ви зробите деякі додаткові припущення, ви можете розцінювати Вілкоксона-Манна-Вітні та Крускал-Уолліса як тести медіанів, але за тих же припущень (доки існують засоби розповсюдження) ви могли б однаково вважати їх випробуванням засобів .

Фактична оцінка місцеположення, що відповідає тесту підписаного рангу, є медіаною парних середніх значень у зразку, середня для Вілкоксона-Манна-Вітні (і, як наслідок, у Крускал-Уолліса) є медіаною парних різниць між зразками .

Я також вважаю, що вона спирається на "ступінь свободи?" замість стандартного відхилення. Виправте мене, якщо я помиляюся.

Більшість непараметричних тестів не мають "ступенів свободи", хоча розподіл багатьох змінюється залежно від розміру вибірки, і ви можете вважати, що це дещо схоже на ступінь свободи в тому сенсі, що таблиці змінюються з розміром вибірки. Зразки, звичайно, зберігають свої властивості і мають у цьому сенсі n ступенів свободи, але ступінь свободи в розподілі тестової статистики, як правило, не є тим, що нас стосується. Може статися, що у вас є щось схоже на ступінь свободи - наприклад, ви, безумовно, можете зробити аргумент, що у Крускала-Уолліса є рівні свободи в основному в тому ж сенсі, що і в квадраті чі, але на нього зазвичай не дивляться таким чином (наприклад, якщо хтось говорить про ступінь свободи Крускала-Уолліса, вони майже завжди означатимуть

Добре обговорення ступенів свободи можна знайти тут /

Я провів досить хороші дослідження, або так думав, намагаючись зрозуміти концепцію, що працює за цим, що насправді означають результати тестування та / або що навіть робити з результатами тесту; однак, здається, ніхто ніколи не заходив у цю область.

Я не впевнений, що ти маєш на увазі під цим.

Я міг би запропонувати деякі книги, як-от практична непараметрична статистика Коновера , і якщо ви можете їх отримати, книга Нева та Уортінгтона ( Тести без розповсюдження ), але є багато інших - наприклад, Мараскуїло та Максвейні, Голландер і Вулф або книга Даніеля. Я пропоную вам прочитати щонайменше 3 чи 4 з тих, хто найкраще розмовляє з вами, бажано з тих, що пояснюють речі якомога інакше (це означало б хоча б прочитати трохи, можливо, 6 чи 7 книг, щоб знайти, наприклад, 3, що підходить).

Заради простоти дозволяємо дотримуватися тесту Mann Whitney U, який я помітив, є досить популярним

Саме це мене спантеличило у вашій заяві: "Ніхто, здається, ніколи не заходив у цю область" - багато людей, які використовують ці тести, роблять "заїзд у ту область", про яку ви говорили.

- а також, здавалося б, неправомірним та зловживаним

Я б сказав, що непараметричні тести, як правило, не використовуються, якщо що-небудь (включаючи Вілкоксона-Манна-Вітні) - більшість тестів на перестановку / рандомізацію, хоча я не обов'язково заперечую, що їх часто використовують (але так само параметричні тести, навіть тим більше).

Скажімо, я запускаю непараметричний тест зі своїми даними і отримую цей результат назад:

[сніп]

Я знайомий з іншими методами, але чим тут відрізняється?

Які ще методи ви маєте на увазі? З чим ти хочеш, щоб я порівняв це?

Редагувати: регресію ви згадуєте пізніше; Тоді я припускаю, що вам знайомий двопробний t-тест (оскільки це справді особливий випадок регресії).

Згідно з припущеннями для звичайного двопробного t-тесту, нульова гіпотеза передбачає, що дві сукупності однакові, проти альтернативи, що один з розподілів змістився. Якщо ви подивитесь на перший із двох наборів гіпотез Вілкоксона-Манна-Вітні нижче, то основне, що тестується там, майже однакове; просто t-тест базується на припущенні, що вибірки походять з однакових нормальних розподілів (крім можливого зрушення місця). Якщо нульова гіпотеза правдива, а супутні припущення є істинними, статистика тесту має t-розподіл. Якщо альтернативна гіпотеза вірна, то статистика тесту стає більшою ймовірністю приймати значення, які не виглядають узгодженими з нульовою гіпотезою, але виглядають узгодженими з альтернативою - ми зосереджуємось на найбільш незвичайному,

Ситуація дуже схожа з Вілкоксоном-Манном-Вітні, але відхилення від нуля воно вимірює дещо інакше. Насправді, коли припущення t-тесту є істинними *, це майже так само добре, як найкращий можливий тест (який є t-тестом).

* (що на практиці ніколи не буває, хоча це насправді не стільки проблема, скільки звучить)

wmw під нульовою та альтернативною

Дійсно, можна вважати Вілкоксона-Манна-Уітні ефективним «t-тестом», виконаним у рядах даних, хоча тоді він не має t-розподілу; статистика - це монотонна функція двопробної t-статистики, обчисленої на рядах даних, тому вона індукує те саме впорядкування ** на вибірковому просторі (тобто "t-тест" для рангів - належним чином виконується - генерував би ті ж значення p, що і у Вілкоксона-Манна-Вітні), тому він відкидає абсолютно ті самі випадки.

** (суворо, часткове замовлення, але залишимо це осторонь)

[Ви б могли подумати, що просто використання рангів викидає багато інформації, але коли дані беруться з звичайних груп з однаковою дисперсією, майже вся інформація про зміщення місцеположення знаходиться у шаблонах рангів. Фактичні значення даних (залежно від їх рангів) додають до цього дуже мало додаткової інформації. Якщо ви переходите на більш важкий, ніж звичайний, незадовго до того, як тест Вілкоксона-Манна-Вітні отримає кращу потужність, а також збереже свій номінальний рівень значущості, так що "зайва" інформація над званнями з часом стає не просто неінформативною, а в деяких почуття, введення в оману. Однак майже симетрична великоваговість - це рідкісна ситуація; те, що ви часто бачите на практиці, - це перекос.]

Основні ідеї досить схожі, p-значення мають таку ж інтерпретацію (ймовірність результату як, або більш екстремальна, якщо нульова гіпотеза була правдивою) - аж до інтерпретації зміни місця, якщо ви зробите необхідні припущення (див. обговорення гіпотез наприкінці цієї публікації).

Якби я зробив те саме моделювання, що і на графіках вище для t-тесту, графіки виглядали б дуже схоже - шкала на осях x і y виглядала б інакше, але базовий вигляд був би подібним.

Чи потрібно, щоб значення р було нижчим за 0,05?

Вам нічого не потрібно "бажати". Ідея полягає в тому, щоб з'ясувати, чи є зразки більш різними (в локальному сенсі), ніж можна пояснити випадково, а не "бажати" конкретного результату.

Якщо я кажу : «Можете чи ви піти подивитися , що колір автомобіля Raj є будь ласка?», Якщо я хочу об'єктивну оцінку цього я не хочу , щоб ви збираєтеся «Людина, я дуже, дуже сподіваюся , що це синій! Він просто повинен бути синій ». Найкраще просто побачити, яка ситуація, а не вступати з якимось «мені потрібно, щоб це було щось».

Якщо обраний вами рівень значущості становить 0,05, ви відкинете нульову гіпотезу, коли значення р буде нижче 0,05. Але відмова відхилити, якщо у вас достатньо великий розмір вибірки, щоб майже завжди виявляти відповідні розміри ефектів, принаймні так само цікаво, оскільки це говорить про те, що будь-які існуючі відмінності невеликі.

Що означає число "mann whitley"?

Манна-Уїтні статистики .

Це дійсно важливо лише порівняно з розподілом значень, яке він може приймати, коли нульова гіпотеза є істинною (див. Вищевказану діаграму), і це залежить від того, яке з декількох конкретних визначень може використовувати будь-яка конкретна програма.

Чи є для цього користь?

Зазвичай вам не байдуже точне значення як таке, але де воно лежить в нульовому розподілі (будь то більш-менш типовий для значень, які ви повинні бачити, коли нульова гіпотеза є правдивою чи більш екстремальною)

П(Х<Y)

Чи ці дані тут просто підтверджують чи не підтверджують, що певне джерело даних, яке я маю, повинно бути чи не слід використовувати?

Цей тест нічого не говорить про "певне джерело даних, які я маю потрібно або не слід використовувати".

Дивіться мою дискусію щодо двох способів розгляду гіпотез WMW нижче.

У мене є достатній досвід досвіду регресії та основ, але мені дуже цікаво про цей "особливий" непараметричний матеріал

У непараметричних тестах немає нічого особливого (я б сказав, що "стандартні" багато в чому навіть більш базові, ніж типові параметричні тести) - якщо ви насправді розумієте тестування гіпотез.

Це, мабуть, тема для іншого питання.


Існує два основні способи вивчення тесту гіпотези Вілкоксона-Манна-Вітні.

i) Потрібно сказати: "Мене цікавить зміна місця розташування - тобто, за нульовою гіпотезою, дві групи мають однаковий (безперервний) розподіл , проти альтернативи, яку" зміщують "вгору або вниз відносно інший"

Wilcoxon-Mann-Whitney працює дуже добре, якщо ви зробите це припущення (що ваша альтернатива - це лише зміна місця розташування)

У цьому випадку Вілкоксон-Манн-Вітні насправді є тестом для медіанів ... але в рівній мірі це випробування на засоби, або взагалі будь-яку іншу статистику, еквівалентну за місцем розташування (наприклад, 90-й відсоток, або підстрижені засоби, або будь-яку кількість інші речі), оскільки всі вони однаково впливають на зміну місцезнаходження.

Приємно в цьому те, що це дуже легко інтерпретувати - і легко створити інтервал довіри для цього зрушення місця.

зміна місця розташування

Однак тест Вілкоксона-Манна-Вітні чутливий до інших видів різниці, ніж зміна місця розташування.

1212

зсув P (X <Y) від 1/2


Я намалював приблизний нульовий розподіл (той, який червоним кольором у новому верхньому графіку) так, ніби він є безперервним ... але фактичний розподіл дискретний. Малюнок таким чином менш захаращений.
Glen_b -Встановіть Моніку

3
+1 Відмінна відповідь. Одне з найкращих і найдоступніших пояснень тесту Вілкоксона-Манна-Вітні, яке я знаю. Дякую.
COOLSerdash

"У цьому випадку Вілкоксон-Манн-Вітні насправді є тестом для медіанів ... але однаково це і тест на засоби" Однак деякі розподіли не мають засобів, тоді як їх медіана чітко визначена (наприклад, Коші).
каракал

@caracal Хоча правда (це я вже не раз робив тут), якщо хтось тестує на рівність населення, мабуть, вони вже вважають, що чисельність населення є обмеженою. Якщо цього немає, у них виникають проблеми задовго до того, як вони добираються до вибору тесту. Беручи до уваги, що існує гіпотеза про рівну (і, таким чином, кінцеву) сукупність засобів, за тими самими припущеннями, які зазвичай використовуються для того, щоб зробити її тестом для медіанів (змінних альтернатив), WMW є також випробуванням засобів.
Glen_b -Встановіть Моніку

17

Припустимо, ми з вами тренерські трекові команди. Наші спортсмени походять із однієї школи, мають аналогічний вік і таку саму стать (тобто вони походять з одного населення), але я стверджую, що відкрив нову революційну систему тренувань, яка змусить членів моєї команди бігати набагато швидше, ніж твій. Як я можу вас переконати, що це справді працює?

У нас гонка.

Після цього я сідаю і обчислюю середній час для членів моєї команди та середній час для членів вашої команди. Я буду претендувати на перемогу, якщо середній час для моїх спортсменів буде не тільки швидшим, ніж середній для ваших, але різниця також велика порівняно з "розсипом" або стандартним відхиленням наших результатів.


т


"Але Метт, ти скаржишся," це не зовсім справедливо. Наші команди досить схожі, але ти - завдяки чистому шансу - опинився найшвидшим бігуном в окрузі. Він не в тій же лізі, що і всі інше, він практично виродком природи. Він закінчив за 3 хвилини до наступного найшвидшого фінішера, що значно скорочує ваш середній час, але решта конкурентів досить рівномірно змішані. Давайте подивимось замість фінішного порядку. Якщо ваш метод Дійсно працює, більш ранні фінішники повинні здебільшого бути у вашій команді, але якщо це не фінішний порядок, він повинен бути досить випадковим. Це не додасть вашої суперзірки надмірної ваги! "


т

p

ттт


Ви фактично відповіли на моє запитання саме так, а я маю на увазі саме так, як я хотів, щоб на нього відповіли. Глен також перейшов на математичну сторону, і поєднання цих двох відповідей зробило для мене клацання. Я не можу відібрати від нього нагороду - я маю на увазі ... він малює графіки, незважаючи на ясність вашої відповіді. У мене є відчуття, що ти раніше займався викладацькою роботою. Я знаю, що тут можуть бути деякі узагальнення у відповідях, але я знав, що мені не потрібно купувати книгу та інтенсивно її вивчати, щоб почати мати можливість застосовувати непараметричні показники на якомусь рівні
Taal

т

Іронія всього цього полягає в тому, що я, мабуть, не буду його використовувати, мабуть, це просто непокоїло мене, що я не можу отримати прямої відповіді на те, що це було. Відповідь Глена набагато більше, ніж я очікував і отримав спочатку - найкращі відповіді, які я вважаю, я не можу описати, оскільки будь-який опис виявиться неадекватним. Як сказати комусь, як виглядає синій колір. Якщо ви читали будь-які речі, що виходять, то це здається, що ви можете мати подібний аромат ...
Taal


6

Ви попросили вас виправити, якщо не так. Ось кілька коментарів під цим заголовком, щоб доповнити позитивні пропозиції @Peter Flom.

  • "непараметричний покладається на медіану замість середньої": часто на практиці, але це не визначення. Кілька непараметричних тестів (наприклад, хі-квадрат) не мають нічого спільного з медіанами.

  • покладається на ступінь свободи замість стандартного відхилення; це дуже заплутано. Ідея ступенів свободи в жодному сенсі не є альтернативою стандартному відхиленню; ступеня свободи як ідеї застосовується прямо в статистиці.

  • "певне джерело даних, яке я маю, не повинно використовуватись або не повинно використовуватися": це запитання не має нічого спільного з тестом значущості, який ви застосували, що стосується лише різниці між підмножинами даних і формулюється з точки зору різниці між медіанами.


Я вважаю, що ваша відповідь на мене з проханням "виправити там, де не так" - найкраща відповідь досі. Я вважаю, що мені потрібно було спростувати кілька нульових гіпотез або вивчити в процесі усунення. Ваша відповідь дала мені нову інформацію, яку я розумію - у моєму розумінні теми є ще великі дірки, але я не можу очікувати досконалості. Можливо, ці діри є більшими, ніж я спочатку передбачав, коли писав це запитання, і зміна stackexchange не буде достатньо, як би "балаканий" я не робив питання.
Таал

4

Ви "хочете" ті самі речі з р-значення, які ви хочете в будь-якому іншому тесті.

U статистика є результатом обчислення, подібно до статистики t, коефіцієнта шансів, статистики F або того, що ви маєте. Формулу можна знайти в багатьох місцях. Це не дуже інтуїтивно, але тоді, як і інші тестові статистичні дані, поки ви не звикнете до них (ми визнаємо, що з 2-х знаходяться у значному діапазоні, оскільки ми їх постійно бачимо).

Решта результатів у вашому тексті блоку повинна бути чіткою.

Для більш загального вступу до непараметричних тестів я відгукуюся @NickCox .... отримую хорошу книгу. Непараметричний просто означає «без параметрів»; існує безліч непараметричних тестів та статистичних даних для найрізноманітніших цілей.


Так, в ідеалі хороша книга допомогла б; однак, це здається непотрібним із сьогоднішніх ресурсів (наприклад, stackexchange), wikipedia (іноді), конкуренції на ринку YouTube (чи знаєте ви, що за кожен мільйон переглядів хтось отримує їм зарплату в 4000 доларів?), а також різноманітні інші ресурси. Я взагалі, як і мій стиль навчання, дуже важко провалююсь і в простому книжковому навчанні.
Таал

1
Я вдячний за ваш пост, проте він насправді повторює більшість того, що я вже знаю або на жаль припустив. Здається, є якась закономірність, де майже кожне пояснення, яке я отримую, зупиняється на цій конкретній точці. Можливо, саме цей момент стає занадто складним для пояснення чи занадто великих зусиль - я не впевнений. Так чи інакше, це зразок, який я відчував із кожного джерела інформації, який я зазвичай використовую - який іронічно повторює заяву кожного про книгу. Можливо, я не зрозумів, що відповідь була такою складною; потім знову я побачив якусь інтенсивну відповідь на SE.
Таал

2
Спочатку ти просиш нас спростити, потім ти скаржишся, що наші відповіді прості! Якщо ви хочете зрозуміти формулу для U (або що-небудь ще), ПОШУЙТЕ в ній. Якщо ви хочете чогось простого, тоді не вимагайте складностей! Запис у Вікіпедії - це відмінний, детальний запис із усіма подробицями. Ви цього не розумієте. Так. Що ти хочеш?
Пітер Флом - Відновити Моніку

1
Я гадаю, десь посередині. Я, правда, не найкращий у спілкуванні, і я можу зрозуміти, що ти розчарований, так. Це моя особливість, яку я насправді дуже знаю. Якщо чесно, я думаю, що мені доведеться подумати про те, що я дійсно хочу - так як це майже так, як я намагаюся досить підсунути питання до того, де воно перетинається на область, про яку я не знав або раніше не знав о. Важко запитати про щось, чого ти взагалі не розумієш. Мені просто доведеться повернутися до цього, мабуть.
Таал

1

Як відповідь на нещодавно закрите питання , це стосується і вище. Нижче наводимо цитату з класичних Бредлі статистичних тестів без розподілу (1968, стор. 15–16), які, на мою думку, є досить чітким поясненням.

Терміни непараметричні та без розподілу не є синонімами, і norterm забезпечує цілком задовільний опис класу статистики, на який вони мають посилатися ... Грубо кажучи, непараметричний тест - це той, який не дає гіпотези про значення параметра у функції статистичної щільності, тоді як тест без розподілу - це те, що не дає припущень щодо точної форми вибіркової сукупності. Визначення не є взаємовиключними, і тест може бути як розподільним, так і параметричним. Для того, щоб бути повністю зрозумілим, що розуміється під вільним розподілом, слід розрізняти три розподіли: вибіркове населення; (b) характеристика спостереження, фактично використана тестом; та (c) статистичні дані тесту. Розподіл, за допомогою якого "тести" є "безкоштовними", є розподілом (а) вибіркової сукупності. І свобода, якою вони користуються, зазвичай відносна. Однак припущення ніколи не є настільки чіткими, що передбачають населення, розподіл якого повністю уточнено ... Причина ... дуже проста: величини не використовуються як такі в [непараметричному] тесті, також немає жодного іншого сильно пов'язаного атрибута сукупності змінної. Натомість також немає жодного іншого сильно пов'язаного атрибута сукупності змінної. Натомість також немає жодного іншого сильно пов'язаного атрибута сукупності змінної. Натомістьзразок -зв'язано charachteristics з отриманих спостережень ... забезпечити informatikon , використовуваний тестової статистикою. ... Таким чином , в той час як параметричні і непараметричні тести вимагають, щоб форма і в розподілі, пов'язана зі спостереженнями, повністю відома, що знання, в параметричному випадку, як правило, немає майбутнього оголошення, тому необхідний розподіл величин повинен бути "припущений" або виведений на основі наближеної або неповної інформації. У непараметричному випадку, з іншого, і - розподіл характеристики спостереженнязазвичай відомий саме з апріорних міркувань і тому їх не слід «припускати». Отже, відмінність полягає не в необхідності, а в тому, що потрібно, і впевненості, що ця вимога буде виконана.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.