Чи є статистичний тест, параметричний і непараметричний? Це питання було задано групою співбесіди. Чи правильно це питання?
Чи є статистичний тест, параметричний і непараметричний? Це питання було задано групою співбесіди. Чи правильно це питання?
Відповіді:
Принципово важко точно сказати, що означає "параметричний тест" і "непараметричний тест", хоча є багато конкретних прикладів, де більшість погодиться, чи є тест параметричним чи непараметричним (але ніколи і те й інше) . Швидкий пошук дав цю таблицю , яка, на мою думку, являє собою загальну практичну відмінність у деяких областях між параметричними та непараметричними тестами.
Трохи над згаданою таблицею є зауваження:
"... параметричні дані мають основний нормальний розподіл .... Все інше є непараметричним."
В деяких областях може бути прийнятим критерієм, що або ми припускаємо нормальність і використовуємо ANOVA, і це параметрично, або ми не припускаємо нормальності і не використовуємо непараметричні альтернативи.
Це, можливо, не дуже вдале визначення, і на мою думку це не дуже правильно, але це може бути практичне правило. Переважно тому, що кінцевою метою у суспільних науках, скажімо, є аналіз даних, а що корисного в тому, щоб мати можливість сформувати параметричну модель, засновану на ненормальному розподілі, а потім не мати можливості аналізувати дані?
Альтернативним визначенням є визначення "непараметричних тестів" як тестів, які не покладаються на припущення щодо розподілу та параметричні тести, як будь-що інше.
Перше, а також подане останнє визначення визначає один клас тестів, а потім визначає другий клас як доповнення (все інше). За визначенням це виключає, що тест може бути як параметричним, так і непараметричним.
Правда полягає в тому, що також останнє визначення є проблематичним. Що робити, якщо є певні природні "непараметричні" припущення, такі як симетрія, які можуть бути нав'язані? Чи перетворить це тестову статистику, яка інакше не покладається на будь-які припущення щодо розподілу, у параметричний тест? Більшість сказала б ні!
Отже, в класі непараметричних тестів є тести, яким дозволяється робити деякі розподільні припущення тих пір, поки вони не є "занадто параметричними". Межа між тестами "параметричний" та "непараметричний" стала розмитою, але я вважаю, що більшість буде підтримувати тест параметричний або непараметричний, можливо, це не може бути ні тим, що говорити, що це обидва мало сенсу.
Вважаючи іншу точку зору, багато параметричних тестів є (еквівалентними) тестами співвідношення ймовірності. Це робить можливою загальну теорію, і ми маємо єдине розуміння розподільних властивостей тестів відношення ймовірності за відповідних умов регулярності. Непараметричні тести, навпаки, не еквівалентні тестам співвідношення ймовірності самі по собі немає ймовірності - і без уніфікованої методології, заснованої на ймовірності, нам доведеться отримувати результати розподілу залежно від конкретного випадку. Теорія емпіричної ймовірностіОднак, розроблений в основному Арт Оуен в Стенфорді, є, однак, дуже цікавим компромісом. Він пропонує імовірнісний підхід до статистики (важливий момент для мене, оскільки я вважаю, що ймовірність є більш важливим об'єктом, ніж -значення, скажімо) без необхідності типових параметричних припущень розподілу. Фундаментальна ідея полягає в розумному використанні мультиноміального розподілу на емпіричних даних, методи є дуже «параметричними», але при цьому дійсні без обмеження параметричних припущень.
Тести, засновані на емпіричній ймовірності, мають ІМХО, достоїнства параметричних тестів та загальність непараметричних тестів, отже, серед тестів, які я можу придумати, вони наближаються до кваліфікації як параметричних, так і непараметричних, хоча я б не використовувати цю термінологію.
Параметричний використовується в (принаймні) двох значеннях: A - Щоб заявити, ви припускаєте сімейство розподілу шуму до його параметрів. B - Щоб заявити, ви припускаєте специфічну функціональну залежність між пояснювальними змінними та результатом.
Деякі приклади:
Термін "напівпараметричний", як правило, відноситься до випадку B і означає, що ви не приймаєте на себе ціле функціональне відношення, а навпаки, у вас є більш м'які припущення, такі як "добавка в деякій плавній трансформації прогнозів".
Ви також можете мати більш м'які припущення щодо розподілу шуму - наприклад, "усі моменти скінченні", не конкретизуючи форму розподілу. Наскільки мені відомо, для цього типу припущення немає терміна.
Зауважимо, що відповідь стосується основних припущень, що стоять за процесом генерування даних. Кажучи "параметричний тест", зазвичай, йдеться про непараметричне в сенсі А. У цьому, що ви мали на увазі, тоді я відповів би "ні". Бути неможливо одночасно бути параметричним і непараметричним в одному сенсі.
Я гадаю, що залежить від того, що вони означають під "параметричними та непараметричними"? В той же час точно обоє, чи суміш двох?
Багато хто вважає модель пропорційної небезпеки Кокса напівпараметричною, оскільки вона параметрично не оцінює базову небезпеку.
Або ви можете переглянути багато непараметричних статистичних даних як фактично масові параметричні.
Бредлі у своїх класичних статистичних тестах без розподілу (1968, стор. 15–16 - див. Це питання для цитати) пояснює різницю між тестами без розподілу та непараметричними , які, за його словами, часто пов'язані між собою, і дає Приклад параметричного тесту без розподілу як тест Знак для медіани. Цей тест не передбачає припущення про базовий розподіл вибіркової сукупності змінних значень, тому він не є розподілом . Однак якщо вибрана медіана правильна, значення вище та нижче її слід вибирати з однаковою ймовірністю, випробовуючи випадкові вибірки з
Оновлення