Чи застосовується «Теорема без вільного обіду» для загальних статистичних тестів?


12

Жінка, для якої я працював, попросила мене зробити ANOVA в одну сторону за деякими даними. Я відповів, що дані були повторними заходами (часовими рядами) і вважаю, що припущення про незалежність порушено. Вона відповіла, що я не повинен турбуватися про припущення, просто зробіть тест, і вона врахує, що припущення, можливо, не були виконані.

Це мені не здавалося правильним. Я провів кілька досліджень і знайшов цю чудову допис у блозі Девіда Робінсона, K - означає, що кластеризація не є безкоштовним обідом , який піддав мене теоремі "Безкоштовний обід". Я переглянув оригінальний папір і деякі наступні речі, і, відверто кажучи, математика трохи над головою.

Суть цього - за словами Девіда Робінсона - здається, що сила статистичного тесту виходить із його припущень. І він наводить два чудових приклади. Коли я переглядаю інші статті та повідомлення в блогах про це, схоже, на це завжди посилаються або під керуванням навчанням, або з пошуку.

Отже, моє запитання: чи ця теорема застосовується взагалі до статистичних тестів? Іншими словами, чи можна сказати, що сила t-тесту або ANOVA походить від його прихильності до припущень, і навести теорему "Без вільного обіду"?

Я завдячую моєму колишньому начальнику остаточним документом щодо роботи, яку я зробив, і хотів би знати, чи можу я посилатись на Теорему безвічного обіду, заявивши, що ви не можете просто проігнорувати припущення статистичного тесту і сказати, що ви це врахуєте врахування при оцінці результатів.


4
Чому б вам просто не зробити «таємно» повторні заходи ANOVA?
Хорст Грюнбуш

1
@ HorstGrünbusch Насправді дані та тестування обговорювались на форумі раніше, з конкретними питаннями щодо повторних заходів ANOVA, і виявляється, що лінійна модель змішаних ефектів, мабуть, найкращий вибір.
rwjones

2
На це вже добре відповіли, тому можна додати більш нескінченну відповідь. Ви можете запитати свого начальника, як саме вона врахує наслідки порушення припущень ("бути обережним" було б краще, ніж нічого!). Коротше кажучи, це довгий і важкий шлях, щоб отримати достатньо розуміння та досвіду, щоб знати, коли ти можеш бути недбалим щодо припущень. Поза межами ANOVA Руперта Г. Міллера (Нью-Йорк: Wiley, 1986 та пізніші перевидання) є хорошим джерелом наслідків, і головна тема в ньому полягає в тому, що ігнорування припущень щодо незалежності - одна з найнебезпечніших речей, яку ви можете зробити.
Нік Кокс

1
@ NickCox Ну, вона вже не мій начальник, і саме ця ситуація є основною причиною. В основному це було кульмінацією багато неохайного мислення та неохайного управління проектами з її боку в інакше пристойному дослідницькому середовищі. Це вбік, дякую за книжкову рекомендацію. З огляду на це, це одна з речей, яку я хочу навести у своєму заключному звіті.
rwjones

Відповіді:


11

Я не знаю доказів, але, думаю, це стосується цілком загального характеру. Приклад - експеримент з 2 суб'єктами в кожній з 2 груп лікування. Тест Вілкоксона не може бути значущим на рівні 0,05, але t-тест може. Можна сказати, що його потужність виходить більше половини з припущень, а не лише з даних. До вашої первинної проблеми не доцільно діяти так, як ніби спостереження за кожним суб'єктом не залежать. Беручи до уваги речі після факту, звичайно, не є хорошою статистичною практикою, за винятком дуже особливих обставин (наприклад, кластерні сендвіч-оцінки).


2

Ви можете навести теорему "Без вільного обіду", якщо хочете, але ви також можете просто навести Модус Поненс (також відомий як Закон про відмову , основу дедуктивних міркувань), що є коренем теореми "Без вільного обіду" .

Теорема " Без вільного обіду" охоплює більш конкретну ідею: той факт, що не існує алгоритму, який би міг відповідати всім цілям. Іншими словами, теорема "Без вільного обіду" в основному говорить про відсутність алгоритмічної магічної кулі . Це коріння у Modus Ponens, оскільки для алгоритму чи статистичного тестування, щоб дати правильний результат, потрібно задовольнити передумови.

Як і у всіх математичних теоремах, якщо ви порушуєте припущення, то статистичний тест просто порожній, і ви не можете отримати з нього жодної правди. Отже, якщо ви хочете пояснити свої дані за допомогою свого тесту, ви повинні припустити, що потрібні умови виконуються, якщо їх немає (і ви це знаєте), то ваш тест невірний.

Це тому, що наукове обґрунтування базується на дедукції: в основному ваш тест / закон / теорема - це правило імплікації , яке говорить про те, що якщо у вас є припущення, Aви можете зробити висновок B: A=>Bале якщо у вас цього немає A, ви можете мати Bабо ні B, і обидва випадки є істинними , це один з основних принципів логічного виведення / дедукції (правило Modus Ponens). Іншими словами, якщо ви порушите передумови, результат не має значення, і ви нічого не можете вивести .

Запам’ятайте двійкову таблицю наслідків:

A   B   A=>B
F   F    T
F   T    T
T   F    F
T   T    T

Тож у вашому випадку, для спрощення, у вас є Dependent_Variables => ANOVA_correct. Тепер, якщо ви використовуєте незалежні змінні, таким чином, Dependent_Variablesє False, то імплікація буде істинною, оскільки Dependent_Variablesприпущення порушено.

Звичайно, це спрощено, і на практиці ваш тест ANOVA може все-таки повернути корисні результати, оскільки майже завжди існує певна ступінь незалежності між залежними змінними, але це дає вам уявлення, чому ви просто не можете покластися на тест, не виконавши припущення. .

Однак ви також можете використовувати тести, які не задовольняють оригінал, зменшуючи проблему: явно послаблюючи обмеження незалежності, ваш результат все ще може бути значимим, але не гарантованим (адже тоді ваші результати стосуються зменшеної проблеми, а не повна проблема, тому ви не можете перекладати всі результати, за винятком випадків, коли зможете довести, що додаткові обмеження нової проблеми не впливають на ваш тест і, отже, на ваші результати).

На практиці це часто використовується для моделювання практичних даних, наприклад, за допомогою Naive Bayes, шляхом моделювання залежних (замість незалежних) змінних, використовуючи модель, яка передбачає незалежні змінні, і дивно, що це працює дуже добре, а іноді і краще, ніж моделі обліку для залежностей . Вас також може зацікавити це питання про те, як користуватися ANOVA, коли дані не відповідають усім очікуванням .

Підсумовуючи це: якщо ви маєте намір працювати над практичними даними, і ваша мета - не довести який-небудь науковий результат, а створити систему, яка просто працює (тобто веб-сервіс або будь-яке практичне застосування), припущення про незалежність (а можливо й інші припущення) Ви можете розслабитися, але якщо ви намагаєтеся вивести / довести якусь загальну істину , то завжди слід використовувати тести, які ви можете математично гарантувати (або принаймні безпечно і доказово припустити), що ви задовольняєте всі умови .


2
Якщо я правильно розумію ваш аргумент, ви почнете з того, що жодне застосування статистичних даних, щодо яких припущення точно не виконані, не є дійсним. Якщо це правда, це дуже погані новини. Більшість економетричних книг (щоб навести лише один приклад) проводять свій час, пояснюючи, що це неправильно (односкладне резюме) і детально точно чому. Однак ви, здається, змінюєте свою пробірку в середині, і те, що ви виступаєте натомість, тоді нечітко. Якимсь чином робота над даними може бути здоровою, навіть якщо вона логічно недійсна. Тому я не бачу чіткої поради.
Нік Кокс

Справа в тому, що якщо приміщення порушено, ви не можете приймати результати тесту за номіналом, оскільки умовивід є необ'єктивним. Однак ви все одно можете спробувати, і якщо ви досить впевнені і досвідчені, ви все одно можете щось вийти з цього, але в основному на практичних реалізаціях, де насправді вам не байдуже наукове обґрунтування (ви просто намагаєтеся моделювати дані для якоїсь практичної мети, не намагаючись викласти якусь обґрунтовану загальну правду про світ). Тож моя відповідь - це не «односкладне резюме», це лише загальний випадок (неправильний) проти конкретного випадку (може бути нормально).
габоровий

PS: Моє твердження стосується не лише статистичних програм, а будь-яких застосувань будь-якої логічної чи математичної теореми / правила / тесту, це стосується будь-яких міркувань із використанням висновку та індукції. Але мене цікавлять ваші посилання на книги з економетрики, інша відповідь, яку ви надали в коментарі до питання ОП, була дуже доречною.
габоровий

Дякую за те, що ви додали коментар, але мушу сказати, що я не вважаю вашу заяву особливо чіткою або обґрунтованою. Я не бачу, що працюючі вчені (я одна) зрозуміють ваше розмежування між аналізом даних для наукових міркувань та практичних цілей. Я залишу його там, крім того, щоб похвалити підручники, такі як книги Джеффа Вулдріджа, як насправді розширені нариси, щодо яких припущення мають вирішальне значення, а ні, і велика сіра область між ними. amazon.com/Jeffrey-M.-Wooldridge/e/B001IGLWNY
Нік Кокс

Дякую за довідку. Щойно я знайшов ще одне питання, де вони згадують документ, в якому пояснюється, чому наївні припущення про незалежність все ще можуть працювати на даних із залежними змінними: "Документ, здається, доводить, що (наївні) баїси хороші не лише тоді, коли функції незалежні, але і коли залежності функції один у одного схожі / протилежні між функціями " stats.stackexchange.com/a/23491/25538
gaborous
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.