Статистичні умовиводи при неправильній специфікації моделі


9

У мене є загальне методологічне запитання. На це можна було відповісти і раніше, але я не в змозі знайти відповідну тему. Я буду вдячний вказівниками на можливі дублікати.

( Ось чудовий, але без відповіді. Це також схоже за духом, навіть з відповіддю, але остання занадто специфічна з моєї точки зору. Це також близько, виявлено після публікації запитання.)


Тема полягає в тому, як зробити дійсні статистичні умовиводи, коли модель, сформульована перед переглядом даних, не в змозі адекватно описати процес генерації даних . Питання дуже загальне, але я запропоную конкретний приклад, щоб проілюструвати суть. Однак я очікую, що відповіді зосереджуватимуться на загальному методологічному питанні, а не придумувати деталі конкретного прикладу.


Розглянемо конкретний приклад: у налаштуваннях часових рядів я вважаю, що процес генерування даних є таким

(1)yt=β0+β1xt+ut
з uti.i.N(0,σu2). Я маю на меті перевірити предметну гіпотезу, щоdydx=1. Я вважаю це моделлю(1) щоб отримати працездатний статистичний аналог моєї предметної гіпотези, і це
H0: β1=1.
Все йде нормально. Але спостерігаючи за даними, я виявляю, що модель недостатньо описує дані. Скажімо, існує лінійна тенденція, так що справжній процес генерації даних є
(2)yt=γ0+γ1xt+γ2t+vt
з vti.i.N(0,σv2).

Як я можу зробити достовірний статистичний висновок щодо своєї гіпотези з предметної теми dydx=1?

  • Якщо я використовую оригінальну модель, її припущення порушуються і оцінювач β1не має приємного розповсюдження, яке інакше було б. Тому я не можу перевірити гіпотезу, використовуючиt-тест.

  • Якщо, побачивши дані, я переходжу від моделі (1) до (2) і змінити мою статистичну гіпотезу H0: β1=1 до H0: γ1=1, модельні припущення задоволені, і я отримав добре оцінений оцінювач γ1 і може протестувати H0 без особливих труднощів використовувати t-тест.
    Однак перехід від(1) до (2)повідомляється набором даних, на яких я хочу перевірити гіпотезу. Це обумовлює розподіл оцінювача (а отже, і висновок) залежно від зміни базової моделі, що пояснюється спостережуваними даними. Зрозуміло, що введення такого кондиціонування не є задовільним.

Чи є хороший вихід? (Якщо не частоліст, то, можливо, якась байєська альтернатива?)


3
Ваш дискомфорт є ендемічним для класичних підходів до присудження кандидатів наук: ретельна специфікація гіпотез, а потім емпіричний тест і закінчення описовим причинним висновком. У цьому світі коротка відповідь - «ні», виходу немає. Однак світ розвивається далеко від цієї суворої парадигми. Наприклад, у статті, проведеній в минулому році в AER під назвою "Проблеми з прогнозуванням політики " Кляйнберга та ін., Вони використовуються для видобутку даних та прогнозування як корисних інструментів для формування економічної політики, посилаючись на випадки, коли "причинний висновок не є центральним, або навіть необхідні ». Це варто подивитися.
Майк Хантер

2
На мою думку, прямою відповіддю було б, щоб не було виходу. В іншому випадку ви будете винні в найгіршому роді видобутку даних - переробці гіпотез, щоб вони відповідали даним - серйозним правопорушенням у суворому, парадигматичному світі.
Майк Хантер

3
Якщо я правильно розумію, ви збираєте дані, потім вибираєте модель і потім тестуєте гіпотези. Я можу помилятися, але мені здається, що селективна парадигма висновку, яку досліджували Тейлор і Тібширані (серед інших), може бути пов'язана з вашою проблемою. В іншому випадку коментарі, відповіді та пов'язані відповіді на це питання можуть зацікавити.
DeltaIV

3
@DeltaIV, тобто, роблячи умовивід, мене не цікавлять найменш помилкові параметри, як під P-консистенцією, а, швидше, мене цікавлять справжні (справжня часткова похіднаy wrt x).
Річард Харді

3
@ RichardHardy, звичайно, незважаючи на те, що є студентом статистики, я більше не вірю у висновки. Це будинок карт настільки крихкий, що незрозуміло, чи має це взагалі значення, за винятком дуже суворих і контрольованих обставин. Що смішно, це те, що всі це знають, але ніхто (ну) не переймається.
hejseb

Відповіді:


3

Вихід - це буквально не зразковий тест, справжній. Не той, де ви розділили вибірку на тренування і протримаєтесь, як у перекваліфікації, а справжній прогноз. Це дуже добре працює в природничих науках. Насправді це єдиний спосіб роботи. Ви будуєте теорію на деяких даних, тоді, як ви очікуєте, придумаєте щось, що ще не спостерігалося. Очевидно, що це не працює в більшості соціальних (так званих) наук, таких як економіка.

У галузі це працює, як і в науках. Наприклад, якщо алгоритм торгівлі не працює, з часом ви втратите гроші, а потім відмовитеся від них. Перехресні набори даних та навчальні набори широко використовуються при розробці та прийнятті рішення про розгортання алгоритму, але після того, як він буде у виробництві, все залежить від заробітку або втрати. Дуже простий тестовий зразок.


Чи допомагає це оцінити? yx?
Річард Харді

@RichardHardy, так, ви перевіряєте ту саму гіпотезу щодо нових даних. Якщо так, то ви добрі. Якщо ваша модель неправильно визначена, то вона з часом може вийти з ладу, я маю на увазі і інші діагностики. Ви повинні побачити, що модель не працює з новими даними.
Аксакал

Гаразд, тоді це звучить як старий гарний припис розщеплення зразка на піддіапазон для побудови моделі та інший для тестування гіпотез. Я мав би включити цю думку вже в ОП. У будь-якому випадку це здається здоровою стратегією. Наприклад, проблема з макроекономікою полягала б у тому, що однакова модель майже ніколи не підходитиме добре до невидимих ​​даних (оскільки процес генерування даних змінюється з часом), тому точно така ж проблема, з якої ми починаємо, буде зберігатися. Але це приклад, коли в основному будь-який метод не вдається, тому це не є справедливою критикою.
Річард Харді

Тим часом, в галузі мікроекономіки при встановленні даних поперечного перерізу це може працювати. Поки що +1 З іншого боку, щойно модель підходить до всіх наявних даних, це рішення не працюватиме. Я думаю, що саме про це я думав, коли писав запитання, і шукаю відповіді, які стосуються заголовного питання: висновок з неправильно уточненої моделі.
Річард Харді

2
Я співчуваю вашому погляду. Але оскільки поділ вибірки на "стару" і "нову" еквівалентна збору нових даних, я не розумію, де ви бачите велику різницю між ними.
Річард Харді

1

Ви можете визначити "комбіновану процедуру" та дослідити її характеристики. Скажімо, ви починаєте з простої моделі і дозволяєте встановити одну, дві або три більш складні (або непараметричні) моделі, якщо проста модель не підходить. Вам потрібно вказати формальне правило, згідно з яким ви вирішите не підходити до простої моделі, а до однієї з інших (і до якої). Вам також потрібно провести тести, щоб ваша гіпотеза, що цікавить, застосовувалась у всіх задіяних моделях (параметричних або непараметричних).

За допомогою такої установки ви зможете змоделювати характеристики, тобто з яким відсотком ваша нульова гіпотеза остаточно відхиляється у випадку, якщо вона правдива, та у випадку кількох відхилень, що цікавлять. Також ви можете імітувати з усіх моделей, що беруть участь, та дивитись на такі речі, як умовний рівень та умовна потужність, враховуючи, що дані надходили з моделі X, Y або Z, або з огляду на те, що процедура тестування неправильної специфікації обрана модель X, Y або Z.

Ви можете виявити, що вибір моделі не приносить великої шкоди в тому сенсі, що досягнутий рівень все ще дуже близький до рівня, на якому ви були після, і потужність в порядку, якщо не чудова. Або ви можете виявити, що вибір моделі, що залежить від даних, дійсно накручує речі; це залежатиме від деталей (якщо ваша процедура вибору моделі дуже надійна, шанси рівні і на потужність впливати не буде дуже сильно).

Тепер це не зовсім те саме, що вказати одну модель, а потім переглянути дані та вирішити "о, мені потрібна інша", але це, мабуть, так близько, як ви можете підійти до дослідження, які були б характеристики такого підходу. Це не банально, тому що вам потрібно зробити ряд варіантів, щоб досягти цього.

Загальне зауваження: Я вважаю, що класифікувати застосовану статистичну методологію двозначно на "дійсну" та "недійсну" вводиться в оману. Ніщо ніколи не діє 100%, оскільки припущення щодо моделей ніколи точно не відповідають практиці. З іншого боку, хоча ви можете знайти вагомі (!) Причини для того, щоб назвати щось "недійсне", якщо глибоко дослідити характеристики нібито недійсного підходу, можна виявити, що він все ще працює досить добре.


Цікаво, чи це реально на практиці, окрім найпростіших проблем. Обчислювальна вартість моделювання швидко перевершить наші можливості в більшості випадків, ви не вважаєте це так? Ваш коментар щодо дійсності, звичайно, логічний. Однак без цього простого, але корисного (допомагаючи нашим міркуванням) поняття, ми би втратили ще більше, ніж ми з ним - це моя думка.
Річард Харді

Я не кажу, що це слід робити щоразу, коли така ситуація виявляється на практиці. Це скоріше дослідницький проект; однак одне повідомлення про те, що на мою думку, із наведених причин вибір моделей, залежних від даних, точно не може визнати недійсним висновок, який би був дійсний інакше. Такі комбіновані процедури можуть працювати досить добре у багатьох ситуаціях, хоча наразі це недостатньо досліджено.
Льюян

Я здогадуюсь, якби це було можливо, воно вже використовувалося б. Основна проблема може бути нездійсненною через велику кількість варіантів моделювання, які залежать від даних (назад до мого першого коментаря). Або ви не бачите там проблеми?
Річард Харді

У літературі є дивне моделювання, що вивчає спочатку тест неправильної специфікації / вибір моделі, а потім параметричний висновок, що залежить від результату цього. Наскільки я знаю, результати змішані. "Класичний" приклад тут: tandfonline.com/doi/abs/10.1080/…
Левіан

Але ти маєш рацію; моделювання повного процесу з усіма можливими варіантами моделювання вимагало б великого вибору. Я все ще думаю, що це буде вартим проектом, хоча це не те, чого можна вимагати, коли моделі вибирати з тих самих даних, до яких вони підходять. Аріс Спанос, до речі, суперечить ідеї, що тестування помилок або перевірка моделі даних робить висновок недійсним. onlinelibrary.wiley.com/doi/abs/10.1111/joes.12200
Lewian
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.