Чи регресії з помилками студента-т марні?


10

Перегляньте редагування.

Коли у вас є дані з важкими хвостами, регресія з помилками студента-т здається інтуїтивно зрозумілою справою. Досліджуючи цю можливість, я наткнувся на цей документ:

Breusch, TS, Robertson, JC, & Welsh, AH (01 листопада 1997). Новий одяг імператора: критика багатоваріантної регресійної моделі. Statistica Neerlandica, 51, 3.) ( посилання , pdf )

Що стверджує, що параметр масштабу та параметр ступенів свободи в певному сенсі не ідентифікуються один щодо одного, і через те, що регресія з t помилками не робить нічого, крім того, що робить стандартна лінійна регресія.

Зеллнер (1976) запропонував регресійну модель, в якій вектор даних (або вектор помилки) представлений як реалізація від багатофакторного розподілу Стьюдента t. Ця модель привернула значну увагу, оскільки, здається, розширила звичне гауссова припущення, щоб забезпечити більш чіткі розподіли помилок. Ряд результатів в літературі свідчить про те, що стандартні процедури виводу для Гауссової моделі залишаються підходящими при припущенні більш широкого розподілу, що призводить до тверджень про надійність стандартних методів. Ми показуємо, що, хоча математично обидві моделі різні, для цілей статистичного висновку вони не відрізняються. Емпіричні наслідки багатоваріантної моделі t точно такі ж, як і у Гауссової моделі. Отже, пропозиція про більш широке розповсюдження даних є помилковою, а твердження про надійність - оманливими. До цих висновків дійшли як з точки зору частості, так і байесів.

Це мене дивує.

У мене немає математичної складності, щоб добре оцінити їхні аргументи, тому у мене є кілька питань: чи правда, що робити регресії з t-помилками взагалі не корисно? Якщо вони іноді корисні, я неправильно зрозумів папір або це вводить в оману? Якщо вони не корисні, це добре відомий факт? Чи існують інші способи обліку даних із важкими хвостами?

Редагувати : Після більш детального ознайомлення з пунктом 3 та розділом 4, схоже, що стаття нижче не говорить про те, про що я думав як про регресію студента (помилки - це незалежні універсальні розподіли). Помилки виходять із одного розподілу та не є незалежними. Якщо я правильно розумію, саме ця відсутність незалежності є саме тим, що пояснює, чому ви не можете самостійно оцінювати масштаб і ступінь свободи.

Я думаю, цей документ містить перелік робіт, щоб не читати.


чи ти впевнений, що ти можеш розповсюджувати папір через дропбокс. краще подвійна перевірка.
Тобі Ель Техедор

Я думаю, що розподіл лапласа дає можливість певною мірою обробити важкі хвости.
Тобі Ель Техедор

Відповіді:


5

Ваша редакція правильна. Результати, представлені в роботі, стосуються лише багатовимірних помилок. Якщо ви використовуєте незалежні помилки t, то ви в безпеці.

Я не думаю, що папір добре відома, але я вважаю, що це правильно.

Статистична література рясніє "узагальненнями", які у багатьох випадках є або перематеризаціями, перетвореннями один на один, або іноді марними, оскільки вони не сприяють значному узагальненню деяких властивостей відповідної моделі.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.