Перегляньте редагування.
Коли у вас є дані з важкими хвостами, регресія з помилками студента-т здається інтуїтивно зрозумілою справою. Досліджуючи цю можливість, я наткнувся на цей документ:
Breusch, TS, Robertson, JC, & Welsh, AH (01 листопада 1997). Новий одяг імператора: критика багатоваріантної регресійної моделі. Statistica Neerlandica, 51, 3.) ( посилання , pdf )
Що стверджує, що параметр масштабу та параметр ступенів свободи в певному сенсі не ідентифікуються один щодо одного, і через те, що регресія з t помилками не робить нічого, крім того, що робить стандартна лінійна регресія.
Зеллнер (1976) запропонував регресійну модель, в якій вектор даних (або вектор помилки) представлений як реалізація від багатофакторного розподілу Стьюдента t. Ця модель привернула значну увагу, оскільки, здається, розширила звичне гауссова припущення, щоб забезпечити більш чіткі розподіли помилок. Ряд результатів в літературі свідчить про те, що стандартні процедури виводу для Гауссової моделі залишаються підходящими при припущенні більш широкого розподілу, що призводить до тверджень про надійність стандартних методів. Ми показуємо, що, хоча математично обидві моделі різні, для цілей статистичного висновку вони не відрізняються. Емпіричні наслідки багатоваріантної моделі t точно такі ж, як і у Гауссової моделі. Отже, пропозиція про більш широке розповсюдження даних є помилковою, а твердження про надійність - оманливими. До цих висновків дійшли як з точки зору частості, так і байесів.
Це мене дивує.
У мене немає математичної складності, щоб добре оцінити їхні аргументи, тому у мене є кілька питань: чи правда, що робити регресії з t-помилками взагалі не корисно? Якщо вони іноді корисні, я неправильно зрозумів папір або це вводить в оману? Якщо вони не корисні, це добре відомий факт? Чи існують інші способи обліку даних із важкими хвостами?
Редагувати : Після більш детального ознайомлення з пунктом 3 та розділом 4, схоже, що стаття нижче не говорить про те, про що я думав як про регресію студента (помилки - це незалежні універсальні розподіли). Помилки виходять із одного розподілу та не є незалежними. Якщо я правильно розумію, саме ця відсутність незалежності є саме тим, що пояснює, чому ви не можете самостійно оцінювати масштаб і ступінь свободи.
Я думаю, цей документ містить перелік робіт, щоб не читати.