Коли неправильні лінійні моделі стають надійно красивими?


9

Запитання:

  • Чи неправильні лінійні моделі використовуються на практиці чи це якась цікавість, яка час від часу описується в наукових журналах? Якщо так, то в яких районах вони використовуються?
  • Чи є інші приклади таких моделей?
  • Нарешті, чи були б стандартні помилки, -значення, тощо, взяті з OLS для таких моделей, правильними, чи їх слід якось виправити?pR2

Передумови: У літературі періодично описуються неправильні лінійні моделі. Загалом такі моделі можна описати як

y=a+biwixi+ε

те, що їх відрізняє від регресії, полягає в тому, що не є коефіцієнтами, оціненими в моделі, а є вагами, якіwj

  • дорівнює для кожної змінної ( одинично зважена регресія ),wi=1
  • ґрунтуючись на кореляціях (Dana і Dawes, 2004),wi=ρ(y,xi)
  • обраний випадковим чином (Dawes, 1979),
  • 1 для змінних, негативно пов'язаних з , для змінних, позитивно пов'язаних з (Wainer, 1976).y1y

Також прийнято використовувати якесь масштабування функцій, наприклад перетворення змінних у -скореї. Отже, подібну модель можна спростити до одновимірної лінійної регресіїZ

y=a+bv+ε

де , і його можна просто оцінити за допомогою регресії OLS.v=wix

Список літератури:
Dawes, Robyn M. (1979). Надійна краса неправильних лінійних моделей у прийнятті рішень . Американський психолог, 34, 571-582.

Грейф, А. (2015). Поліпшення прогнозів з використанням рівномірних прогнозів . Журнал бізнес-досліджень, 68 (8), 1792-1799.

Вайнер, Говард (1976). Оцінка коефіцієнтів у лінійних моделях: це не робить ніколи не значення . Психологічний вісник 83 (2), 213.

Дана, Дж. Та Дауес, РМ (2004). Перевага простих альтернатив регресії для прогнозів суспільствознавства . Журнал статистики освіти та поведінки, 29 (3), 317-331.


3
У якому сенсі статистика, отримана за цими моделями, була б "неправильною"?
whuber

1
Коли s будуть попередньо визначені & , це лише скорочення даних, що проводиться на прогнозах - досить поширене в різних формах (див., Наприклад, шкалу Коми Глазго та коефіцієнт захворюваності Чарлсона) - що не вплине на обгрунтованість висновку у звичайній рамці OLS. Коли використовується для визначення s, стандартні помилки & c. вийде, в оптимістичному напрямку я б подумав. wibywi
Scortchi

1
Це був не поінформований коментар - документи все ще знаходяться на моїй купі "для читання". Я просто замислився: - "чому" неналежний "?". Непередбачуваним для прогноктора є лінійна комбінація інших змінних - середнє значення декількох вимірювань, оцінка основної складової, прогноз від іншої регресії, рівень експоненціально згладженого часового ряду або обчислене значення з добре встановленого або спеціальний індекс. Не оцінюючи ваги за відгуком, не заважають ступеню свободи, що допомагає уникнути перевитрати з меншими розмірами вибірки.
Scortchi

1
Наприклад, Beddhu (2000), "проста шкала коморбідності прогнозує клінічні результати та витрати у хворих на діаліз" Am. J. Med., 108 , 8 модельне рівняння має таку ж форму, як і ваша, деxis визначаються як показники змінної діабету, лімфоми, & c., & the wis заздалегідь вказані. Я думаю, що я говорю, що відмінність між "неправильними" та "належними" регресійними моделями, здається, спирається на поняття даного Богом наборуxis, для кожної з яких "правильна" модель оцінювала б коефіцієнт.
Scortchi

4
Коли wi=ρ(y,xi), & якщо ρБули оцінені з тих самих даних, до яких підходить модель, це був би зовсім інший чайник з рибою.
Scortchi

Відповіді:


1

Насправді, мені здається, це асортимент припущених структур коваріації. Іншими словами, це тип попереднього моделювання Баєса.

Це отримує надійність у порівнянні зі звичайною процедурою MLR, оскільки кількість параметрів (df) зменшується і вводить неточність через посилене опущене змінне зміщення , OVB. Через ОВВ схил сплющений,|β^|<|β|, коефіцієнт визначення знижується R^2<R2.

Мій особистий досвід полягає в тому, що перевагою байєсівського підходу є використання кращого моделювання; перетворювати параметри, використовувати інші норми та / або використовувати нелінійні методи. Тобто, як тільки фізика проблеми та методи будуть належним чином вивчені та скоординовані, статистика F, коефіцієнт визначення тощо покращуються, а не погіршуються.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.