Зворотна трансформація коефіцієнтів регресії


17

Я роблю лінійну регресію з перетвореною залежною змінною. Наступне перетворення було зроблено для того, щоб було допущено нормальність залишків. Нетрансформована залежна змінна була негативно перекошена, і наступне перетворення зробило її близькою до нормальної:

Y=50Yorig

де є залежною змінною у вихідній шкалі.Yorig

Я думаю, що є сенс використовувати деяке перетворення на коефіцієнти щоб повернутись до початкової шкали. Використовуючи наступне рівняння регресії,β

Y=50Yorig=α+βX

і, фіксуючи , маємоX=0

α=50Yorig=50αorig

І, нарешті,

αorig=50α2

Використовуючи ту ж логіку, я знайшов

βorig=α (α2β)+β2+αorig50

Зараз все дуже добре працює для моделі з 1 або 2 провісниками; коефіцієнти зворотного перетворення нагадують вихідні, тільки тепер я можу довіряти стандартним помилкам. Проблема виникає при включенні терміна взаємодії, наприклад

Y=α+X1βX1+X2βX2+X1X2βX1X2

Тоді зворотна трансформація для s не настільки близька до вихідної шкали, і я не впевнений, чому це відбувається. Я також не впевнений, що формула для зворотного перетворення бета-коефіцієнта є корисною, як для 3-го β (для терміну взаємодії). Перш ніж піти в божевільну алгебру, я думав, що попрошу поради ...ββ


Як ви визначаєте та β o r i g ? αorigβorig
mar999

Як значення альфа-та бета-версії на оригінальній шкалі
Домінік Комтуа

1
Але що це означає?
mar999

Я б ризикнув чимось на кшталт: оцінки, які ми отримаємо, - це оригінальні дані, придатні до лінійної регресії.
Домінік Комтуа

2
Мені це здається безглуздою концепцією. Я згоден з відповіддю Гунга.
mark999

Відповіді:


19

Одна проблема полягає в тому, що ви написали

Y=α+βX

Це проста детермінована (тобто невипадкова) модель. У такому випадку ви могли б перетворити коефіцієнти на початкову шкалу, оскільки це лише питання простої алгебри. Але у звичайній регресії у вас є лише ; ви залишили термін помилки у вашій моделі. Якщо перетворення від Y назад до Y o r i g є нелінійним, у вас може виникнути проблема, оскільки E ( f ( X ) )f ( E (E(Y|X)=α+βXYYorig , загалом. Я думаю, що це може мати відношення до розбіжності, яку ви бачите.E(f(X))f(E(X))

Редагувати: Зауважте, що якщо перетворення лінійне, ви можете повернути перетворення, щоб отримати оцінки коефіцієнтів за початковою шкалою, оскільки очікування лінійне.


4
+1, щоб пояснити, чому ми не можемо перетворити бета-версії.
gung - Відновіть Моніку

15

Я вітаю ваші зусилля тут, але ви гавкаєте неправильне дерево. Ви не повертаєте бета-версію для перетворення. Ваша модель утримується у світі перетворених даних. Якщо ви хочете , щоб зробити прогноз, наприклад, ви назад перетворення Y I , але це так. Звичайно, ви також можете отримати інтервал передбачення, обчисливши високі та низькі граничні значення, а потім перетворіть їх також назад, але ні в якому разі не повертайте назад бета-версії. y^i


1
Що робити з того, що коефіцієнти зворотного перетворення наближаються до тих, що отримуються при моделюванні неперетвореної змінної? Чи не дозволяє це зробити певний висновок у вихідній шкалі?
Домінік Комтуа

2
Я точно не знаю. Це може залежати від будь-якої кількості речей. Моя перша здогадка полягає в тому, що вам пощастило з вашою першою парою бета-версій, але тоді ваша удача закінчується. Я повинен погодитись w / @ mark999, що "оцінки, які ми отримали б оригінальними даними, придатними до лінійної регресії", насправді не мають сенсу; Я б хотів, щоб він це зробив і, схоже, спочатку почервонів, але, на жаль, це не так. І це не дає жодних висновків на оригінальній шкалі.
gung - Відновіть Моніку

1
@gung для нелінійних перетворень (скажімо, box cox): я можу повернути перетворені пристосовані значення, а також інтервали прогнозування, але я не можу перетворити бета-версію чи інтервали коефіцієнтів для бета-версій. Чи варто мати на увазі якесь додаткове обмеження? btw, це дуже цікава тема, де я можу краще зрозуміти?
mugen

2
@mugen, важко сказати, що ще слід знати. Можливо мати на увазі одне, що заднє перетворення y-hat дає вам умовну серединку, тоді як не-перетворена (bleck) y-hat - умовна середня. Крім цього, цей матеріал повинен бути охоплений у хорошому підручнику з регресії.
gung - Відновіть Моніку

3
@mugen, ласкаво просимо. Не соромтеся задавати більше питань за допомогою звичайних механізмів (клацання ASK QUESTION); буде більше ресурсів для відповідей, ви отримаєте увагу більшої кількості резюме, і інформація буде краще доступною для нащадків.
gung - Відновити Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.