Моя ситуація така:
У мене є 1 безперервна залежна та 1 безперервна змінна предиктора, яку я логарифмічно перетворив, щоб нормалізувати їх залишки для простої лінійної регресії.
Я вдячний за будь-яку допомогу щодо того, як я можу співвідносити ці перетворені змінні з їх початковим контекстом.
Я хочу використовувати лінійну регресію, щоб передбачити кількість днів, через які учні пропустили школу в 2011 році, виходячи з кількості днів, які вони пропустили в 2010 році. Більшість учнів пропускають 0 днів або лише кілька днів, дані позитивно перекошені зліва. Тому існує потреба в перетворенні на використання лінійної регресії.
Я використовував log10 (var + 1) для обох змінних (я використовував +1 для учнів, які пропустили школу за 0 днів). Я використовую регресію, тому що хочу додати категоричні фактори - також гендер / етнічну приналежність тощо.
Моя проблема:
Аудиторія, на яку я хочу повернутись, не зрозуміла log10 (y) = log (константа) + log (var2) x (і, відверто кажучи, і ні).
Мої запитання:
а) Чи є кращі способи інтерпретації трансформованих змінних в регресії? Тобто коли-небудь пропущений 1 день у 2010 році, вони пропустять 2 дні в 2011 році, на відміну від колись змінити 1 одиницю журналу в 2010 році, буде x змінити одиниць журналу в 2011 році?
b) Зокрема, з урахуванням цитованого уривку з цього джерела :
"Це негативна оцінка біноміальної регресії для збільшення на одиницю збільшення стандартизованого тесту з математики, враховуючи, що інші змінні є постійними у моделі. Якщо студент повинен був збільшити її бальний тест з математики на один бал, різниця в журналах очікуваний підрахунок, як очікується, зменшиться на 0,0016 одиниці, утримуючи інші змінні в моделі постійною ".
Я хотів би знати:
- Чи говорить цей уривок, що за кожну одиницю збільшення показника
UNTRANSFORMED
математики змінної призводить до зниження 0,0016 від константи (a), тож якщоUNTRANSFORMED
математична оцінка зростає на два бали, я віднімаю 0,0016 * 2 від постійної a? - Чи означає це, що я отримую середнє геометричне, використовуючи експоненціальну (а)) та експоненціальну (а + бета * 2), і що мені потрібно обчислити відсоткову різницю між цими двома, щоб сказати, який ефект має змінна (і) провісника / мати залежну змінну?
- Або я зрозумів це абсолютно неправильно?
Я використовую SPSS v20. Вибачте за те, що ви поставили це в довгому питанні.
R
має пакунки для моделей із