Лінійні розміри ефекту регресії при використанні трансформованих змінних


9

Виконуючи лінійну регресію, часто корисно робити таке перетворення, як log-перетворення для залежної змінної для досягнення кращої нормальної конформації розподілу. Часто також корисно оглянути бета-версію від регресії, щоб краще оцінити розмір ефекту / реальну релевантність результатів.

Це викликає проблему, що при використанні, наприклад, перетворення журналу, розміри ефектів будуть в масштабі журналу, і мені сказали, що через нелінійність використовуваної шкали, зворотна трансформація цих бета-файлів призведе до несуттєвих значень, які не мають реального використання у світі.

Наразі ми зазвичай виконували лінійну регресію з перетвореними змінними для перевірки значущості, а потім лінійну регресію з оригінальними неперетвореними змінними для визначення розміру ефекту.

Чи є правильний / кращий спосіб зробити це? Здебільшого ми працюємо з клінічними даними, тому прикладом реального життя може бути визначення того, як певна експозиція впливає на продовження змінних, таких як зріст, вага чи якесь лабораторне вимірювання. збільшення ваги на 2 кг ".

Відповіді:


5

Я б сказав, що перетворення не важливі для нормального розподілу ваших помилок. Нормальність не є необхідним припущенням. Якщо у вас є "достатньо" даних, починається центральна гранична теорема, і ваші стандартні оцінки стають асимптотично нормальними. Крім того, ви можете використовувати завантажувальний інструмент як непараметричний засіб для оцінки стандартних помилок. (Для правильності стандартних помилок потрібна гомосекедастичність, поширена дисперсія для спостережень по одиницях; надійні варіанти дозволяють гетерокедастичність).

Натомість перетворення допомагають забезпечити відповідність лінійної моделі. Щоб зрозуміти це, розглянемо, як можна інтерпретувати коефіцієнти в трансформованих моделях:

  • результат є одиницями, провісниками є одиниці: Зміна однієї одиниці в предикторі призводить до зміни бета-одиниці в результаті.
  • результат в одиницях, прогноктор в одиницях журналу: Зміна на один відсоток прогнозника призводить до зміни одиниці бета / 100 одиниць.
  • результат в одиницях журналу, прогноктор в одиницях: Зміна однієї одиниці в предикторі призводить до бета-х 100% зміни результату.
  • результат у одиницях журналу, прогноктор у одиницях журналу: Зміна прогнозу на один відсоток призводить до зміни бета-відсотка у результаті.

Якщо перетворення необхідні для того, щоб ваша модель мала сенс (тобто для лінійності), то для висновку слід використовувати оцінку з цієї моделі. Оцінка моделі, в яку ви не вважаєте, не дуже корисна. Вищенаведені інтерпретації можуть бути досить корисними для розуміння оцінок за трансформованою моделлю і часто можуть бути більш актуальними для розглянутого питання. Наприклад, економістам подобається формулювання журналу журналів, оскільки інтерпретація бета-версії - це еластичність, важливий захід в економіці.

Додам, що зворотна трансформація не працює, тому що очікування функції не є функцією очікування; журнал очікуваного значення бета-версії не є очікуваним значенням журналу бета-версії. Отже, ваш оцінювач не є об'єктивним. Це також скидає стандартні помилки.


2

КОРОТКИЙ ВІДПОВІДЬ: Цілком правильно, зворотна трансформація бета-значення безглузда. Однак ви можете повідомити про нелінійність як щось подібне. "Якщо ви важите 100 кг, то з'їдаючи два шматки пирога в день, це збільшить вагу приблизно на 2 кг за один тиждень. Однак, якщо ви зважите 200 кг, ваша вага збільшиться на 2,5 кг. Див. Рисунок 1 для зображення цього нелінійного співвідношення ( фіг.1 - прилягання кривої до необроблених даних). "

ДОВГИЙ ВІДПОВІДЬ:

Змістовність зворотного перетвореного значення змінюється, але при правильному виконанні це зазвичай має деяке значення.

Якщо у вас є регресія природних значень лога на два x-предиктори з бета-версією 0,13 та перехопленням 7,0, то зворотне перетворення 0,13 (1,14) є майже безглуздим. Це правильно. Однак зворотна трансформація 7.13 буде цінністю, яку можна інтерпретувати з деяким значенням. Потім ви можете відняти зворотну трансформацію 7.0 і залишити її залишковим значенням, яке є вашим ефектом у змістовному масштабі (152.2). Якщо ви хочете подивитися на будь-яке передбачуване значення, вам слід спочатку обчислити все це в журнальних значеннях, а потім назад перетворити. Це потрібно зробити окремо для кожного прогнозованого значення і призвести до кривої, якщо вона схоплена.

Це часто розумно робити, якщо ваша трансформація має відносно невеликий вплив на ваші дані. Перетворення журналу часу реакцій - це один із видів цінностей, які можуть бути перетворені назад. Якщо все зроблено правильно, ви побачите, що значення здаються близькими до середніх значень, роблячи прості обчислення на необроблених даних.

Навіть тоді, хоча треба бути обережними щодо взаємодій та невзаємодій. Відносні значення змінюються в масштабі. Аналіз був чутливим до значення журналу, тоді як зворотно трансформовані значення можуть показувати різні шаблони, завдяки яким взаємодії здаються такими, що їх не повинно бути або навпаки. Іншими словами, ви можете зробити перетворення речей, які вносять невеликі зміни в дані, якщо ви обережні.

Деякі зміни, як логістична трансформація ймовірності, можуть мати досить масивні наслідки, особливо в кінці шкали. Прикладом місця, яке ви ніколи не повинні перетворити, є сюжети взаємодії біля високого або низького кінця ймовірності.


2

Питання стосується граничних ефектів (від X на Y), я думаю, не стільки про тлумачення окремих коефіцієнтів. Як люди з користю відзначали, їх лише іноді можна визначити за розміром ефекту, наприклад, коли є лінійні та адитивні зв'язки.

Якщо це фокус, то, здавалося б, (концептуально, якщо не практично) найпростіший спосіб подумати над проблемою:

Щоб отримати граничний ефект X на Y в лінійній нормальній регресійній моделі без взаємодій, ви можете просто подивитися на коефіцієнт на X. Але цього недостатньо, оскільки, як вважається, невідомо. У будь-якому випадку, що дійсно хочеться для граничних ефектів, це якийсь сюжет чи резюме, який дає прогноз щодо Y для діапазону значень X та міру невизначеності. Зазвичай можна захотіти передбачуваного середнього значення Y та довірчого інтервалу, але можна також передбачити повний умовний розподіл Y для X. Цей розподіл ширший, ніж оцінка сигми встановленої моделі, оскільки він враховує невизначеність щодо коефіцієнтів моделі .

Існують різні рішення закритої форми для простих моделей, як ця. Для нинішніх цілей ми можемо їх ігнорувати і, замість того, загалом думати про те, як отримати графік граничних ефектів за допомогою моделювання таким чином, що стосується довільно складних моделей.

Припустимо, що ви хочете, щоб зміни значення X на середнє значення Y мали значення, і ви раді будете виправляти всі інші змінні за деякими значущими значеннями. Для кожного нового значення X беруть вибірку розміру B з розподілу модельних коефіцієнтів. Простий спосіб зробити це в R - припустити, що він є нормальним зі середньою coef(model)та коваріаційною матрицею vcov(model). Обчисліть нову очікувану Y для кожного набору коефіцієнтів і підсумуйте партію з інтервалом. Потім переходимо до наступного значення X.

Мені здається, що на цей метод не повинні впливати будь-які фантазійні перетворення, застосовані до будь-якої зі змінних, за умови, що ви також застосовуєте їх (або їх обертання) на кожному етапі вибірки. Отже, якщо вбудована модель має журнал (X) як предиктор, тоді запишіть новий X, перш ніж помножити його на вибірковий коефіцієнт. Якщо вбудована модель має sqrt (Y) як залежну змінну, то квадратне кожне передбачуване середнє значення у вибірці перед узагальненням їх як інтервал.

Коротше кажучи, більше програмування, але менше розрахунку ймовірності та клінічно зрозумілих граничних ефектів у результаті. Цей "метод" іноді називають CLARIFY в політологічній літературі, але є досить загальним.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.