Загальна лінійна модель проти узагальненої лінійної моделі (з функцією зв’язку ідентичності?)


25

Це моє перше повідомлення, тому будь ласка, будь ласка, будь ласка, якщо я не дотримуюся деяких стандартів! Я здійснив пошук свого питання, і нічого не вийшло.

Моє запитання стосується переважно практичних відмінностей між загальним лінійним моделюванням (GLM) та узагальненим лінійним моделюванням (GZLM). У моєму випадку це було б кілька безперервних змінних як коваріати та декілька факторів у ANCOVA проти GZLM. Я хочу вивчити основні ефекти кожної змінної, а також одну тристоронню взаємодію, яку я окреслю в моделі. Я бачу, як ця гіпотеза перевірена в ANCOVA, або за допомогою GZLM. Якоюсь мірою я розумію математичні процеси та міркування про запуск загальної лінійної моделі на зразок ANCOVA, і я дещо розумію, що GZLM дозволяють функцію зв’язку, що з'єднує лінійну модель і залежну змінну (добре, я збрехав, можливо, я не дійсно розумію математику). Що я дійсно не роблю ' t розумієте, чи є практичні відмінності чи причини для проведення одного аналізу, а не іншого, коли розподіл ймовірностей, використовуваний у GZLM, є нормальним (тобто функція зв'язку ідентичності?). Я отримую дуже різні результати, коли бігаю один над іншим. Чи можу я бігати чи то? Мої дані дещо ненормальні, але певною мірою працюють як в ANCOVA, так і в GZLM. В обох випадках моя гіпотеза підтримується, але в GZLM значення р "краще".

Думав, що ANCOVA - це лінійна модель з нормально розподіленою залежною змінною, що використовує функцію зв’язку ідентичності, і саме це я можу ввести в GZLM, але вони все ще відрізняються.

Будь ласка, пролийте трохи світла на ці питання для мене, якщо можете!


На основі першої відповіді у мене є додаткове запитання:

Якщо вони ідентичні, за винятком тесту на значимість, який він використовував (тобто тест F проти площі Вальда Чі), який був би найбільш підходящим для використання? ANCOVA - це "перехід до методу", але я не впевнений, чому тест F був би кращим. Чи може хтось пролити трохи світла на це питання для мене? Спасибі!


@ відповідь onestop хороша; Я вже давно підтримав це. Щоб отримати більш чітке розуміння зв'язку між загальною лінійною моделлю та узагальненою лінійною моделлю, можливо, вам допоможе прочитати мою відповідь тут: моделі-відмінності між-logit-і-probit-моделями (хоча це було написано в іншому контексті) . Якщо припустити, що ваші помилки зазвичай розподіляються, але відхилення помилок невідомі априорі, тести & які програмне забезпечення повертає без ANCOVA, будуть правильними; p-значення в тесті Wald буде занадто низьким, якщо тільки ваш N не дуже великий. FtF
gung - Відновіть Моніку

Відповіді:


23

Узагальнена лінійна модель, що визначає функцію зв'язку ідентичності та нормальний розподіл сім'ї, точно рівнозначна (загальній) лінійній моделі. Якщо ви отримуєте помітно різні результати від кожного, ви робите щось не так.

Зауважте, що вказати ідентифікаційне посилання - це не те саме, що вказати нормальний розподіл. Розподіл та функція зв’язку - це два різні компоненти узагальненої лінійної моделі, і кожен може бути обраний незалежно від іншого (хоча певні посилання краще працюють із певними розподілами, тому більшість програмних пакетів визначають вибір посилань, дозволених для кожного розподілу).

Деякі програмні пакети можуть повідомляти про помітно різні коли залишкові ступені свободи невеликі, якщо він обчислює їх, використовуючи асимптотичні нормальні та чі-квадратні розподіли для всіх узагальнених лінійних моделей. Все програмне забезпечення повідомляє -значення на основі - та розподілу Фішера для загальних лінійних моделей, оскільки вони більш точні для малих залишкових ступенів свободи, оскільки вони не покладаються на асимптотику. Студентський - і Фішера -розподіленого строго справедливі тільки для нормальної сім'ї, хоча деякі іншіp t F t FpptFtF програмне забезпечення для узагальнених лінійних моделей також може використовувати їх як наближення при встановленні інших сімей з параметром масштабу, який оцінюється за даними.


Дякую за відповідь! Я радий почути вашу відповідь, оскільки це було моє первісне припущення. Мені сказали інакше професор у моєму закладі, тому мені справді довелося копати. Я використовую SPSS, і тепер я бачу, що оцінки параметрів дійсно однакові (наприклад, значення B). Тепер я бачу, що спочатку мене бентежили різні значення p. Статистика ANCOVA базується на стандартному тесті F, тоді як GZLM базується на квадраті Вальда, правда? Я читав, що квадрат Wald Chi використовується при використанні параметрів вибірки (наприклад, у GZLM).
Бехакад

Виходячи з цієї відповіді, я додав запитання до оригінальної публікації!
Behacad

Гаразд, я додав відповідний пункт до своєї відповіді у відповідь.
onestop

5

Я хотів би включити свій досвід у цю дискусію. Я бачив, що узагальнена лінійна модель (із зазначенням функції зв’язку ідентичності та нормального розподілу сім'ї) є ідентичною загальній лінійній моделі лише тоді, коли ви використовуєте максимальну оцінку ймовірності як метод параметра параметра шкали. В іншому випадку, якщо в якості методу параметра масштабу обрано "фіксоване значення = 1", ви отримаєте дуже різні значення p. Мій досвід свідчить, що зазвичай слід уникати "фіксованого значення = 1". Мені цікаво дізнатись, чи знає хто, коли доцільно вибрати фіксовану величину = 1 як метод параметра масштабу. Заздалегідь спасибі. Позначити


3
Як правило, використовується фіксована шкала лише в таких моделях, як логістична регресія або пуассонова регресія, де відповідь є змінною чисельністю або показником / частотою. У цьому випадку в нормальній регресії немає аналога параметру шкали.
Hong Ooi
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.