Гамма-GLM, пов’язана з логіном, проти гауссова GLM, пов'язана з журналом, і LM-трансформована логіка


13

З моїх результатів виходить, що GLM Gamma відповідає більшості припущень, але чи варто вдосконалення щодо LM-трансформованого LM? Більшість літератури я знайшов угоди з пуассонськими або біноміальними GLM. Стаття ОЦІНКА УЗАГАЛЬНЕНОЇ ЛІНІЙНОЇ МОДЕЛЬНОЇ МОДЕЛІ, ВИКОРИСТОВУЮЧИМ РАНДОМІЗАЦІЮ, дуже корисна, але в ній відсутні фактичні сюжети, які використовуються для прийняття рішення. Сподіваюся, хтось із досвідом може направити мене в правильному напрямку.

Я хочу моделювати розподіл моєї змінної відповіді T, розподіл якої зображено нижче. Як ви можете бачити, це позитивний перекіс:
Дійсний XHTML.

У мене є два категоричні фактори: METH та CASEPART.
Зауважимо, що це дослідження в основному є розвідувальним, по суті служить пілотним дослідженням перед теоретизацією моделі та виконанням DoE навколо неї.

У мене є такі моделі в R із їх діагностичними діаграмами:

LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat)

Дійсний XHTML
Дійсний XHTML

GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log'))

Дійсний XHTML
Дійсний XHTML

GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log'))

Дійсний XHTML
Дійсний XHTML

Я також отримав такі Р-значення за допомогою тесту Shapiro-Wilks на залишки:

LM.LOG: 2.347e-11  
GLM.GAMMA: 0.6288  
GLM.GAUS:  0.6288  

Я розраховував значення AIC та BIC, але якщо я маю рацію, вони мені не дуже розказують через різні сім'ї в GLM / LM.

Крім того, я зазначив крайні значення, але не можу класифікувати їх як переживаючих, оскільки немає чіткої "особливої ​​причини".



1
Варто зазначити, що всі три моделі є мультиплікаційними в тому сенсі, що збільшення регресора пов'язане з відносною зміною типової реакції. Для двох log-лінійних GLM "типовий" означає середнє арифметичне, тоді як для LM-перетвореного LM ми говоримо про геометричні засоби. Таким чином, спосіб інтерпретації ефектів та прогнозів також є рушійним фактором для вибору моделі, яка має не лише ідеальні залишкові графіки (це так чи інакше).
Майкл М

@MichaelMayer - Дякую за відповідь, дуже корисно. Чи можете ви трохи розширити, як саме вибір впливає на інтерпретацію? Або вкажіть мене в напрямку відліку?
TLJ

@ Marcinthebox- Я переглянув це питання перед публікацією. Не відповідає точно на моє запитання дуже стисло.
TLJ

Відповіді:


19

Що ж, цілком очевидно, що лінійна підгонка до гаусса не підходить; у залишків сильна гетероскледастичність. Тож давайте це візьмемо до уваги.

Залишилося логоритм проти гамми.

T

Будь-яка модель видається приблизно однаково придатною в цьому випадку. Вони обидві мають відмінність, пропорційну середньому середньому квадрату, тому схема розповсюдження у залишках проти прилягання аналогічна.

Невисокий показник буде трохи краще підходити до гамми, ніж лонормальний (навпаки, для високого рівня). При заданій середній величині та дисперсії, лонормальна більш коса і має більший коефіцієнт варіації.

exp(μ)σ2

Дивіться також тут і тут деякі пов'язані дискусії.


1
@Gleb_b ця відповідь дуже корисна для мого аналізу. У мене є кілька питань. (1) По-перше, це "Вони обоє мають відмінність, пропорційну квадрату середньої величини ..." на основі залишку проти встановленого сюжету? (2) І чи це "Низький амортизатор трохи краще підійде до гамми ... За заданої середньої та дисперсії, ..." на основі сюжету qq? (3) З того, що я розумію, glm (наприклад, гамма, пуассон та негативний біном) не має припущення про нормальність залишків та однорідність дисперсії. Якщо так, то чому побудова графіків залишків проти встановленого та нормального ділянок qq має значення для діагностики?
татамі

2
Це достатньо обширне питання, щоб бути абсолютно новим питанням, чи справді декількома (на більшість з яких уже відповіли на нашому сайті!) - 1. частина моделі. 2. Ні, це загальні факти щодо розподілів. 3. Правильно вони не є нормальними, проте залишки, які використовуються у графіці QQ, є (внутрішньо студентизовані) залишками відхилень, які - особливо у випадку гамми - як правило, дуже близькі до нормально розподілених (я написав відповідь, пояснюючи, чому в деяка точка) і повинна мати по суті постійну дисперсію. Деяке відхилення від нормальності не є несподіваним, але істотним відхиленням ...
ctd

2
ctd ... з нормальності (якщо припустити, що інші сюжети добре) може вказувати на проблему з припущенням про розподіл.
Glen_b -Встановіть Моніку
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.