Запитання з тегом «generalized-linear-model»

Узагальнення лінійної регресії, що дозволяє для нелінійних зв’язків через "функцію зв'язку" та для дисперсії відповіді залежати від прогнозованого значення. (Не плутати з "загальною лінійною моделлю", яка поширює звичайну лінійну модель на загальну структуру коваріації та багатоваріантну реакцію.)

1
Коли використовувати дані Пуассона проти геометричних та негативних біноміальних GLM для даних підрахунку?
Я намагаюся розмістити для себе, коли доречно використовувати тип регресії (геометричний, пуассонський, негативний двочлен) з даними підрахунку, в рамках GLM (лише 3 з 8 розподілів GLM використовуються для підрахунку даних, хоча більшість з них Я читав центри навколо негативних біноміальних та пуассонових розподілів). Коли використовувати дані Пуассона проти геометричних та …

2
Як інтерпретувати параметри в GLM з сім'єю = Gamma
Це запитання було перенесено із переповнення стека, оскільки на нього можна відповісти на перехресному підтвердженні. Мігрували 5 років тому . У мене є питання щодо інтерпретації параметрів для GLM з розподіленою залежною змінною гамми. Це те, що R повертається для мого GLM за допомогою посилання: Call: glm(formula = income ~ …

3
Регресія Пуассона проти регресії найменших квадратів серед найменших квадратів?
Регресія Пуассона - це GLM з функцією log-link. Альтернативний спосіб моделювання нерозподілених даних підрахунку - це попередня обробка, взяття журналу (а точніше, журналу (1 + кількість) для обробки 0). Якщо ви регресуєте з мінімальними квадратами для відповідей підрахунку журналів, це пов’язано з регресією Пуассона? Чи може вона впоратися з подібними …

1
Чому квазі-Пуассон в ГЛМ не трактується як особливий випадок негативного бінома?
Я намагаюся пристосувати узагальнені лінійні моделі до деяких наборів даних про підрахунок, які можуть або не можуть бути перерозподілені. Два канонічні розподіли, які застосовуються тут, - пуассонівський та негативний біноміал (Негбін), з EV та дисперсієюмкмк\mu Va rП= μVаrП=мкVar_P = \mu Va rNБ= μ + μ2θVаrNБ=мк+мк2θVar_{NB} = \mu + \frac{\mu^2}{\theta} які …

3
Як обчислити корисність придатності в glm (R)
У мене є такий результат від запуску функції glm. Як можна інтерпретувати такі значення: Нульове відхилення Залишкове відхилення AIC Чи мають вони щось спільне з доброю формою? Чи можу я обчислити деяку корисність міри придатності з таких результатів, як R-квадрат або будь-який інший захід? Call: glm(formula = tmpData$Y ~ tmpData$X1 …

1
Від Байєсівських мереж до Нейронних мереж: як багатоваріантну регресію можна перенести в мережу з декількома виходами
Я маю справу з Баєсовою ієрархічною лінійною моделлю , тут мережа описує її. YYY являє собою щоденний продаж товару в супермаркеті (спостерігається). ХXX - відома матриця регресорів, що включає ціни, акції, день тижня, погоду, свята. 1SSS - невідомий латентний рівень запасів кожного товару, який викликає найбільшу кількість проблем і який …

1
Чи є інтуїтивне пояснення, чому логістична регресія не буде працювати для ідеального випадку розлуки? І чому додавання регуляризації виправить це?
У нас є багато хороших дискусій про ідеальне розділення в логістичній регресії. Такі як, Логістична регресія в R призвели до ідеального роз'єднання (феномен Хока-Доннера). А тепер що? і логістична регресійна модель не збігається . Я особисто все ще вважаю, що це не інтуїтивно, чому це буде проблема і чому додавання …

4
Справа з 0,1 значенням у бета-регресії
У мене є деякі дані в [0,1], які я хотів би проаналізувати за допомогою бета-регресії. Звичайно, щось потрібно зробити, щоб вмістити 0,1 значення. Мені не подобається змінювати дані, щоб відповідати моделі. також я не вірю, що інфляція нуля і 1 - це гарна ідея, тому що я вважаю, що в …

2
Перетворення даних про пропорції: коли квадратного кореня арцина недостатньо
Чи існує (сильніша?) Альтернатива трансформації кореня квадратного дугу для даних про відсотки / пропорції? У наборі даних, над яким я працюю на даний момент, позначена гетеросцедастичність залишається після того, як я застосую цю трансформацію, тобто графік залишків та встановлених значень все ще є дуже ромбоїдним. Відредаговано для відповіді на коментарі: …

3
Як інтерпретувати термін перехоплення в GLM?
Я використовую R, і я аналізував свої дані за допомогою GLM за допомогою біноміального зв'язку. Я хочу знати, яке значення перехоплює у вихідній таблиці. Перехоплення для однієї з моїх моделей суттєво відрізняється, проте змінна - ні. Що це означає? Що таке перехоплення. Я не знаю, чи я просто плутаю себе, …

1
Як трактуються значення "NA" в glm в R
У мене є таблиця даних T1, яка містить майже тисячу змінних (V1) і близько 200 мільйонів точок даних. Дані рідкі, і більшість записів - NA. У кожній точці даних є унікальний пара ідентифікатора та дати, який можна відрізняти від іншого. У мене є ще одна таблиця T2, яка містить окремий …

2
Яка діагностика може підтвердити використання конкретного сімейства GLM?
Це здається таким елементарним, але я завжди зациклююся на цьому ... Більшість даних, з якими я маю справу, не є нормальними, а більшість аналізів базується на структурі GLM. Для мого поточного аналізу у мене є змінна відповідь, яка "швидкість ходьби" (метри / хвилина). Мені легко визначити, що я не можу …

4
Найкращий спосіб боротьби з гетероцедастичністю?
У мене є графік залишкових значень лінійної моделі у функціонуванні встановлених значень, де гетероскедастичність дуже чітка. Однак я не впевнений, як мені діяти зараз, тому що, наскільки я розумію, ця гетероскедастичність робить мою лінійну модель недійсною. (Це так?) Використовуйте надійну лінійну підгонку, використовуючи rlm()функцію MASSупаковки, оскільки це, мабуть, надійно для …

1
Добре підходить і яка модель вибрати лінійну регресію або Пуассона
Мені потрібні поради щодо двох головних дилем у моєму дослідженні - це тематичне дослідження трьох великих фармацевтичних препаратів та інновацій. Кількість патентів на рік є залежною змінною. Мої запитання є Які найважливіші критерії для хорошої моделі? Що більше / менш важливо? Хіба що більшість чи всі змінні будуть значущими? Це …

1
Чому використання методу Ньютона для оптимізації логістичної регресії називають ітераційними перезваженими найменшими квадратами?
Чому використання методу Ньютона для оптимізації логістичної регресії називають ітераційними перезваженими найменшими квадратами? Мені це здається незрозумілим, оскільки логістичні втрати та найменші втрати квадратів - це абсолютно різні речі.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.