Запитання з тегом «generalized-linear-model»

Узагальнення лінійної регресії, що дозволяє для нелінійних зв’язків через "функцію зв'язку" та для дисперсії відповіді залежати від прогнозованого значення. (Не плутати з "загальною лінійною моделлю", яка поширює звичайну лінійну модель на загальну структуру коваріації та багатоваріантну реакцію.)

2
Родина GLM представляє розподіл змінної відповіді або залишків?
Я обговорював з декількома членами лабораторії про це, і ми перейшли до кількох джерел, але все ще не дуже відповіді: Коли ми кажемо, що у GLM є сім'я пуассонів , скажімо, ми говоримо про розподіл залишків або змінну відповіді? Суперечки Читаючи цю статтю, в ній зазначається, що припущеннями GLM є …

1
Формат введення для відповіді у двочленному glm в R
В R, існує три методи для форматування вхідних даних для логістичної регресії з використанням glmфункції: Дані можуть бути у "двійковому" форматі для кожного спостереження (наприклад, y = 0 або 1 для кожного спостереження); Дані можуть бути у форматі "Вілкінсон-Роджерс" (наприклад, y = cbind(success, failure)) у кожному рядку, що представляє одну …

1
Чи можете ви дати просте інтуїтивне пояснення методу IRLS, щоб знайти MLE GLM?
Фон: Я намагаюся дотримуватися огляду Прінстона на оцінку MLE для GLM . Я розумію основи оцінки MLE: likelihood, score, яка спостерігається і очікувана Fisher informationі Fisher scoringтехніка. І я знаю, як виправдати просту лінійну регресію з оцінкою MLE . Питання: Я не можу зрозуміти навіть перший рядок цього методу :( …

4
Інтерпретація дисперсії випадкових ефектів у glmer
Я переглядаю статтю про запилення, де дані розподілені біноміально (фрукти дозрівають чи ні). Тому я використовував glmerодин випадковий ефект (окрема рослина) та один фіксований ефект (лікування). Рецензент хоче дізнатися, чи вплинула рослина на набір фруктів - але у мене виникають проблеми з інтерпретацією glmerрезультатів. Я читав в Інтернеті, і, здається, …

1
Гамма-GLM, пов’язана з логіном, проти гауссова GLM, пов'язана з журналом, і LM-трансформована логіка
З моїх результатів виходить, що GLM Gamma відповідає більшості припущень, але чи варто вдосконалення щодо LM-трансформованого LM? Більшість літератури я знайшов угоди з пуассонськими або біноміальними GLM. Стаття ОЦІНКА УЗАГАЛЬНЕНОЇ ЛІНІЙНОЇ МОДЕЛЬНОЇ МОДЕЛІ, ВИКОРИСТОВУЮЧИМ РАНДОМІЗАЦІЮ, дуже корисна, але в ній відсутні фактичні сюжети, які використовуються для прийняття рішення. Сподіваюся, хтось …

2
Можна оцінити GLM в Python / scikit-learn, використовуючи розподіли Poisson, Gamma або Tweedie як сімейство для розподілу помилок?
Намагаюся вивчити деякі Python та Sklearn, але для своєї роботи мені потрібно запустити регресії, які використовують розподіл помилок із сімей Пуассона, Гамми та особливо Tweedie. Я нічого не бачу в документації про них, але вони знаходяться в декількох частинах розподілу R, тому мені було цікаво, чи хтось бачив реалізацію для …

2
Розуміння створення фіктивних (ручних або автоматизованих) змінних у GLM
Якщо у формулі glm використовується факторна змінна (наприклад, стать із рівнями M і F), ​​створюються фіктивні змінні (і), які можна знайти в резюме моделі glm разом із пов'язаними з ними коефіцієнтами (наприклад, genderM) Якщо замість того, щоб покластися на R, поділити коефіцієнт таким чином, коефіцієнт кодується в ряд числових змінних …

1
Для середнього моделювання GLM ми оцінюємо прогнози за шкалою зв'язку або відповідей?
Для обчислення модельованих усереднених прогнозів за шкалою відгуку в GLM, що є "правильним" і чому? Обчислюють модельне усереднене прогнозування за шкалою зв’язку, а потім зворотним перетворенням на шкалу відповідей, або Назад перетворіть прогнози на шкалу відгуку, а потім обчисліть середню модель Прогнози близькі, але не рівні, якщо модель є GLM. …

2
Сплайни в GLM та GAM
Чи не так, що сплайни доступні лише в GAM-моделях, а не в GLM-моделях? Я почув це деякий час назад і замислювався, чи це просто помилкова думка, чи є якась правда в цьому. Ось ілюстрація:

2
Використання lm для 2-пробного тесту на пропорцію
Я деякий час використовував лінійні моделі для виконання тестів на 2 вибірки, але зрозумів, що це може бути не зовсім коректно. Здається, що використання узагальненої лінійної моделі з двочленним сімейством + ідентифікаційним зв’язком дає саме непідкупчені 2-вибіркові пропорційні результати тесту. Однак використання лінійної моделі (або glm з гауссова сім'я) дає …

2
Збільшити штрафи GLM, використовуючи збільшення рядків?
Я читав, що регресія хребта може бути досягнута простим додаванням рядків даних до вихідної матриці даних, де кожен рядок побудований з використанням 0 для залежних змінних та квадратного кореня або нуля для незалежних змінних. Потім додається один додатковий рядок для кожної незалежної змінної.кkk Мені було цікаво, чи можна отримати доказ …

1
Альтернативи надмірної дисперсії та моделювання в моделях випадкових ефектів Пуассона із зрушеннями
Я зіткнувся з низкою практичних питань, коли моделював підрахунок даних експериментальних досліджень за допомогою експерименту в рамках предмета. Я коротко описую експеримент, дані та те, що я зробив до цього часу, після чого мої питання Чотири різних фільми були показані на вибірці респондентів послідовно. Після кожного фільму було проведено інтерв'ю, …

1
Логістична регресія з регресійними сплайнами в R
Я розробляю логістичну модель регресії на основі ретроспективних даних із національної бази травм травми голови у Великобританії. Основним результатом є смертність за 30 днів (позначена як міра "вижити"). Інші заходи з опублікованими доказами значного впливу на результати попередніх досліджень включають: Year - Year of procedure = 1994-2013 Age - Age …

5
Як виконати імпутацію значень у дуже великій кількості точок даних?
У мене дуже великий набір даних, і близько 5% випадкових значень відсутні. Ці змінні співвідносяться між собою. Наступний приклад набору даних R - це лише іграшковий приклад з манекено-корельованими даними. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Перевірка залишків на нормальність в узагальнених лінійних моделях
У цій роботі використовуються узагальнені лінійні моделі (як біноміальні, так і негативні розподіли біноміальних помилок) для аналізу даних. Але потім у розділі статистичного аналізу методів є таке твердження: ... і по-друге, моделюючи дані про наявність за допомогою моделей логістичної регресії та дані про час збирання за допомогою узагальненої лінійної моделі …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.