Запитання з тегом «generalized-linear-model»

Узагальнення лінійної регресії, що дозволяє для нелінійних зв’язків через "функцію зв'язку" та для дисперсії відповіді залежати від прогнозованого значення. (Не плутати з "загальною лінійною моделлю", яка поширює звичайну лінійну модель на загальну структуру коваріації та багатоваріантну реакцію.)


1
Біноміальна глмм з категоричною змінною з повними успіхами
У мене запущений glmm з біноміальною змінною відповіді та категоричним предиктором. Випадковий ефект надається вкладеною конструкцією, що використовується для збору даних. Дані виглядають приблизно так: m.gen1$treatment [1] sucrose control protein control no_injection ..... Levels: no_injection control sucrose protein m.gen1$emergence [1] 1 0 0 1 0 1 1 1 1 1 …

3
GLM з безперервними даними, накопиченими в нулі
Я намагаюся запустити модель, щоб оцінити, наскільки добре катастрофічні захворювання, такі як туберкульоз, СНІД тощо, впливають на витрати на госпіталізацію. Я маю "затрати на госпіталізацію" як залежну змінну та різні індивідуальні маркери як незалежні змінні, майже всі з яких є манекенами, такими як стать, голова домогосподарства, статус бідності і, звичайно, …

1
Чи завжди існує канонічна функція зв'язку для узагальненої лінійної моделі (GLM)?
У GLM, припускаючи скалярні і θ для базового розподілу з pdf f Y ( y | θ , τ ) = h ( y , τ ) exp ( θ y - A ( θ )YYYθθ\theta Можна показати, щоμ=E(Y)=A′(θ). Якщо функція зв'язкуg(⋅)задовольняє наступному,g(μ)=θ=X′β,деX′βє лінійним предиктором, тоg(⋅)називається канонічною функцією зв'язку для …

4
Логістична регресія та перегин
У нас є дані з бінарним результатом і деякими коваріатами. Я використовував логістичну регресію для моделювання даних. Просто простий аналіз, нічого надзвичайного. Кінцевим результатом має бути крива доза-відповідь, де ми показуємо, як змінюється ймовірність для конкретного коваріату. Щось на зразок цього: Ми отримали певну критику від внутрішнього рецензента (не чистого …

2
Аналіз збагачення за рівнем дублювання генів
Біологічне підґрунтя З часом деякі види рослин прагнуть дублювати цілі геноми, отримуючи додаткову копію кожного гена. Через нестабільність цієї установки багато з цих генів потім видаляються, а геном переставляє себе і стабілізується, готовий повторно повторюватися. Ці події дублювання пов'язані з подіями видозміни та інвазії, і теорія полягає в тому, що …

1
Чи можна ці дані зібрати в пропорції для біноміального glm?
Ми попросили 60 людей перерахувати стільки франшиз ресторану в Атланті, скільки могли. Загальний список включав понад 70 ресторанів, але ми усунули ті, про які згадувало менше 10% людей, залишивши нас 45. На ці 45 ми підрахували частку інформаторів, які перелічили франшизу, і нас цікавить моделювання цієї пропорції як функції рекламного …

2
Параметр дисперсії у висновку GLM
Я провів glm в R, і біля нижньої частини summary()виводу, він констатує (Dispersion parameter for gaussian family taken to be 28.35031) Я зробив кілька розкопок в Google і дізнався, що параметр дисперсії використовується для відповідності стандартним помилкам. Я сподіваюся, що хтось міг би надати більш детальну інформацію про те, що …

1
Встановлення Poisson GLM в R - питання зі ставками проти підрахунків
В даний час я працюю над проектом, в якому беруть участь GLM (і, зрештою, GAM) з деякими підрахунками часу. Зазвичай я б робив це в SAS, але я намагаюся перейти до R, і у мене є ... проблеми. Коли я підходить GLM для підрахунку даних, використовуючи наступне: cdi_model <- glm(counts …

1
Як я можу адаптувати ANOVA для двійкових даних?
У мене є чотири конкуруючі моделі, які я використовую для прогнозування бінарної змінної результату (скажімо, статус зайнятості після закінчення навчання, 1 = працевлаштований, 0 = не зайнятий) для n предметів. Природним показником продуктивності моделі є показник враження, який становить відсоток правильних прогнозів для кожної з моделей. Мені здається, що я …

1
R / mgcv: Чому тензорні вироби te () і ti () створюють різні поверхні?
У mgcvпакеті Rє дві функції для встановлення тензорних взаємодій між продуктами: te()і ti(). Я розумію основний розподіл праці між двома (встановлення нелінійної взаємодії проти декомпозиції цієї взаємодії на основні ефекти та взаємодію). Чого я не розумію, це чому te(x1, x2)і ti(x1) + ti(x2) + ti(x1, x2)може давати (трохи) різні результати. …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 


1
OLS проти Poisson GLM з ідентифікаційним посиланням
Моє запитання виявляє моє слабке розуміння регресії Пуассона та ГЛМ загалом. Ось деякі підроблені дані, щоб проілюструвати моє запитання: ### some fake data x=c(1:14) y=c(0, 1, 2, 3, 1, 4, 9, 18, 23, 31, 20, 25, 37, 45) Деякі спеціальні функції для повернення psuedo-R2: ### functions of pseudo-R2 psuR2 <- …

1
Як вибрати ймовірність відсічення для рідкісної події Логістична регресія
У мене 100 000 спостережень (9 фіктивних змінних показників) з 1000 позитивних. Логістична регресія повинна спрацьовувати нормально в цьому випадку, але ймовірність відсічення мене спантеличує. У загальній літературі ми обираємо 50% відсікання для прогнозування 1 і 0. Я не можу цього зробити, оскільки моя модель дає максимальне значення ~ 1%. …

1
Тест на співвідношення ймовірності та тест Вальда дають різний висновок щодо glm в R
Я відтворюю приклад із узагальнених, лінійних та змішаних моделей . Мій MWE нижче: Dilution <- c(1/128, 1/64, 1/32, 1/16, 1/8, 1/4, 1/2, 1, 2, 4) NoofPlates <- rep(x=5, times=10) NoPositive <- c(0, 0, 2, 2, 3, 4, 5, 5, 5, 5) Data <- data.frame(Dilution, NoofPlates, NoPositive) fm1 <- glm(formula=NoPositive/NoofPlates~log(Dilution), family=binomial("logit"), …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.