Запитання з тегом «zero-inflation»

Зайві 0 у змінній порівняно із заданим розподільним посиланням. Регресійні підходи включають нульові завищені моделі та перешкоди (2-х частинні) моделі. Для підрахунку даних поширені нульово-надуті та перешкодні моделі на основі Пуассона чи негативні біноміальні розподіли (ZIP / ZINB та HP / HNB).

4
Діагностичні графіки для регресії підрахунку
Які діагностичні діаграми (і, можливо, формальні тести) ви вважаєте найбільш інформативними для регресій, де результат є змінною? Мене особливо цікавлять моделі Пуассона та негативні біноміальні моделі, а також нульові надуті та перешкоди для кожної з них. Більшість джерел, які я знайшов, просто побудують залишки проти встановлених значень без обговорення того, …

4
Яка різниця між нульовими і надутими моделями?
Цікаво, чи існує чітка різниця між так званими нульово-завищеними розподілами (моделями) та так званими розподілами перешкод-нуль (моделі)? У літературі такі терміни зустрічаються досить часто, і я підозрюю, що вони не однакові, але ви, будь ласка, поясніть мені різницю простими термінами?

3
Приклад: регресія LASSO з використанням glmnet для двійкового результату
Я починаю балуватися з використанням glmnetз LASSO регресією , де мій результат становить інтерес дихотомический. Я створив невеликий макетний кадр даних нижче: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

3
Чи є "модель перешкод" справді однією моделлю? Або просто дві окремі послідовні моделі?
Розглянемо модель перешкод, яка передбачає підрахунок даних yвід звичайного прогноктора x: set.seed(1839) # simulate poisson with many zeros x <- rnorm(100) e <- rnorm(100) y <- rpois(100, exp(-1.5 + x + e)) # how many zeroes? table(y == 0) FALSE TRUE 31 69 У цьому випадку я маю дані підрахунку …

1
Коли використовувати дані Пуассона проти геометричних та негативних біноміальних GLM для даних підрахунку?
Я намагаюся розмістити для себе, коли доречно використовувати тип регресії (геометричний, пуассонський, негативний двочлен) з даними підрахунку, в рамках GLM (лише 3 з 8 розподілів GLM використовуються для підрахунку даних, хоча більшість з них Я читав центри навколо негативних біноміальних та пуассонових розподілів). Коли використовувати дані Пуассона проти геометричних та …

4
Справа з 0,1 значенням у бета-регресії
У мене є деякі дані в [0,1], які я хотів би проаналізувати за допомогою бета-регресії. Звичайно, щось потрібно зробити, щоб вмістити 0,1 значення. Мені не подобається змінювати дані, щоб відповідати моделі. також я не вірю, що інфляція нуля і 1 - це гарна ідея, тому що я вважаю, що в …

5
Бета-регресія даних пропорцій, включаючи 1 і 0
Я намагаюся створити модель, для якої у мене є змінна відповідь, яка є пропорцією між 0 і 1, сюди входить досить багато 0 і 1, але також багато значень між ними. Я думаю про спробу бета-регресії. Пакет, який я знайшов для R (betareg), допускає значення лише між 0 і 1, …

2
Чому саме бета-регресія не може мати справу з 0 і 1 у змінній відповіді?
Бета-регресія (тобто GLM з бета-розподілом і, як правило, функцією посилання logit) часто рекомендується мати справу з змінною, яка залежить від відповіді, приймаючи значення між 0 і 1, такі як дроби, коефіцієнти або ймовірності: Регресія для результату (відношення або частка) між 0 і 1 . Однак завжди стверджується, що бета-регресію не …

3
Нульово-завищена модель негативних біноміальних змішаних ефектів в R
Чи існує такий пакет, який передбачає оцінку моделі нульових надутих негативних біноміальних змішаних ефектів у R? Під цим я маю на увазі: Нульова інфляція, де можна вказати біноміальну модель нульової інфляції, як у функції zeroinfl в пакеті pscl: zeroinfl (y ~ X | Z, dist = "негбін") де Z - …

1
Як моделювати невід’ємні нульові завищені безперервні дані?
На даний момент я намагаюся застосувати лінійну модель ( family = gaussian) до показника біорізноманіття, який не може приймати значення нижче нуля, є завищеним нулем і є безперервним. Значення варіюються від 0 до трохи більше 0,25. Як наслідок, в залишках моделі є досить очевидна закономірність, якої я не встиг позбутися: …

3
Чи може модель для негативних даних із збіганням нулів (Tweedie GLM, нульовий надутий GLM тощо) передбачити точні нулі?
Розподіл Tweedie може моделювати скошені дані з точковою масою в нулі, коли параметр (показник у співвідношенні середня дисперсія) знаходиться між 1 і 2.ppp Аналогічно, надута з нуля (будь-то безперервна чи дискретна) модель може мати велику кількість нулів. У мене виникають проблеми з розумінням того, що це так, що коли я …

3
Нульові завищені розподіли, що вони насправді?
Я намагаюся зрозуміти нульові завищені розподіли. Хто вони? В чому справа? Якщо у мене є дані з багатьма нулями, то я міг би підходити до логістичної регресії спочатку обчислити ймовірність нулів, а потім я міг видалити всі нулі, а потім підходити до звичайної регресії за допомогою мого вибору розподілу (пуассон, …

1
Нуль-завищена регресія Пуассона
Нехай Y=(Y1,…,Yn)′Y=(Y1,…,Yn)′ \textbf{Y} = (Y_1, \dots, Y_n)' незалежні і Yi=0Yi=kwith probability pi+(1−pi)e−λiwith probability (1−pi)e−λiλki/k!Yi=0with probability pi+(1−pi)e−λiYi=kwith probability (1−pi)e−λiλik/k!\eqalign{ Y_i = 0 & \text{with probability} \ p_i+(1-p_i)e^{-\lambda_i}\\ Y_i = k & \text{with probability} \ (1-p_i)e^{-\lambda_i} \lambda_{i}^{k}/k! } Припустимо також, що параметри і p = ( p 1 , … , p …

1
Проблема в пошуку хорошої моделі, підходить для підрахунку даних зі змішаними ефектами - ZINB чи щось інше?
У мене дуже мало набору даних про величину одиночних бджіл, які у мене виникають проблеми з аналізом. Це дані підрахунку, і майже всі підрахунки знаходяться в одній обробці з більшістю нулів в іншій обробці. Також є пара дуже високих значень (по одному на два з шести ділянок), тому розподіл підрахунків …

2
Як я можу встановити нульовий нагнітаний пуассон в JAGS?
Я намагаюся створити нульову завищену модель пуассона в R та JAGS. Я новачок у JAGS, і мені потрібні поради, як це зробити. Я намагався із наступним, де y [i] - спостерігається змінна model { for (i in 1:I) { y.null[i] <- 0 y.pois[i] ~ dpois(mu[i]) pro[i] <- ilogit(theta[i]) x[i] ~ …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.