Запитання з тегом «residuals»

Залишки моделі - це фактичні значення за вирахуванням прогнозованих значень. Багато статистичних моделей роблять припущення про помилку, яка оцінюється залишками.

2
Оцінка логістичних регресійних моделей
Це питання виникає з моєї фактичної плутанини щодо того, як вирішити, чи достатньо хороша логістична модель. У мене є моделі, які використовують стан пар індивідуальний проект через два роки після їх формування як залежної змінної. Результат успішний (1) чи ні (0). У мене є незалежні змінні, виміряні в момент утворення …

2
Родина GLM представляє розподіл змінної відповіді або залишків?
Я обговорював з декількома членами лабораторії про це, і ми перейшли до кількох джерел, але все ще не дуже відповіді: Коли ми кажемо, що у GLM є сім'я пуассонів , скажімо, ми говоримо про розподіл залишків або змінну відповіді? Суперечки Читаючи цю статтю, в ній зазначається, що припущеннями GLM є …

1
Пакет GBM проти Caret з використанням GBM
Я налаштовував модель за допомогою caret, але потім повторно запустив модель за допомогою gbmпакета. Наскільки я розумію, що caretпакет використовує gbmі вихід повинен бути однаковим. Однак, лише швидкий тестовий пробіг із застосуванням data(iris)показує невідповідність моделі приблизно 5%, використовуючи RMSE і R ^ 2 в якості метрики оцінювання. Я хочу знайти …

3
Залишкова автокореляція проти залежної залежної змінної
При моделюванні часових рядів є можливість (1) моделювати кореляційну структуру термінів помилки, наприклад, процес AR (1) (2) включає відсталу залежну змінну як пояснювальну змінну (праворуч) Я розумію, що їх причини іноді є істотними причинами (2). Однак які методичні причини робити або (1), або (2), або навіть обидва?

2
Чи більш імовірно, що зазвичай розподілені X і Y призводять до нормально розподілених залишків?
Тут обговорюється неправильне трактування припущення про нормальність в лінійній регресії (що "нормальність" позначає X та / або Y, а не залишки), і плакат запитує, чи можливо не нормально розподілені X і Y і все ще мають нормально розподілені залишки. Моє запитання: як правило, розподілені X і Y мають більше шансів …

5
Як виконати імпутацію значень у дуже великій кількості точок даних?
У мене дуже великий набір даних, і близько 5% випадкових значень відсутні. Ці змінні співвідносяться між собою. Наступний приклад набору даних R - це лише іграшковий приклад з манекено-корельованими даними. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

4
Припущення щодо регресійного залишкового розподілу
Чому необхідно розміщувати припущення про розподіл на помилках, тобто yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , приϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) . Чому б не написати yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} зуi∼ N( Xβ^, σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) , де в будь-якому випадку ϵi= уi- у^ϵi=yi−y^\epsilon_i = y_i - \hat{y} . Я бачив, як …

2
Чому деякі люди перевіряють регресійні припущення щодо моделей на своїх необроблених даних, а інші перевіряють їх на залишкові?
Я докторант з експериментальної психології і намагаюся вдосконалити свої вміння та знання щодо того, як аналізувати свої дані. До мого 5-го курсу психології я вважав, що регресійні моделі (наприклад, ANOVA) передбачають такі речі: нормальність даних дисперсія гомогенності даних тощо Мої бакалаврські курси спонукають мене до думки, що припущення стосуються даних. …

2
Який очікуваний розподіл залишків у узагальненій лінійній моделі?
Я виконую узагальнену лінійну модель, де мені потрібно вказати сім’ю, відмінну від звичайної. Який очікуваний розподіл залишків? Наприклад, чи слід нормально розподіляти залишки?

2
Залишковий аналіз логістичної регресії
Це питання є загальним і довготривалим, але будь ласка, майте на увазі мене. У своєму застосуванні у мене є безліч наборів даних, кожен складається з ~ 20000 точок даних з ~ 50 особливостями та однією залежною бінарною змінною. Я намагаюся моделювати набори даних за допомогою регульованої логістичної регресії (пакет R …

1
Точний тест Фішера та гіпергеометричне поширення
Я хотів краще зрозуміти точний тест Фішера, тому я розробив наступний іграшковий приклад, де f і m відповідає чоловічому та жіночому, а n і y відповідає такому "споживання соди", як це: > soda_gender f m n 0 5 y 5 0 Очевидно, це різке спрощення, але я не хотів, щоб …

1
Чому діагностика заснована на залишках?
У простій лінійній регресії часто хочеться перевірити, чи виконуються певні припущення, щоб можна було зробити висновок (наприклад, залишки зазвичай розподіляються). Чи доцільно перевіряти припущення, перевіряючи, чи правильно розміщені встановлені значення?

2
Гетероскедастичність і нормальність залишків
Я маю лінійну регресію, що досить добре, я думаю (це для університетського проекту, тому я не повинен бути дуже точним). Справа в тому, що якщо я побудую залишки проти передбачуваних значень, є (на думку мого вчителя) натяк на гетероскдастичність. Але якщо я побудую QQ-графік залишків, зрозуміло, що вони зазвичай розподіляються. …

2
Як сказати, чи є залишки автокорельовані з графікою
Коли ви робите регресію OLS та намічаєте отримані залишки, як ви можете визначити, чи є залишки автокорельовані? Я знаю, що для цього є тести (Дурбін, Бреш-Годфрі), але мені було цікаво, чи можна просто подивитися на сюжет, щоб оцінити, чи може бути автокореляція проблемою (адже для гетерокедастичності це зробити досить просто).

2
Встановлення множинної лінійної регресії в R: автокорельовані залишки
Я намагаюся оцінити кратну лінійну регресію в R з таким рівнянням: regr <- lm(rate ~ constant + askings + questions + 0) запитання та запитання - це квартальні часові ряди даних, побудовані з askings <- ts(...). Проблема зараз полягає в тому, що я отримав автокорельовані залишки. Я знаю, що можна …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.