Запитання з тегом «residuals»

Залишки моделі - це фактичні значення за вирахуванням прогнозованих значень. Багато статистичних моделей роблять припущення про помилку, яка оцінюється залишками.

1
Який тип остаточних аналізів ви використовуєте?
Виконуючи множинні лінійні регресії OLS, замість того, щоб будувати залишки проти встановлених значень, я будую (внутрішні) досліджені залишки проти встановлених значень (ditto для коваріатів). Ці залишки визначаються як: e∗i=eis2(1−hii)−−−−−−−−−√ei∗=eis2(1−hii)\begin{equation} e^*_i = \frac{e_i}{\sqrt{s^2 (1-h_{ii})}} \end{equation} де - залишковий, а - діагональні елементи матриці капелюхів. Щоб отримати ці студизовані залишки в R, …

2
Чому ми використовуємо залишки для перевірки припущень щодо помилок у регресії?
Припустимо, у нас є модель .Yi=β0+β1Xi1+β2Xi2+⋯+βkXik+ϵiYi=β0+β1Xi1+β2Xi2+⋯+βkXik+ϵiY_i = \beta_0 + \beta_1X_{i1} + \beta_2X_{i2} + \dots + \beta_kX_{ik} + \epsilon_i Регресія має ряд припущень, наприклад, що помилки повинні бути нормально розподілені із середнім нулем та постійною дисперсією. Мене вчили перевіряти ці припущення, використовуючи звичайний графік QQ, щоб перевірити нормальність залишків та графік …

1
Різниця між Outlier та Inlier
Я натрапив на термін inlier в мірі LOF (Local Outlier Factor), я знайомий з терміном "outliers" (в основному, laers - екземпляри, які не поводяться як решта екземплярів). Що означає "Inliers" у контексті виявлення аномалії? і як це пов’язано з (відмінними від) пережилими?

1
Студизовані залишки v / s стандартизовані залишки в lm-моделі
Чи "студизовані залишки" та "стандартизовані залишки" однакові у регресійних моделях? Я побудував модель лінійної регресії в R і хотів побудувати графік встановлених значень Studentized залишків v / s, але не знайшов автоматизованого способу зробити це в Р. Припустимо, у мене є модель library(MASS) lm.fit <- lm(Boston$medv~(Boston$lstat)) то використання plot(lm.fit)не дає …

3
Залишки завантаження: Чи я це роблю правильно?
Насамперед: З того, що я зрозумів, залишкові завантажувальні роботи залишаються таким чином: Підходить модель до даних Обчисліть залишки Перекомпонуйте залишки та додайте їх до 1. Підібрати модель до нового набору даних з 3. Повторіть nрази, але завжди додайте залишки, що перекомпоновані, у відповідність з 1. Чи правильно це поки що? …

2
Спостерігається лівий косий та симетричний розподіл
Це мені досить важко описати, але я спробую зробити свою проблему зрозумілою. Тому спочатку ви повинні знати, що я до цього часу робив дуже просту лінійну регресію. Перш ніж оцінити коефіцієнт, я спостерігав за розподілом свого . Це важкий лівий косий. Після того, як я оцінив модель, я повністю впевнено …

3
Регресування залишків логістичної регресії на інших регресорах
За допомогою регресії OLS, застосованої для безперервної реакції, можна скласти рівняння множинної регресії шляхом послідовно запущених регресій залишків на кожному коваріаті. Моє запитання: чи існує спосіб це зробити за допомогою логістичної регресії через залишки логістичної регресії ? Тобто, якщо я хочу оцінити використовуючи стандартний узагальнений підхід лінійного моделювання, чи є …

4
Чи можливо розкласти встановлені залишки на зміщення та дисперсію після встановлення лінійної моделі?
Я б хотів класифікувати точки даних як або потребують більш складної моделі, або не потребують більш складної моделі. Моє сучасне мислення полягає в тому, щоб підключити всі дані до простої лінійної моделі та дотримуватися розмір залишків, щоб зробити цю класифікацію. Потім я почитав про зміщення та вкладення дисперсії в помилку …

2
Як залишки відносяться до основних порушень?
Методом найменших квадратів ми хочемо оцінити невідомі параметри в моделі: Yj= α + βхj+εj( j = 1 ... n )Yj=α+βxj+εj(j=1...n)Y_j = \alpha + \beta x_j + \varepsilon_j \enspace (j=1...n) Після того як ми зробили це (для деяких спостережуваних значень), ми отримаємо пристосовану регресійну лінію: Yj=α^+β^х +еj( J = 1 , …

2
Чому залишки Пірсона від негативної біноміальної регресії менше, ніж ті, що виникають в результаті пуассонової регресії?
У мене є ці дані: set.seed(1) predictor <- rnorm(20) set.seed(1) counts <- c(sample(1:1000, 20)) df <- data.frame(counts, predictor) Я провів пуассонову регресію poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson") І негативна біноміальна регресія: require(MASS) nb_counts <- glm.nb(counts ~ predictor, data = df) Тоді я обчислював статистику …

1
Чому кореляція залишків не має значення при тестуванні на нормальність?
Коли (тобто походить від лінійної регресійної моделі), і в цьому випадку залишки співвідносні і не є незалежними. Але коли ми робимо регресійну діагностику і хочемо перевірити припущення , кожен підручник пропонує використовувати графіки Q – Q та статистичні тести на залишки які були розроблені для перевірки, чи для деяких .Y=AX+εY=AX+εY …

2
Кореляція між категоріями між категоричними номінальними змінними
У мене є набір даних з двома категоричними номінальними змінними (обидві з 5 категоріями). Мені хотілося б знати, чи (і як) мені вдається виявити потенційні кореляції між категоріями цих двох змінних. Іншими словами, чи, наприклад, результати категорії в змінній 1 показують сильну кореляцію з конкретною категорією у змінній 2. Оскільки …

4
Коли використовувати непараметричну регресію?
Я використовую PROC GLM в SAS, щоб підходити до рівняння регресії наступної форми Y=б0+б1Х1+б2Х2+б3Х3+б4тY=b0+b1X1+b2X2+b3X3+b4t Y = b_0 + b_1X_1 + b_2X_2 + b_3X_3 + b_4t Діаграма QQ результуючих червоних осіб вказує на відхилення від нормальності. Будь-яка трансформація не корисна для того, щоб зробити залишки нормальними.YYY На цьому етапі я можу …

1
Як зрозуміти стандартизований залишковий аналіз в регресійному аналізі?
Відповідно до регресійного аналізу за прикладом , залишковим є різниця між реакцією та передбачуваним значенням, тоді говорять, що кожен залишок має різну дисперсію, тому нам потрібно враховувати стандартизовані залишки. Але дисперсія призначена для групи значень, як може мати одне значення дисперсія?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.