Запитання з тегом «regression»

Методи аналізу взаємозв'язку між однією (або більше) змінними "залежними" та "незалежними" змінними.


2
Поздовжні дані: часовий ряд, повторні заходи чи щось інше?
Простий англійською мовою: у мене є множинна регресія або ANOVA модель, але змінна відповідь для кожної людини є криволінійною функцією часу. Як я можу визначити, яка з правої змінної відповідає правовим змінам кривих та вертикальних зміщень кривих? Це проблема часових рядів, проблема повторних заходів чи щось інше цілком? Які найкращі …

1
Поради щодо визначення форми кривої за допомогою Quantreg
Я використовую пакунок Quantreg, щоб зробити модель регресії, використовуючи 99-й перцентиль моїх значень у наборі даних. На основі порад з попереднього запитання про stackoverflow, який я задав, я використав таку структуру коду. mod <- rq(y ~ log(x), data=df, tau=.99) pDF <- data.frame(x = seq(1,10000, length=1000) ) pDF <- within(pDF, y …

2
Порівняння змішаної моделі (предмет як випадковий ефект) з простою лінійною моделлю (предмет як фіксований ефект)
Я закінчую аналіз на великому наборі даних. Я хотів би взяти лінійну модель, використану в першій частині роботи, і перевстановити її за допомогою лінійної змішаної моделі (LME). LME був би дуже схожим за винятком того, що одна із змінних, що використовуються в моделі, буде використовуватися як випадковий ефект. Ці дані …

2
Використовуйте формулу тенденції, щоб отримати значення для будь-якого даного X за допомогою Excel
Чи є простий спосіб застосувати формулу лінії тренду з діаграми до будь-якого заданого значення X у Excel? Наприклад, я хочу отримати значення Y для заданого X = $ 2,006,00. Я вже взяв формулу і повторно ввів її: =-0.000000000008*X^3 - 0.00000001*X^2 + 0.0003*X - 0.0029 Я постійно вношу корективи в лінію …
10 regression  excel 

2
Складний регресійний сюжет в R
Мені потрібно намалювати складну графіку для візуального аналізу даних. У мене є 2 змінні та велика кількість випадків (> 1000). Наприклад (число 100, якщо зробити дисперсію менш "нормальною"): x <- rnorm(100,mean=95,sd=50) y <- rnorm(100,mean=35,sd=20) d <- data.frame(x=x,y=y) 1) Мені потрібно побудувати необроблені дані з розміром точки, що відповідають відносній частоті …

1
Накреслення кускової регресійної лінії
Чи існує спосіб побудови лінії регресії подібної кускової моделі, крім використання linesдля побудови кожного сегмента окремо, або використання geom_smooth(aes(group=Ind), method="lm", fill=FALSE)? m.sqft <- mean(sqft) model <- lm(price~sqft+I((sqft-m.sqft)*Ind)) # sqft, price: continuous variables, Ind: if sqft>mean(sqft) then 1 else 0 plot(sqft,price) abline(reg = model) Warning message: In abline(reg = model) : …

3
Ресурси для вивчення фальшивої регресії часових рядів
"Помилкова регресія" (в контексті часових рядів) і пов'язані з ними терміни, такі як одиничні кореневі тести - це те, про що я багато чув, але ніколи не розумів. Чому / коли інтуїтивно це відбувається? (Я вважаю, що це коли ваші два часові ряди спільно інтегруються, тобто деяка лінійна комбінація обох …

1
У R, чи відповідає "glmnet" перехоплення?
Мені підходить лінійна модель в R, використовуючи glmnet. Оригінальна (нерегульована) модель була пристосована з використанням lmі не мала постійного терміну (тобто вона була у формі lm(y~0+x1+x2,data)). glmnetприймає матрицю предикторів та вектор відповідей. Я читав glmnetдокументацію і не можу знайти згадки про постійний термін. Отже, чи є спосіб попросити glmnetпримусити лінійне …
10 r  regression  lasso 


1
Різниця між GLS та SUR
Я читав дещо про узагальнені найменші квадрати (GLS) і намагався прив’язати його до мого основного економетричного фону. Я пригадую, як в середній школі використовували начебто непов'язану регресію (SUR), яка дещо схожа на GLS. Один документ, на який я натрапив, навіть назвав SUR «особливим випадком» GLS. Але я все ще не …

1
Який тип остаточних аналізів ви використовуєте?
Виконуючи множинні лінійні регресії OLS, замість того, щоб будувати залишки проти встановлених значень, я будую (внутрішні) досліджені залишки проти встановлених значень (ditto для коваріатів). Ці залишки визначаються як: e∗i=eis2(1−hii)−−−−−−−−−√ei∗=eis2(1−hii)\begin{equation} e^*_i = \frac{e_i}{\sqrt{s^2 (1-h_{ii})}} \end{equation} де - залишковий, а - діагональні елементи матриці капелюхів. Щоб отримати ці студизовані залишки в R, …

2
Чому в лінійній регресії ми повинні включати квадратичні терміни, коли нас цікавлять лише терміни взаємодії?
Припустимо, мене цікавить модель лінійної регресії для , тому що я хотів би побачити, чи взаємодія між двома коваріатами впливає на Y.Yi=β0+β1х1+β2х2+β3х1х2Yi=β0+β1x1+β2x2+β3x1x2Y_i = \beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2 У курсових записках професорів (з якими я не маю контактів) вказується: Якщо включати умови взаємодії, ви повинні включити їх умови …

2
Чому ми використовуємо залишки для перевірки припущень щодо помилок у регресії?
Припустимо, у нас є модель .Yi=β0+β1Xi1+β2Xi2+⋯+βkXik+ϵiYi=β0+β1Xi1+β2Xi2+⋯+βkXik+ϵiY_i = \beta_0 + \beta_1X_{i1} + \beta_2X_{i2} + \dots + \beta_kX_{ik} + \epsilon_i Регресія має ряд припущень, наприклад, що помилки повинні бути нормально розподілені із середнім нулем та постійною дисперсією. Мене вчили перевіряти ці припущення, використовуючи звичайний графік QQ, щоб перевірити нормальність залишків та графік …

1
Яка різниця між функцією прийняття рішення, прогнозом_проблемою та функцією передбачення для проблеми логістичної регресії?
Я переглядав документацію sklearn, але не можу зрозуміти мету цих функцій в контексті логістичної регресії. Бо decision_functionвін говорить, що його відстань між гіперпланом і тестовим екземпляром. чим корисна ця конкретна інформація? і як це стосується predictта predict-probaметодів?

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.