Статистика та великі дані regression

3

Програмний пакет для вирішення лінійної регресії норми L-нескінченності

Чи є пакет програм для вирішення лінійної регресії з метою мінімізації норми L-нескінченності.

10 regression

2

Поздовжні дані: часовий ряд, повторні заходи чи щось інше?

Простий англійською мовою: у мене є множинна регресія або ANOVA модель, але змінна відповідь для кожної людини є криволінійною функцією часу. Як я можу визначити, яка з правої змінної відповідає правовим змінам кривих та вертикальних зміщень кривих? Це проблема часових рядів, проблема повторних заходів чи щось інше цілком? Які найкращі …

10 regression time-series mixed-model repeated-measures panel-data

1

Поради щодо визначення форми кривої за допомогою Quantreg

Я використовую пакунок Quantreg, щоб зробити модель регресії, використовуючи 99-й перцентиль моїх значень у наборі даних. На основі порад з попереднього запитання про stackoverflow, який я задав, я використав таку структуру коду. mod <- rq(y ~ log(x), data=df, tau=.99) pDF <- data.frame(x = seq(1,10000, length=1000) ) pDF <- within(pDF, y …

10 regression logarithm

2

Порівняння змішаної моделі (предмет як випадковий ефект) з простою лінійною моделлю (предмет як фіксований ефект)

Я закінчую аналіз на великому наборі даних. Я хотів би взяти лінійну модель, використану в першій частині роботи, і перевстановити її за допомогою лінійної змішаної моделі (LME). LME був би дуже схожим за винятком того, що одна із змінних, що використовуються в моделі, буде використовуватися як випадковий ефект. Ці дані …

10 r regression hypothesis-testing mixed-model lme4-nlme

2

Використовуйте формулу тенденції, щоб отримати значення для будь-якого даного X за допомогою Excel

Чи є простий спосіб застосувати формулу лінії тренду з діаграми до будь-якого заданого значення X у Excel? Наприклад, я хочу отримати значення Y для заданого X = $ 2,006,00. Я вже взяв формулу і повторно ввів її: =-0.000000000008*X^3 - 0.00000001*X^2 + 0.0003*X - 0.0029 Я постійно вношу корективи в лінію …

10 regression excel

2

Складний регресійний сюжет в R

Мені потрібно намалювати складну графіку для візуального аналізу даних. У мене є 2 змінні та велика кількість випадків (> 1000). Наприклад (число 100, якщо зробити дисперсію менш "нормальною"): x <- rnorm(100,mean=95,sd=50) y <- rnorm(100,mean=35,sd=20) d <- data.frame(x=x,y=y) 1) Мені потрібно побудувати необроблені дані з розміром точки, що відповідають відносній частоті …

10 r data-visualization regression

1

Накреслення кускової регресійної лінії

Чи існує спосіб побудови лінії регресії подібної кускової моделі, крім використання linesдля побудови кожного сегмента окремо, або використання geom_smooth(aes(group=Ind), method="lm", fill=FALSE)? m.sqft <- mean(sqft) model <- lm(price~sqft+I((sqft-m.sqft)*Ind)) # sqft, price: continuous variables, Ind: if sqft>mean(sqft) then 1 else 0 plot(sqft,price) abline(reg = model) Warning message: In abline(reg = model) : …

10 r data-visualization regression

3

Ресурси для вивчення фальшивої регресії часових рядів

"Помилкова регресія" (в контексті часових рядів) і пов'язані з ними терміни, такі як одиничні кореневі тести - це те, про що я багато чув, але ніколи не розумів. Чому / коли інтуїтивно це відбувається? (Я вважаю, що це коли ваші два часові ряди спільно інтегруються, тобто деяка лінійна комбінація обох …

10 time-series regression cointegration

1

У R, чи відповідає "glmnet" перехоплення?

Мені підходить лінійна модель в R, використовуючи glmnet. Оригінальна (нерегульована) модель була пристосована з використанням lmі не мала постійного терміну (тобто вона була у формі lm(y~0+x1+x2,data)). glmnetприймає матрицю предикторів та вектор відповідей. Я читав glmnetдокументацію і не можу знайти згадки про постійний термін. Отже, чи є спосіб попросити glmnetпримусити лінійне …

10 r regression lasso

2

Як обчислити довірчі інтервали на коефіцієнти регресії в PLS?

Основна модель PLS полягає в тому, що заданий матриця і вектор пов'язані між собою де - латентна матриця , і - терміни шуму (sssuming - по центру).X n y X = T P ′ + E , y = T q ′ + f , T n × k E …

10 regression confidence-interval latent-variable partial-least-squares

1

Різниця між GLS та SUR

Я читав дещо про узагальнені найменші квадрати (GLS) і намагався прив’язати його до мого основного економетричного фону. Я пригадую, як в середній школі використовували начебто непов'язану регресію (SUR), яка дещо схожа на GLS. Один документ, на який я натрапив, навіть назвав SUR «особливим випадком» GLS. Але я все ще не …

10 regression generalized-least-squares

1

Який тип остаточних аналізів ви використовуєте?

Виконуючи множинні лінійні регресії OLS, замість того, щоб будувати залишки проти встановлених значень, я будую (внутрішні) досліджені залишки проти встановлених значень (ditto для коваріатів). Ці залишки визначаються як: e∗i=eis2(1−hii)−−−−−−−−−√ei∗=eis2(1−hii)\begin{equation} e^*_i = \frac{e_i}{\sqrt{s^2 (1-h_{ii})}} \end{equation} де - залишковий, а - діагональні елементи матриці капелюхів. Щоб отримати ці студизовані залишки в R, …

10 regression residuals diagnostic

2

Чому в лінійній регресії ми повинні включати квадратичні терміни, коли нас цікавлять лише терміни взаємодії?

Припустимо, мене цікавить модель лінійної регресії для , тому що я хотів би побачити, чи взаємодія між двома коваріатами впливає на Y.Yi=β0+β1х1+β2х2+β3х1х2Yi=β0+β1x1+β2x2+β3x1x2Y_i = \beta_0 + \beta_1x_1 + \beta_2x_2 + \beta_3x_1x_2 У курсових записках професорів (з якими я не маю контактів) вказується: Якщо включати умови взаємодії, ви повинні включити їх умови …

10 regression multiple-regression interaction linear-model

2

Чому ми використовуємо залишки для перевірки припущень щодо помилок у регресії?

Припустимо, у нас є модель .Yi=β0+β1Xi1+β2Xi2+⋯+βkXik+ϵiYi=β0+β1Xi1+β2Xi2+⋯+βkXik+ϵiY_i = \beta_0 + \beta_1X_{i1} + \beta_2X_{i2} + \dots + \beta_kX_{ik} + \epsilon_i Регресія має ряд припущень, наприклад, що помилки повинні бути нормально розподілені із середнім нулем та постійною дисперсією. Мене вчили перевіряти ці припущення, використовуючи звичайний графік QQ, щоб перевірити нормальність залишків та графік …

10 regression residuals error

1

Яка різниця між функцією прийняття рішення, прогнозом_проблемою та функцією передбачення для проблеми логістичної регресії?

Я переглядав документацію sklearn, але не можу зрозуміти мету цих функцій в контексті логістичної регресії. Бо decision_functionвін говорить, що його відстань між гіперпланом і тестовим екземпляром. чим корисна ця конкретна інформація? і як це стосується predictта predict-probaметодів?

10 regression logistic prediction scikit-learn decision

Запитання з тегом «regression»