Статистика та великі дані regression

1

Різниця між первинною, подвійною та регресією хребта Кернел

Яка різниця між Primal , подвійною та регресією керневого хребта? Люди використовують усіх трьох, і через різні позначення, якими користуються всі в різних джерелах, мені важко дотримуватися. То чи може хтось простими словами сказати мені, в чому різниця між цими трьома? Крім того, які можуть бути деякі переваги чи недоліки …

18 regression kernel-trick ridge-regression

1

Як перевірити статистичну значимість категоріальної змінної в лінійній регресії?

Якщо в лінійній регресії у мене є категоріальна змінна ... як я можу знати статичну значимість категоріальної змінної? Скажімо , фактор X1X1X_1 має 10 рівнів ... буде 10 різних результуючі значення т-під парасольки змінної один фактор ...X1X1X_1 Мені здається, що статистичне значення перевіряється для кожного рівня факторної змінної? Ні? @Macro: …

18 regression statistical-significance categorical-data

1

Якщо довірчі інтервали для коефіцієнтів лінійної регресії повинні базуватися на нормалі або

Будемо мати лінійну модель, наприклад просто просту ANOVA: # data generation set.seed(1.234) Ng <- c(41, 37, 42) data <- rnorm(sum(Ng), mean = rep(c(-1, 0, 1), Ng), sd = 1) fact <- as.factor(rep(LETTERS[1:3], Ng)) m1 = lm(data ~ 0 + fact) summary(m1) Результат такий: Call: lm(formula = data ~ 0 + …

18 r regression confidence-interval

2

Чи є графічне зображення компромісу дисперсії зміщення в лінійній регресії?

Я страждаю від затемнення. Мені було подано наступне зображення, щоб продемонструвати компроміс-відхилення в контексті лінійної регресії: Я можу бачити, що жодна з двох моделей не підходить. "Прості" не оцінюють складність XY-відношення, а "комплекс" - це просто надмірно, в основному вивчаючи дані тренувань напам'ять. Однак я цілком не бачу упередженості та …

18 regression variance bias

2

Який правильний спосіб перевірити на значні відмінності між коефіцієнтами?

Я сподіваюся, що хтось може допомогти виправити для мене точку плутанини. Скажіть, я хочу перевірити, чи значно відрізняються два набори коефіцієнтів регресії один від одного, встановивши наступне: yi=α+βxi+ϵiyi=α+βxi+ϵiy_i = \alpha + \beta x_i + \epsilon_i , з 5 незалежними змінними. 2 групи з приблизно однаковими розмірами n1,n2n1,n2n_1, n_2 (хоча це …

18 regression hypothesis-testing multiple-regression

3

Як моделювати обмежену змінну цілі?

У мене є 5 змінних, і я намагаюся передбачити свою цільову змінну, яка повинна бути в межах від 0 до 70. Як я можу використовувати цю інформацію для кращого моделювання своєї цілі?

18 regression bounds

4

Якщо мені потрібна інтерпретаційна модель, чи існують інші методи, крім лінійної регресії?

Я зіткнувся з деякими статистиками, які ніколи не використовують для прогнозування інші моделі, окрім лінійної регресії, оскільки вони вважають, що "моделі ML", такі як випадкове збільшення лісу або градієнта, важко пояснити або "не інтерпретувати". У лінійній регресії, враховуючи, що набір припущень перевірено (нормальність помилок, гомоскедастичність, відсутність мультиколінеарності), t-тести забезпечують спосіб …

18 regression machine-learning multiple-regression model-interpretation

5

Чому мій R-квадрат настільки низький, коли моя t-статистика настільки велика?

Я побіг регресії з 4 змінних, і всі вони дуже статистично значущими, зі значеннями T ≈7,9,26≈7,9,26\approx 7,9,26 і 313131 (я говорю ≈≈\approx бо здається недоречним включати десяткові) , які є дуже високими і чітко значущими. Але тоді R2R2R^2 лише .2284. Чи неправильно я тлумачу значення t тут, щоб означати те, …

18 regression hypothesis-testing econometrics

1

Припущення LASSO

У сценарії регресії LASSO де y=Xβ+ϵy=Xβ+ϵy= X \beta + \epsilon , і оцінки LASSO даються наступною проблемою оптимізації minβ||y−Xβ||+τ||β||1minβ||y−Xβ||+τ||β||1 \min_\beta ||y - X \beta|| + \tau||\beta||_1 Чи існують припущення щодо розповсюдження інформації щодо ϵϵ\epsilon ? У сценарії OLS можна очікувати, що є незалежним та нормально розподіленим.ϵϵ\epsilon Чи має сенс аналізувати …

18 regression lasso assumptions residuals

2

категоризація змінної перетворює її з незначної на значущу

У мене є числова змінна, яка виявляється несуттєвою в багатовимірній логістичній регресійній моделі. Однак, коли я класифікую його на групи, раптом він стає значущим. Для мене це дуже протиінтуїтивно: коли класифікуємо змінну, ми видаємо деяку інформацію. Як це може бути?

17 regression logistic statistical-significance multivariate-analysis

3

Яким чином можна отримати хорошу лінійну регресійну модель, коли немає суттєвої кореляції між результатами та прогнокторами?

Я тренував лінійну регресійну модель, використовуючи набір змінних / особливостей. І модель має хороші показники. Однак я зрозумів, що немає змінної, яка б добре співвідносилась із прогнозованою змінною. Як це можливо?

17 regression machine-learning correlation multiple-regression linear-model

3

Чому б не використати «звичайні рівняння», щоб знайти прості найменші коефіцієнти квадратів?

Я побачив цей список тут і не міг повірити, що існує стільки способів вирішити найменші квадрати. «Нормальні рівняння» на Вікіпедії , здавалося, досить прямим α^β^=y¯−β^x¯,=∑ni=1(xi−x¯)(yi−y¯)∑ni=1(xi−x¯)2α^=y¯−β^x¯,β^=∑i=1n(xi−x¯)(yi−y¯)∑i=1n(xi−x¯)2 {\displaystyle {\begin{aligned}{\hat {\alpha }}&={\bar {y}}-{\hat {\beta }}\,{\bar {x}},\\{\hat {\beta }}&={\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})(y_{i}-{\bar {y}})}{\sum _{i=1}^{n}(x_{i}-{\bar {x}})^{2}}}\end{aligned}}} То чому б просто не використовувати їх? Я припускав, …

17 regression least-squares scikit-learn

1

Чи існує байєсова інтерпретація лінійної регресії з одночасною регуляризацією L1 та L2 (також пружна сітка)?

Добре відомо, що лінійна регресія з покаранням еквівалентна знаходженню оцінки ПДЧ, заданої Гауссовим попереднім коефіцієнтом. Аналогічно, використання штрафу l 1 еквівалентно використанню розподілу Лапласа як попереднього.л2л2l^2л1л1l^1 Не рідкість використання деякої зваженої комбінації регуляризації та l 2 . Чи можемо ми сказати, що це еквівалентно деякому попередньому розподілу коефіцієнтів (інтуїтивно, здається, …

17 regression bayesian regularization prior elastic-net

2

Чому саме бета-регресія не може мати справу з 0 і 1 у змінній відповіді?

Бета-регресія (тобто GLM з бета-розподілом і, як правило, функцією посилання logit) часто рекомендується мати справу з змінною, яка залежить від відповіді, приймаючи значення між 0 і 1, такі як дроби, коефіцієнти або ймовірності: Регресія для результату (відношення або частка) між 0 і 1 . Однак завжди стверджується, що бета-регресію не …

17 regression generalized-linear-model beta-distribution zero-inflation beta-regression

2

Різниця між регресійним аналізом та підгоном кривої

Чи може хто-небудь, будь ласка, пояснити мені реальну різницю між регресійним аналізом та приміркою кривої (лінійною та нелінійною), якщо це можливо? Схоже, що обидва намагаються знайти залежність між двома змінними (залежною від незалежної), а потім визначити параметр (або коефіцієнт), пов'язаний із запропонованими моделями. Наприклад, якщо у мене є набір даних, …

17 regression multiple-regression fitting roc curve-fitting

Запитання з тегом «regression»