Статистика та великі дані regression

4

У мене є бінарна логістична регресійна модель з псевдо-R-квадратом Макфаддена 0,192 з залежною змінною, що називається платежем (1 = платіж і 0 = відсутність платежу). Яка інтерпретація цього псевдо R-квадрата? Чи відносне порівняння для вкладених моделей (наприклад, 6-змінна модель має псевдо-R-квадрат Макфаддена 0,192, тоді як 5-змінна модель (після вилучення однієї …

29 regression self-study logistic

4

Як перевести результати з lm () в рівняння?

Ми можемо використовувати lm()для прогнозування значення, але нам все ж потрібне рівняння формули результату в деяких випадках. Наприклад, додайте рівняння до графіків.

29 r regression lm

3

Поліноміальна регресія за допомогою scikit-learn

Я намагаюся використовувати scikit-learn для поліноміальної регресії. З того, що я читаю, поліноміальна регресія є особливим випадком лінійної регресії. Я сподівався, що, можливо, одна із узагальнених лінійних моделей scikit може бути параметризована для розміщення поліномів вищого порядку, але я не бачу варіанту для цього. Мені вдалося скористатись регрессором векторної підтримки …

29 regression machine-learning large-data polynomial scikit-learn

4

Як ви інтерпретуєте RMSLE (кореневу логарифмічну помилку середнього рівня)?

Я проводив змагання з машинного навчання, де вони використовують RMSLE (кореневу середню квадратичну логарифмічну помилку), щоб оцінити ефективність, прогнозуючи ціну продажу категорії обладнання. Проблема в тому, що я не впевнений, як інтерпретувати успіх свого остаточного результату. Наприклад , якщо я досяг RMSLE з я міг підняти його експонентну потужність і …

29 regression machine-learning interpretation measurement-error theory

3

R: Випадковий ліс, який кидає NaN / Inf у помилці "виклику іноземної функції", незважаючи на відсутність набору даних NaN [закритий]

Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закрито 2 роки тому . Я використовую caret, щоб запустити перехрещений випадковий ліс над набором даних. Змінна Y - фактор. У моєму наборі даних немає NaN, Inf …

29 r random-forest caret regression prediction fitting social-science poisson-distribution distributions characteristic-function bayesian prior regression normal-distribution interaction nonparametric skewness svm standard-deviation standard-error regression-coefficients igraph natural-language word2vec word-embeddings regression machine-learning sampling r regression machine-learning random-forest ensemble sampling unbiased-estimator proof estimators mse probability conditional-probability bayes anova missing-data neural-networks recommender-system r confidence-interval sample multiple-imputation r time-series forecasting mase

4

Як походить функція витрат з логістичної регресії

Я роблю курс машинного навчання Стенфорда на Coursera. У главі з логістичної регресії функція витрат така: Потім, це похідне тут: Я намагався отримати похідну від функції витрат, але отримав щось зовсім інше. Як отримується похідна? Які є посередницькими кроками?

29 regression logistic gradient-descent derivative

1

Наскільки неправильною є модель регресії, коли припущення не виконуються?

Під час встановлення регресійної моделі, що відбувається, якщо припущення виходів не виконані, зокрема: Що станеться, якщо залишки не є гомосептичними? Якщо залишки показують зростаючу чи зменшувальну картину в графіку Залишкові та Пристосовані. Що станеться, якщо залишки нормально не поширюються і не виконають тест Шапіро-Вілка? Тест на нормальність Шапіро-Вілка є дуже …

28 regression multiple-regression error assumptions normality-assumption

1

Чому моє отримання рішення ласо для закритої форми є неправильним?

Проблема з ласою має рішення закритої форми: \ beta_j ^ {\ текст {lasso}} = \ mathrm {sgn} (\ beta ^ {\ текст {LS}} _ j) (| \ beta_j ^ {\ текст {LS }} | - \ alpha) ^ + якщо X має ортонормальні стовпці. Це було показано в цій темі: …

28 regression lasso regularization

5

Які небезпеки порушують припущення гомоскедастичності для лінійної регресії?

Як приклад, розглянемо ChickWeightнабір даних у Р. Дисперсія очевидно зростає з часом, тому якщо я використовую просту лінійну регресію, наприклад: m <- lm(weight ~ Time*Diet, data=ChickWeight) Мої запитання: Які аспекти моделі будуть сумнівними? Чи обмежуються проблеми екстраполяцією поза Timeдіапазоном? Наскільки толерантною є лінійна регресія до порушення цього припущення (тобто, якою …

28 r regression heteroscedasticity assumptions

5

Вибір найкращої моделі серед різних «найкращих» моделей

Як ви вибираєте модель серед різних моделей, вибраних різними методами (наприклад, вибір назад або вперед)? Також що таке парсимонійна модель?

28 regression model-selection

1

Обчислювальна повторюваність ефектів від lmer-моделі

Я щойно натрапив на цю статтю , в якій описано, як обчислити повторюваність (він же - надійність, також внутрішньокласова кореляція) вимірювання за допомогою моделювання змішаних ефектів. R-код буде: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted …

28 mixed-model reliability intraclass-correlation repeatability spss factor-analysis survey modeling cross-validation error curve-fitting mediation correlation clustering sampling machine-learning probability classification metric r project-management optimization svm python dataset quality-control checking clustering distributions anova factor-analysis exponential poisson-distribution generalized-linear-model deviance machine-learning k-nearest-neighbour r hypothesis-testing t-test r variance levenes-test bayesian software bayesian-network regression repeated-measures least-squares change-scores variance chi-squared variance nonlinear-regression regression-coefficients multiple-comparisons p-value r statistical-significance excel sampling sample r distributions interpretation goodness-of-fit normality-assumption probability self-study distributions references theory time-series clustering econometrics binomial hypothesis-testing variance t-test paired-comparisons statistical-significance ab-test r references hypothesis-testing t-test normality-assumption wilcoxon-mann-whitney central-limit-theorem t-test data-visualization interactive-visualization goodness-of-fit

4

Формула псевдо R для ГЛМ

Я знайшов формулу для псевдо у книзі Розширення лінійної моделі з R, Джуліан Дж. Фаравей (стор. 59).R2R2R^2 1−ResidualDevianceNullDeviance1−ResidualDevianceNullDeviance1-\frac{\text{ResidualDeviance}}{\text{NullDeviance}} . Це загальна формула псевдо для GLM?R2R2R^2

28 r regression generalized-linear-model r-squared

6

Навіщо нам потрібна багатоваріантна регресія (на відміну від ряду одноманітних регресій)?

Я щойно переглянув цю чудову книгу: Прикладний багатоваріантний статистичний аналіз Джонсона та Вічерн . Іронія полягає в тому, що я досі не в змозі зрозуміти мотивацію використання багатоваріантних (регресійних) моделей замість окремих одновимірних (регресійних) моделей. Я переглянув stats.statexchange пости 1 та 2, які пояснюють (a) різницю між багаторазовою та багатоваріантною …

28 regression multiple-regression inference multivariate-regression

3

Чому могло б центрування незалежних змінних змінювати основні ефекти з помірністю?

У мене виникло питання, пов'язане з множинною регресією та взаємодією, натхненною цією ниткою CV: Взаємодія з використанням ієрархічного регресійного аналізу змінних змінних? На які змінні слід зосередитись? Перевіряючи ефект модерації, я центрирую свої незалежні змінні та помножую центрировані змінні, щоб обчислити термін взаємодії. Потім я запускаю свій регресійний аналіз і …

28 regression interaction centering

2

Чому RSS розподіляється чі квадратним часом np?

Я хотів би зрозуміти, чому в моделі OLS розподіляється RSS (залишкова сума квадратів) ( - кількість параметрів у моделі, кількість спостережень).χ2⋅(n−p)χ2⋅(n−p)\chi^2\cdot (n-p)pppnnn Прошу вибачення за те, що я задав таке основне запитання, але, здається, я не в змозі знайти відповідь в Інтернеті (або в моїх, більш орієнтованих на додатків, підручниках).

28 regression distributions least-squares

Запитання з тегом «regression»