Запитання з тегом «r-squared»

Коефіцієнт детермінації, як правило, символізується , є часткою загальної дисперсії відповіді, поясненої регресійною моделлю. Можна також використовувати для запропонованих псевдо R-квадратів, наприклад, для логістичної регресії (та інших моделей.) R2

6
Є корисно чи небезпечно?
Я скумував через деякі конспекти лекцій Косма Шалізі (зокрема, розділ 2.1.1 другої лекції ), і мені нагадали, що ви можете отримати дуже низький навіть якщо у вас є повністю лінійна модель.R2R2R^2 Перефразовуючи приклад Шалізі: припустимо, у вас є модель , де відома. Тоді \ newcommand {\ Var} {\ mathrm {Var}} …

9
Коли нормально зняти перехоплення в лінійній регресійній моделі?
Я запускаю лінійні регресійні моделі і цікавлюсь, які умови для зняття терміна перехоплення. Порівнюючи результати двох різних регресій, де одна має перехоплення, а інша ні, я помічаю, що функції без перехоплення набагато вище. Чи є певні умови чи припущення, яких я повинен дотримуватися, щоб переконатися, що вилучення терміну перехоплення є …

2
Видалення статистично значущого перехоплюючого терміну збільшує у лінійній моделі
У простій лінійній моделі з єдиною пояснювальною змінною, αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Я вважаю, що видалення терміна перехоплення значно покращує придатність (значення йде від 0,3 до 0,9). Однак термін перехоплення виявляється статистично значущим.R2R2R^2 З перехопленням: Call: lm(formula = alpha ~ delta, data = cf) Residuals: Min …

3
Коли R квадрат негативний?
Я розумію, що не може бути негативним, оскільки це квадрат Р. Однак я провів просту лінійну регресію в SPSS з єдиною незалежною змінною та залежною змінною. Мій вихід SPSS дає мені негативне значення для . Якби я розраховував це вручну з R, тоді було б позитивним. Що SPSS зробив, щоб …

7
Який псевдо- міру слід повідомити для логістичної регресії (Cox & Snell або Nagelkerke)?
У мене є SPSSвихід на модель логістичної регресії. Вихідні дані повідомляють про два заходи для відповідності моделі Cox & Snellта Nagelkerke. Отже, як правило, про який із цих заходів R2R²R^² ви б повідомили про відповідність моделі? Або, який із цих відповідних індексів є тим, про який зазвичай повідомляють у журналах? …

3
Інтерпретація прогнозованого прогнозу та / або відповіді перетвореного журналом
Мені цікаво, чи має значення інтерпретація, чи трансформуються лише залежні, і залежні, і незалежні, або лише незалежні змінні. Розглянемо випадок log(DV) = Intercept + B1*IV + Error Я можу трактувати ІV як збільшення відсотка, але як це змінюється, коли я маю log(DV) = Intercept + B1*log(IV) + Error або коли …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

5
Зв'язок між
Скажімо, у мене є два одновимірних масиви, і . Кожен містить 100 точок даних. - фактичні дані, а - прогноз моделі. У цьому випадку значення було б: Тим часом це було б дорівнює квадратному значенню коефіцієнта кореляції, Тепер, якщо я поміняю два місця: - це фактичні дані, а - прогноз …

1
Розрахований вручну
Я знаю, що це досить специфічне Rзапитання, але я, можливо, думаю про відхилення в пропорції, пояснене, , неправильно. Ось іде.R2R2R^2 Я намагаюся використовувати Rпакет randomForest. У мене є деякі дані про навчання та дані тестування. Коли я підходить до випадкової лісової моделі, ця randomForestфункція дозволяє вводити нові дані тестування для …

2
Якою є скоригована R-квадратна формула в lм в R і як її слід інтерпретувати?
Яка точна формула використовується в R lm() для скоригованого R-квадрата? Як я можу це інтерпретувати? Відрегульовані формули r-квадрата Здається, існує кілька формул для обчислення скорегованого R-квадрата. Формула Веррі:1−(1−R2)(n−1)(n−v)1−(1−R2)(n−1)(n−v)1-(1-R^2)\frac{(n-1)}{(n-v)} Формула МакНемара:1−(1−R2)(n−1)(n−v−1)1−(1−R2)(n−1)(n−v−1)1-(1-R^2)\frac{(n-1)}{(n-v-1)} Формула Господа:1−(1−R2)(n+v−1)(n−v−1)1−(1−R2)(n+v−1)(n−v−1)1-(1-R^2)\frac{(n+v-1)}{(n-v-1)} Формула Штейна:1−[(n−1)(n−k−1)(n−2)(n−k−2)(n+1)n](1−R2)1−[(n−1)(n−k−1)(n−2)(n−k−2)(n+1)n](1−R2)1-\big[\frac{(n-1)}{(n-k-1)}\frac{(n-2)}{(n-k-2)}\frac{(n+1)}{n}\big](1-R^2) Описи підручника Згідно з підручником Філда, « Відкриття статистики за допомогою R» (2012, стор. 273) R …

1
Яка різниця між "коефіцієнтом визначення" та "середньою помилкою у квадраті"?
Для проблеми з регресією я бачив, як люди використовують "коефіцієнт визначення" (він же R квадрат) для вибору моделі, наприклад, знаходження відповідного коефіцієнта штрафу для регуляризації. Однак, також зазвичай використовується "середня помилка в квадраті" або "помилка середнього квадрату" як міра точності регресії. То в чому головна відмінність цих двох? Чи можна …

5
Як боротися з ієрархічними / вкладеними даними в машинному навчанні
Я поясню свою проблему на прикладі. Припустимо, ви хочете передбачити дохід фізичної особи за деякими ознаками: {Вік, стать, країна, регіон, місто}. У вас такий навчальний набір даних train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

4
Формула псевдо R для ГЛМ
Я знайшов формулу для псевдо у книзі Розширення лінійної моделі з R, Джуліан Дж. Фаравей (стор. 59).R2R2R^2 1−ResidualDevianceNullDeviance1−ResidualDevianceNullDeviance1-\frac{\text{ResidualDeviance}}{\text{NullDeviance}} . Це загальна формула псевдо для GLM?R2R2R^2

2
Який розподіл
Який розподіл коефіцієнта визначення, або R у квадраті, , в лінійній одновимірній множинній регресії за нульовою гіпотезою ?R2R2R^2H0:β=0Н0: β= 0H_0:\beta=0 Як це залежить від кількості предикторів та кількості вибірок ? Чи існує вираз закритої форми для режиму цього розподілу?kкkn>kn > kn>k Зокрема, у мене є відчуття, що для простої регресії …

9
Вимірювання точності моделі на основі логістичної регресії
У мене є навчена модель логістичної регресії, яку я застосовую до набору даних тестування. Залежна змінна - двійкова (булева). Для кожного зразка в наборі даних тестування я застосовую логістичну регресійну модель, щоб генерувати% ймовірність того, що залежна змінна буде істинною. Потім я записую, чи було акустичне значення правдивим чи хибним. …

1
Геометрична інтерпретація коефіцієнта множинної кореляції
Мене цікавить геометричне значення множинної кореляції RRR та коефіцієнт визначення R2R2R^2 в регресії yi=β1+β2x2,i+⋯+βkxk,i+ϵiyi=β1+β2x2,i+⋯+βkxk,i+ϵiy_i = \beta_1 + \beta_2 x_{2,i} + \dots + \beta_k x_{k,i} + \epsilon_i , або у векторних позначеннях , y=Xβ+ϵy=Xβ+ϵ\mathbf{y} = \mathbf{X \beta} + \mathbf{\epsilon} Тут проектна матриця XX\mathbf{X} має nnn рядків і kkk стовпців, з яких …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.