Запитання з тегом «standard-error»

Посилається на стандартне відхилення розподілу вибірки статистики, обчислене з вибірки. Стандартні помилки часто потрібні при формуванні інтервалів довіри або тестуванні гіпотез щодо сукупності, з якої була проведена вибірка статистики.

15
Інтуїтивне пояснення ділення на при обчисленні стандартного відхилення?
Мене сьогодні в класі запитали, чому ви ділите суму квадратної помилки на замість на при обчисленні стандартного відхилення.nn−1n−1n-1nnn Я сказав, що не збираюся відповідати на уроці (оскільки я не хотів вступати в неупереджені оцінки), але пізніше я задумався - чи є інтуїтивне пояснення цьому ?!

3
Як у регресії обчислюються стандартні похибки коефіцієнтів?
Для мого власного розуміння, мені цікаво реплікувати обчислення стандартних похибок оцінених коефіцієнтів, як, наприклад, з вихідною lm()функцією в R, але не змогли її зафіксувати. Для чого використовується формула / реалізація?


3
Приклад: регресія LASSO з використанням glmnet для двійкового результату
Я починаю балуватися з використанням glmnetз LASSO регресією , де мій результат становить інтерес дихотомический. Я створив невеликий макетний кадр даних нижче: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

2
Форма довірчого інтервалу для прогнозованих значень при лінійній регресії
Я помітив, що довірчий інтервал для прогнозованих значень в лінійній регресії має тенденцію бути вузьким навколо середнього значення прогноктора і жиру навколо мінімальних і максимальних значень прогноктора. Це можна побачити на графіках цих 4 лінійних регресій: Я спочатку думав, що це тому, що більшість значень предикторів були сконцентровані навколо середнього …

6
Стандартні помилки для прогнозування ласо за допомогою R
Я намагаюся використовувати модель LASSO для прогнозування, і мені потрібно оцінити стандартні помилки. Напевно, хтось уже написав пакет для цього. Але наскільки я бачу, жоден з пакетів CRAN, які роблять прогнози за допомогою LASSO, не поверне стандартні помилки для цих прогнозів. Отже, моє питання: Чи є пакет або якийсь код …

4
Стандартна помилка для середнього зразка біноміальних випадкових величин
Припустимо, я провожу експеримент, який може мати 2 результати, і я припускаю, що основним "справжнім" розподілом двох результатів є біноміальний розподіл з параметрами нnn і ppp : B i n o m i a l (n,p)Binomial(n,p){\rm Binomial}(n, p) . Я можу обчислити стандартну помилку, SЕХ= σХн√SEX=σXnSE_X = \frac{\sigma_X}{\sqrt{n}} , від …

1
Квантильна регресія: Які стандартні помилки?
summary.rqФункція від quantreg віньєтки надає безліч варіантів для стандартних оцінок похибки квантилів коефіцієнтів регресії. Які спеціальні сценарії, коли кожен із них стає оптимальним / бажаним? "ранг", який виробляє довірчі інтервали для оцінюваних параметрів шляхом інвертування тесту на ранги, як описано в Koenker (1994). Параметр за замовчуванням передбачає, що помилки є …

3
Що таке залишкова стандартна помилка?
Під час запуску моделі множинної регресії в R один з виходів є залишковою стандартною помилкою 0,0589 на 95,161 градуса свободи. Я знаю, що 95 161 градус свободи задається різницею між кількістю спостережень у моїй вибірці та кількістю змінних у моїй моделі. Що таке залишкова стандартна помилка?

4
Стандартна кластеризація помилок в R (вручну або в PLM)
Я намагаюся зрозуміти стандартну помилку "кластеризації" і як виконати в R (це тривіально в Stata). У RI були невдалі, використовуючи plmабо написання власної функції. Я буду використовувати diamondsдані з ggplot2пакету. Я можу робити фіксовані ефекти з будь-якими фіктивними змінними > library(plyr) > library(ggplot2) > library(lmtest) > library(sandwich) > # with …

3
Чому б не повідомити про середню кількість завантажувального завантаження?
Коли одна завантажує параметр для отримання стандартної помилки, ми отримуємо розподіл параметра. Чому ми не використовуємо середнє значення цього розподілу як результат або оцінку для параметра, який ми намагаємося отримати? Чи не повинен розподіл наближатись до реального? Тому ми отримали б хорошу оцінку "реальної" вартості? Але ми повідомляємо про вихідний …

5
Як боротися з ієрархічними / вкладеними даними в машинному навчанні
Я поясню свою проблему на прикладі. Припустимо, ви хочете передбачити дохід фізичної особи за деякими ознаками: {Вік, стать, країна, регіон, місто}. У вас такий навчальний набір даних train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

3
R: Випадковий ліс, який кидає NaN / Inf у помилці "виклику іноземної функції", незважаючи на відсутність набору даних NaN [закритий]
Зачинено. Це питання поза темою . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно було тематичним для перехресної перевірки. Закрито 2 роки тому . Я використовую caret, щоб запустити перехрещений випадковий ліс над набором даних. Змінна Y - фактор. У моєму наборі даних немає NaN, Inf …


3
Як я можу обчислити похибку в результаті NPS (Net Promoter Score)?
Я дозволю Вікіпедії пояснити, як обчислюється NPS : Показник чистого промоутера отримується, задаючи клієнтам одне запитання за шкалою рейтингу від 0 до 10, де 10 "надзвичайно вірогідний", а 0 - "зовсім не вірогідний": "Наскільки ймовірно, ви б рекомендували нашу компанію друг чи колега? " На основі своїх відповідей клієнти класифікуються …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.