Запитання з тегом «p-value»

У періодичному тестуванні гіпотез p-цінність - це ймовірність результату як крайня (або більше), ніж спостережуваний результат, за умови, що нульова гіпотеза є істинною.

2
Як жорстко обгрунтувати вибрані помилково-позитивні / хибно-негативні коефіцієнти помилок та базовий коефіцієнт витрат?
Контекст Група соціологів та статистиків ( Benjamin et al., 2017 ) нещодавно висловили припущення, що типовий хибнопозитивний показник ( = .05), який використовується як поріг для визначення "статистичної значущості", повинен бути пристосований до більш консервативного порогу ( α = .005). Конкуруюча група соціологів та статистиків ( Lakens et al., 2018 …

2
Чи неправильно вибирати функції на основі p-значення?
Існує кілька публікацій про те, як вибрати функції. Один із методів описує важливість функції на основі t-статистики. У R, varImp(model)застосованому на лінійній моделі зі стандартизованими ознаками, використовується абсолютне значення t-статистики для кожного параметра моделі. Таким чином, ми в основному вибираємо особливість на основі її t-статистики, тобто наскільки точним є коефіцієнт. …


5
Як виконати імпутацію значень у дуже великій кількості точок даних?
У мене дуже великий набір даних, і близько 5% випадкових значень відсутні. Ці змінні співвідносяться між собою. Наступний приклад набору даних R - це лише іграшковий приклад з манекено-корельованими даними. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
Якщо розподіл тестової статистики є бімодальним, чи значення p означає щось?
Р-значення визначається ймовірністю отримання тестової статистики принаймні такою ж крайньою, як і те, що спостерігається, якщо вважати, що нульова гіпотеза є істинною. Іншими словами, П( X≥ t | Н0)П(Х≥т|Н0)P( X \ge t | H_0 ) Але що робити, якщо тестова статистика має бімодальний розподіл? чи значення p означає щось у …

2
Як я можу об'єднати завантажені р-значення у множинні імпульсованих наборів даних?
Мене хвилює проблема, що я хотів би завантажувати p-значення для оцінки з множини імпульсованих (MI) даних, але мені незрозуміло, як поєднувати р-значення для МІ-множин.θθ\theta Для наборів даних ІМ стандартний підхід для досягнення загальної дисперсії оцінок використовує правила Рубіна. Дивіться тут огляд об’єднання наборів даних MI. Квадратний корінь загальної дисперсії служить …

4
Як R, як обчислити р-значення для площі під ROC
Я намагаюся знайти спосіб обчислити р-значення для області під характеристикою оператора приймача (ROC). У мене є безперервна змінна та діагностичний результат тесту. Хочу дізнатися, чи AUROC є статистично значущим. Я знайшов багато пакетів, що стосуються кривих ROC: pROC, ROCR, caTools, верифікація, Epi. Але навіть після багатьох годин, проведених за читанням …
12 r  p-value  roc 

1
Плутанина щодо lmer і p-значень: як p-значення з пакету memisc порівнюються з MCMC?
У мене було враження, що функція lmer()в lme4пакеті не виробляє р-значень (див. lmer, P-значення та все таке ). Я використовую MCMC згенерованих значень р замість як на це питання: Значний ефект в lme4змішаній моделі і на це питання: Чи не вдається знайти р-значення у виведенні з lmer()в lm4пакеті вR . …

2
Чи можна р-значення для тесту кореляції Пірсона обчислювати саме з коефіцієнта кореляції та розміру вибірки?
Передумови: я прочитав одну статтю, де автори повідомляють про співвідношення Пірсона 0,754 від розміру вибірки 878. Результат p-значення для тесту кореляції є значущим "дві зірки" (тобто p <0,01). Однак я вважаю, що при такому великому розмірі вибірки відповідне значення p повинно бути менше 0,001 (тобто три зірки). Чи можна р-значення …

2
Регулювання р-значення для адаптивного послідовного аналізу (для квадратного тесту чі)?
Я хотів би знати, яка статистична література є актуальною для наступної проблеми, і, можливо, навіть ідея, як її вирішити. Уявіть таку проблему: У нас є 4 можливі методи лікування якогось захворювання. Для того, щоб перевірити, яке лікування краще, ми проводимо спеціальне випробування. У судовому процесі ми починаємо з відсутності суб'єктів, …

2
Статистичний тест на позитивне та негативне прогностичне значення
Я читав документ і побачив таблицю з порівнянням між PPV (позитивне прогнозне значення) та NPV (від'ємне прогнозне значення). Вони зробили для них якийсь статистичний тест, це ескіз таблиці: PPV NPV p-value 65.9 100 < 0.00001 ... Кожен рядок посилається на певну таблицю надзвичайних ситуацій. Який тест гіпотези вони зробили? Дякую!

1
Чому lm і biglm в R дають різні значення p для одних і тих же даних?
Ось невеликий приклад: MyDf<-data.frame(x=c(1,2,3,4), y=c(1.2, .7, -.5, -3)) Тепер із base::lm: > lm(y~x, data=MyDf) %>% summary Call: lm(formula = y ~ x, data = MyDf) Residuals: 1 2 3 4 -0.47 0.41 0.59 -0.53 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.0500 0.8738 3.491 0.0732 . x -1.3800 0.3191 …

1
Точний тест Фішера дає неоднакові значення p
Я намагаюся застосувати точний тест Фішера в симульованій генетичній проблемі, але значення p, схоже, перекошені праворуч. Будучи біологом, я думаю, я просто пропускаю щось очевидне для кожного статистика, тому я дуже вдячний за вашу допомогу. Моя установка така: (налаштування 1, маргінали не зафіксовані) Два зразки 0s та 1s випадковим чином …

2
розуміння р-значення при множинній лінійній регресії
Щодо р-значення множинного лінійного регресійного аналізу, вступ із веб-сайту Minitab показано нижче. Значення р для кожного терміна перевіряє нульову гіпотезу про те, що коефіцієнт дорівнює нулю (немає ефекту). Низьке p-значення (<0,05) вказує на те, що ви можете відхилити нульову гіпотезу. Іншими словами, передбачувач, який має низьке значення р, швидше за …

1
Інтервал довіри та P Невизначеність значення для тесту перестановки
Я зараз вивчаю тести рандомізації. Мені на думку спадають два питання: Так, легко та інтуїтивно зрозуміло, як р-значення обчислюється тестом рандомізації (на мою думку, це те саме, що і тест на перестановку?). Однак як ми могли також генерувати довірчий інтервал 95%, як це робимо при звичайних параметричних тестах? Коли я …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.