Статистика та великі дані p-value

2

Як жорстко обгрунтувати вибрані помилково-позитивні / хибно-негативні коефіцієнти помилок та базовий коефіцієнт витрат?

Контекст Група соціологів та статистиків ( Benjamin et al., 2017 ) нещодавно висловили припущення, що типовий хибнопозитивний показник ( = .05), який використовується як поріг для визначення "статистичної значущості", повинен бути пристосований до більш консервативного порогу ( α = .005). Конкуруюча група соціологів та статистиків ( Lakens et al., 2018 …

12 hypothesis-testing p-value power type-i-and-ii-errors

2

Чи неправильно вибирати функції на основі p-значення?

Існує кілька публікацій про те, як вибрати функції. Один із методів описує важливість функції на основі t-статистики. У R, varImp(model)застосованому на лінійній моделі зі стандартизованими ознаками, використовується абсолютне значення t-статистики для кожного параметра моделі. Таким чином, ми в основному вибираємо особливість на основі її t-статистики, тобто наскільки точним є коефіцієнт. …

12 regression p-value feature-selection

2

Поетапна регресія в R - критичне р-значення

Яке критичне значення р використовується step()функцією в R для поступової регресії? Я припускаю, що це 0,15, але чи моє припущення правильне? Як я можу змінити критичне p-значення?

12 r regression p-value stepwise-regression

5

Як виконати імпутацію значень у дуже великій кількості точок даних?

У мене дуже великий набір даних, і близько 5% випадкових значень відсутні. Ці змінні співвідносяться між собою. Наступний приклад набору даних R - це лише іграшковий приклад з манекено-корельованими даними. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

1

Якщо розподіл тестової статистики є бімодальним, чи значення p означає щось?

Р-значення визначається ймовірністю отримання тестової статистики принаймні такою ж крайньою, як і те, що спостерігається, якщо вважати, що нульова гіпотеза є істинною. Іншими словами, П( X≥ t | Н0)П(Х≥т|Н0)P( X \ge t | H_0 ) Але що робити, якщо тестова статистика має бімодальний розподіл? чи значення p означає щось у …

12 hypothesis-testing statistical-significance p-value descriptive-statistics bimodal

2

Як я можу об'єднати завантажені р-значення у множинні імпульсованих наборів даних?

Мене хвилює проблема, що я хотів би завантажувати p-значення для оцінки з множини імпульсованих (MI) даних, але мені незрозуміло, як поєднувати р-значення для МІ-множин.θθ\theta Для наборів даних ІМ стандартний підхід для досягнення загальної дисперсії оцінок використовує правила Рубіна. Дивіться тут огляд об’єднання наборів даних MI. Квадратний корінь загальної дисперсії служить …

12 confidence-interval variance p-value bootstrap multiple-imputation

4

Як R, як обчислити р-значення для площі під ROC

Я намагаюся знайти спосіб обчислити р-значення для області під характеристикою оператора приймача (ROC). У мене є безперервна змінна та діагностичний результат тесту. Хочу дізнатися, чи AUROC є статистично значущим. Я знайшов багато пакетів, що стосуються кривих ROC: pROC, ROCR, caTools, верифікація, Epi. Але навіть після багатьох годин, проведених за читанням …

12 r p-value roc

1

Плутанина щодо lmer і p-значень: як p-значення з пакету memisc порівнюються з MCMC?

У мене було враження, що функція lmer()в lme4пакеті не виробляє р-значень (див. lmer, P-значення та все таке ). Я використовую MCMC згенерованих значень р замість як на це питання: Значний ефект в lme4змішаній моделі і на це питання: Чи не вдається знайти р-значення у виведенні з lmer()в lm4пакеті вR . …

12 r mixed-model p-value mcmc lme4-nlme

2

Чи можна р-значення для тесту кореляції Пірсона обчислювати саме з коефіцієнта кореляції та розміру вибірки?

Передумови: я прочитав одну статтю, де автори повідомляють про співвідношення Пірсона 0,754 від розміру вибірки 878. Результат p-значення для тесту кореляції є значущим "дві зірки" (тобто p <0,01). Однак я вважаю, що при такому великому розмірі вибірки відповідне значення p повинно бути менше 0,001 (тобто три зірки). Чи можна р-значення …

12 hypothesis-testing correlation p-value fraud

2

Регулювання р-значення для адаптивного послідовного аналізу (для квадратного тесту чі)?

Я хотів би знати, яка статистична література є актуальною для наступної проблеми, і, можливо, навіть ідея, як її вирішити. Уявіть таку проблему: У нас є 4 можливі методи лікування якогось захворювання. Для того, щоб перевірити, яке лікування краще, ми проводимо спеціальне випробування. У судовому процесі ми починаємо з відсутності суб'єктів, …

12 hypothesis-testing chi-squared p-value multiple-comparisons sequential-analysis

2

Статистичний тест на позитивне та негативне прогностичне значення

Я читав документ і побачив таблицю з порівнянням між PPV (позитивне прогнозне значення) та NPV (від'ємне прогнозне значення). Вони зробили для них якийсь статистичний тест, це ескіз таблиці: PPV NPV p-value 65.9 100 < 0.00001 ... Кожен рядок посилається на певну таблицю надзвичайних ситуацій. Який тест гіпотези вони зробили? Дякую!

12 epidemiology contingency-tables p-value

1

Чому lm і biglm в R дають різні значення p для одних і тих же даних?

Ось невеликий приклад: MyDf<-data.frame(x=c(1,2,3,4), y=c(1.2, .7, -.5, -3)) Тепер із base::lm: > lm(y~x, data=MyDf) %>% summary Call: lm(formula = y ~ x, data = MyDf) Residuals: 1 2 3 4 -0.47 0.41 0.59 -0.53 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.0500 0.8738 3.491 0.0732 . x -1.3800 0.3191 …

12 r regression p-value linear-model

1

Точний тест Фішера дає неоднакові значення p

Я намагаюся застосувати точний тест Фішера в симульованій генетичній проблемі, але значення p, схоже, перекошені праворуч. Будучи біологом, я думаю, я просто пропускаю щось очевидне для кожного статистика, тому я дуже вдячний за вашу допомогу. Моя установка така: (налаштування 1, маргінали не зафіксовані) Два зразки 0s та 1s випадковим чином …

12 p-value fishers-exact

2

розуміння р-значення при множинній лінійній регресії

Щодо р-значення множинного лінійного регресійного аналізу, вступ із веб-сайту Minitab показано нижче. Значення р для кожного терміна перевіряє нульову гіпотезу про те, що коефіцієнт дорівнює нулю (немає ефекту). Низьке p-значення (<0,05) вказує на те, що ви можете відхилити нульову гіпотезу. Іншими словами, передбачувач, який має низьке значення р, швидше за …

12 multiple-regression p-value

1

Інтервал довіри та P Невизначеність значення для тесту перестановки

Я зараз вивчаю тести рандомізації. Мені на думку спадають два питання: Так, легко та інтуїтивно зрозуміло, як р-значення обчислюється тестом рандомізації (на мою думку, це те саме, що і тест на перестановку?). Однак як ми могли також генерувати довірчий інтервал 95%, як це робимо при звичайних параметричних тестах? Коли я …

12 confidence-interval p-value permutation-test

Запитання з тегом «p-value»