Запитання з тегом «goodness-of-fit»

Належність тестів на придатність вказує на те, чи розумно вважати, що випадкова вибірка походить від конкретного розподілу.

1
Чи є сенс виконувати односхилий тест Колмогорова-Смірнова?
Чи є сенс і чи можливо виконати односхилий тест KS? Якою була б нульова гіпотеза такого тесту? Або тест KS по суті є двосхилим тестом? Я отримав би вигоду з відповіді, яка допомогла мені зрозуміти розподіл D (я працюю за документом Массі 1951 року, і вважаю опис складним, наприклад, і …

1
Яка інтуїція за обмінними зразками під нульовою гіпотезою?
Перестановочні тести (також називаються тестом рандомизації, тестом на повторну рандомізацію або точним тестом) дуже корисні і корисні, коли припущення про нормальний розподіл, необхідне, наприклад, t-testне виконується, і при перетворенні значень за ранжуванням непараметричний тест, як-от Mann-Whitney-U-test, призведе до втрати більше інформації. Однак одне і єдине припущення не слід оминути увагою …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
Як перевірити, чи відповідає розподіл закону про владу?
У мене є дані про те, скільки користувачів публікує скільки питань. Наприклад, [UserCount, QuestionCount] [2, 100] [9, 10] [3, 80] ... ... Це означає, що кожен користувач опублікував 100 запитань, 9 користувачів - 10 питань тощо. Отже, як я можу визначити, чи відповідає UserCount, QuestionCountрозподіл закону про владу? Я знайшов …

1
Оцінка логістичної регресійної моделі
Я працюю над логістичною моделлю, і у мене виникають певні труднощі з оцінкою результатів. Моя модель - двочленний логіт. Мої пояснювальні змінні: категорична змінна з 15 рівнями, дихотомна змінна та 2 безперервні змінні. Мій N великий> 8000. Я намагаюся моделювати рішення фірм інвестувати. Залежна змінна - це інвестиція (так / …

2
Як перевірити, чи відповідає зразок даних сімейству розповсюдження Gamma?
У мене є вибірка даних, яка була сформована з безперервної випадкової величини X. А з гістограми я малюю за допомогою R, я здогадуюсь, що, можливо, розподіл X підпорядковується певному гамма-розподілу. Але я не знаю точних параметрів цього розподілу Gamma. Моє запитання - як перевірити, чи належить розподіл X до сімейства …

2
Оцінка логістичних регресійних моделей
Це питання виникає з моєї фактичної плутанини щодо того, як вирішити, чи достатньо хороша логістична модель. У мене є моделі, які використовують стан пар індивідуальний проект через два роки після їх формування як залежної змінної. Результат успішний (1) чи ні (0). У мене є незалежні змінні, виміряні в момент утворення …

5
Як довести, що рейтинг "Ело" або "Рейтинг сторінки" має значення для мого набору?
У мене є набір гравців. Вони грають один проти одного (попарно). Пари гравців вибираються випадковим чином. У будь-якій грі виграє один гравець, а інший програє. Гравці грають один з одним обмеженою кількістю ігор (деякі гравці грають більше ігор, інші менше). Отже, у мене є дані (хто перемагає проти кого і …

1
ЛАРС проти координатного спуску для ласо
Які плюси та мінуси використання LARS [1] проти використання координатного спуску для встановлення L1-регульованої лінійної регресії? Мене в основному цікавлять аспекти ефективності (мої проблеми мають, як правило, Nсотні тисяч і p<20). Однак, будь-які інші дані також будуть оцінені. редагувати: Оскільки я розмістив запитання, chl люб'язно вказав на статтю [2] Friedman …

1
Як прочитати корисність придатності на nls R?
Я намагаюся інтерпретувати вихід nls (). Я прочитав цю публікацію, але досі не розумію, як вибрати найкращу форму. У мене є два виходи: > summary(m) Formula: y ~ I(a * x^b) Parameters: Estimate Std. Error t value Pr(>|t|) a 479.92903 62.96371 7.622 0.000618 *** b 0.27553 0.04534 6.077 0.001744 ** …

1
Очікуване значення , коефіцієнт визначення, під нульовою гіпотезою
Мені цікаво твердження, зроблене внизу першої сторінки цього тексту стосовно коригуванняR2adjustedRadjusted2R^2_\mathrm{adjusted} R2adjusted=1−(1−R2)(n−1n−m−1).Radjusted2=1−(1−R2)(n−1n−m−1).R^2_\mathrm{adjusted} =1-(1-R^2)\left({\frac{n-1}{n-m-1}}\right). У тексті зазначено: Логіка коригування така: у звичайній множинній регресії випадковий предиктор пояснює в середньому частку 1/(n–1)1/(n–1)1/(n – 1) варіації відповіді, так що mmm випадкові предиктори пояснюють разом, в середньому, m/(n–1)m/(n–1)m/(n – 1) варіації відповіді; іншими словами, …

1
Логістична регресія з регресійними сплайнами в R
Я розробляю логістичну модель регресії на основі ретроспективних даних із національної бази травм травми голови у Великобританії. Основним результатом є смертність за 30 днів (позначена як міра "вижити"). Інші заходи з опублікованими доказами значного впливу на результати попередніх досліджень включають: Year - Year of procedure = 1994-2013 Age - Age …

4
Придатність для дуже великих розмірів зразків
Я збираю дуже великі вибірки (> 1 000 000) категоричних даних щодня і хочу, щоб дані виглядали "суттєво" різними між днями, щоб виявити помилки в зборі даних. Я думав, що використання тесту на придатність (зокрема, G-тест) було б для цього добре (каламбур) призначений для цього. Очікуваний розподіл задається розподілом попереднього …

3
Чи корисна моя модель на основі діагностичної метрики (
Я підходив до своєї моделі і намагаюся зрозуміти, чи корисна вона. Я розраховував рекомендовані показники для його оцінки ( R2R2R^2 / AUC / точність / помилка передбачення / тощо), але не знаю, як їх інтерпретувати. Коротше кажучи, як я можу сказати, чи базується моя модель на основі метрики? Чи достатньо …

2
Тест Колмогорова – Смірнова: p-значення та ks-тест зменшуються зі збільшенням кількості вибірки
Чому р-значення та ks-тест-статистика зменшуються зі збільшенням розміру вибірки? Візьмемо цей приклад Python як приклад: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) Результати: Ks_2sampResult(statistic=0.30000000000000004, pvalue=0.67507815371659508) Ks_2sampResult(statistic=0.080000000000000071, pvalue=0.89375155241057247) …

1
Вимірювання «відхилення» для нуля завищеного Пуассона або нульового надутого негативного двочлена?
Масштабне відхилення, визначене як D = 2 * (вірогідність логарифміки насиченої моделі мінус імовірність зручності пристосованої моделі), часто використовується як міра корисності придатності в моделях GLM. Процентне відхилення, що пояснюється, визначається як [D (нульова модель) - D (пристосована модель)] / D (нульова модель), також іноді використовується як аналог GLM-аналогу R-лінійної …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.