Запитання з тегом «inference»

Зроблення висновків щодо параметрів населення із вибіркових даних. Дивіться https://en.wikipedia.org/wiki/Inference та https://en.wikipedia.org/wiki/Statistic_inference

4
Як інтерпретувати сюжет QQ
Я працюю з невеликим набором даних (21 спостереження) і маю наступний звичайний QQ графік в R: Бачачи, що сюжет не підтримує нормальність, що я можу зробити висновок про базовий розподіл? Мені здається, що розподіл, перекошений вправо, був би кращим, це правильно? Крім того, які інші висновки можна зробити з даних?

12
Хто такі байєси?
Коли хтось цікавиться статистикою, дихотомія "Частота" проти "Байєсіана" незабаром стає звичною (а хто так і не прочитав " Сигнал і шум" Нейт Сілвер ?). У переговорах та вступних курсах точка зору є надзвичайно частою ( MLE , значення), але, як правило, є невеликий проміжок часу, присвячений захопленню формулою Байєса і …

10
Інтуїтивно зрозуміти «дисперсію»
Який найчистіший і найпростіший спосіб пояснити комусь поняття дисперсії? Що це означає інтуїтивно? Якщо потрібно пояснити це своїй дитині, як би це зробити? Це поняття, яке у мене є складним у артикуляції, особливо коли стосуються відмінність від ризику. Я розумію це математично і можу це пояснити і так. Але коли …

8
Який хороший, переконливий приклад, у якому р-значення корисні?
Моє запитання в назві не пояснює себе, але я хотів би дати йому якийсь контекст. На початку цього тижня ASA оприлюднила заяву " про p-значення: контекст, процес та мета ", окреслюючи різні поширені помилкові уявлення про p-значення та закликаючи до обережності в тому, щоб не використовувати його без контексту та …

12
Тести з двома хвостами ... Я просто не переконаний. В чому справа?
Наступний уривок із статті: Які відмінності між однохвостими та двохвостими тестами? , на довідковому сайті UCLA зі статистикою. ... розглянути наслідки відсутності ефекту в іншому напрямку. Уявіть, що ви розробили новий препарат, який, на вашу думку, є покращенням порівняно з існуючим препаратом. Ви хочете максимально покращити свою здатність виявляти поліпшення, …

7
Чому хтось використовує байєсівський підхід із "неінформативним" невідповідним замість класичного підходу?
Якщо інтерес полягає лише у оцінці параметрів моделі (точкове та / або інтервальне оцінювання) і попередня інформація не є достовірною, слабкою (я знаю, це трохи розпливчасто, але я намагаюся встановити сценарій, коли вибір вибору перед цим важко) ... Чому хтось вирішить використовувати байєсівський підхід із "неінформативними" неналежними пріорами замість класичного …

3
Тестування рівності коефіцієнтів від двох різних регресій
Це здається основним питанням, але я просто зрозумів, що насправді не знаю, як перевірити рівність коефіцієнтів від двох різних регресій. Чи може хтось пролити на це світло? Більш формально, припустимо, я застосував наступні дві регресії: і де посилається на проектну матрицю регресії , а на вектор коефіцієнтів регресії . Зауважте, …

6
Правило великого пальця для кількості проб завантаження
Цікаво, чи хтось знає якісь загальні правила щодо кількості зразків завантажувальної програми, які слід використовувати на основі характеристик даних (кількість спостережень тощо) та / або включених змінних?

4
Що таке довідковий аргумент і чому його не прийняли?
Одним із пізніх внесків Р. А. Фішера були фідуціальні інтервали та принципові принципи довіри . Такий підхід, однак, ніде не є настільки популярним, як принципи часто-часто чи баєсівського принципу. Що таке довірений аргумент і чому його не прийнято?

3
Чому тестування основних гіпотез фокусується на середньому, а не на медіані?
На базових курсах зі статистики нижчих класів студентів (як правило?) Навчають тестуванню гіпотез для середньої сукупності. Чому саме фокус робиться на середньому, а не на медіані? Я здогадуюсь, що простіше випробувати середнє через теорему про центральну межу, але я хотів би прочитати кілька освічених пояснень.

2
Виконання статистичного тесту після візуалізації даних - драгування даних?
Я запропоную це питання на прикладі. Припустимо, у мене є набір даних, такий як набір даних про ціни на житло в Бостоні, в якому я маю безперервні і категоричні змінні. Тут ми маємо змінну «якість» від 1 до 10 та ціну продажу. Я можу розділити дані на будинки "низької", "середньої" …

3
Вміст закріплених уявлень p-значень
Іноді у звітах я включаю застереження щодо р-значень та іншої статистичної статистики, яку я надав. Я кажу, що оскільки вибірка не була випадковою, то така статистика не застосовуватиметься строго. Моє конкретне формулювання, як правило, наводиться у виносці: "Хоча, строго кажучи, інфекційна статистика застосовна лише в контексті випадкових вибірок, ми дотримуємось …

7
Висновок проти оцінки?
Які відмінності між "висновком" та "оцінкою" в контексті машинного навчання ? Як новачок, я відчуваю, що ми підводимо випадкові величини та оцінюємо параметри моделі. Чи правильно це моє розуміння? Якщо ні, то в чому полягають відмінності, і коли я повинен використовувати який? Також, який із них є синонімом «вчитися»?

5
Як боротися з ієрархічними / вкладеними даними в машинному навчанні
Я поясню свою проблему на прикладі. Припустимо, ви хочете передбачити дохід фізичної особи за деякими ознаками: {Вік, стать, країна, регіон, місто}. У вас такий навчальний набір даних train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

3
Що робити, якщо ваша випадкова вибірка явно не є репрезентативною?
Що робити, якщо взяти випадкову вибірку, і ви побачите, вона явно не є репрезентативною, як у недавньому питанні . Наприклад, що робити, якщо розподіл популяції повинен бути симетричним приблизно 0, а вибірка, яку ви малюєте випадковим чином, має незбалансовані позитивні та негативні спостереження, а дисбаланс є статистично значущим, де це …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.