Запитання з тегом «theory»

З питань статистичної теорії. Завжди включайте і більш конкретний тег.

3
Змінні часто коригуються (наприклад, стандартизовані) перед виготовленням моделі - коли це гарна ідея, а коли погана?
За яких обставин ви хочете чи не хочете масштабувати або стандартизувати змінну до монтажу моделі? І які переваги / недоліки масштабування змінної?

6
Які основні теореми машинного (глибокого) навчання?
Нещодавно Аль-Рахімі виступив із дуже провокаційною розмовою в NIPS 2017, порівнюючи сучасне машинне навчання з алхімією. Одне з його тверджень полягає в тому, що нам потрібно повернутися до теоретичних розробок, мати прості теореми, що підтверджують основоположні результати. Коли він це сказав, я почав шукати основні теореми для ML, але не …


7
Як ви передаєте красу теореми про центральну межу нестатисту?
Мій батько - ентузіаст математики, але статистикою не дуже цікавий. Було б акуратно спробувати проілюструвати деякі чудові фрагменти статистики, і CLT є головним кандидатом. Як би ви передали математичну красу та вплив центральної граничної теореми нестатисту?

8
Які теорії повинен знати кожен статистик?
Я думаю про це з точки зору дуже основних, мінімальних вимог. Які основні теорії, які галузевий (а не академічний) статистик повинен знати, розуміти та використовувати на регулярній основі? Великий, який спадає на думку, - Закон великої кількості . Які найбільш важливі для застосування статистичної теорії до аналізу даних?

4
Як ви інтерпретуєте RMSLE (кореневу логарифмічну помилку середнього рівня)?
Я проводив змагання з машинного навчання, де вони використовують RMSLE (кореневу середню квадратичну логарифмічну помилку), щоб оцінити ефективність, прогнозуючи ціну продажу категорії обладнання. Проблема в тому, що я не впевнений, як інтерпретувати успіх свого остаточного результату. Наприклад , якщо я досяг RMSLE з я міг підняти його експонентну потужність і …

3
Чому підсилюючи, чому учні "слабкі"?
Дивіться також подібне запитання на stats.SE . В активізації алгоритмів , таких як AdaBoost і LPBoost відомо , що «слабкі» учні повинні бути об'єднані тільки повинні працювати краще , ніж шанс бути корисним, з Вікіпедії: Класифікатори, які він використовує, можуть бути слабкими (тобто відображати істотну швидкість помилок), але поки їх …

1
Обчислювальна повторюваність ефектів від lmer-моделі
Я щойно натрапив на цю статтю , в якій описано, як обчислити повторюваність (він же - надійність, також внутрішньокласова кореляція) вимірювання за допомогою моделювання змішаних ефектів. R-код буде: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

3
Кращий бандитський алгоритм?
Найвідомішим алгоритмом бандитів є верхня довіра (UCB), яка популяризувала цей клас алгоритмів. З того часу я припускаю, що зараз є кращі алгоритми. Який найкращий поточний алгоритм (з точки зору емпіричної продуктивності чи теоретичної межі)? Чи оптимальним є цей алгоритм у певному сенсі?

8
Чому так важливо мати принципові та математичні теорії для машинного навчання?
Мені було цікаво, чому так важливо принципове / теоретичне машинне навчання? З особистої точки зору як людини я можу зрозуміти, чому принципове машинне навчання було б важливим: людям подобається розуміти, що вони роблять, ми знаходимо красу і задоволення для розуміння. з теоретичної точки зору, математика - це весело коли існують …

1
Вибір серед правильних правил скорингу
Більшість ресурсів на правильних правилах балів згадує низку різних правил скорингу, такі як втрата журналу, оцінка Brier або сферичне оцінювання. Однак вони часто не дають великих рекомендацій щодо відмінностей між ними. (Виставка А: Вікіпедія .) Вибір моделі, яка максимально збільшує логарифмічну оцінку, відповідає вибору моделі максимальної ймовірності, що здається хорошим …

4
Що означає "неупередженість"?
Що означає сказати, що "дисперсія - це упереджений оцінювач". Що означає перетворення упередженої оцінки в неупереджену оцінку за допомогою простої формули. Що саме робить це перетворення? Також, яке практичне використання цього перетворення? Чи конвертуєте ви ці бали, використовуючи статистику певного виду?

4
У чому полягає прокляття розмірності?
Зокрема, я шукаю посилання (папери, книги), які будуть суворо показувати і пояснювати прокляття розмірності. Це питання виникло після того, як я почав читати цю білу книгу Лафферті та Вассермана. У третьому абзаці вони згадують "добре відоме" рівняння, з якого випливає, що найкраща швидкість конвергенції - n−4/(4−d)n−4/(4−d)n^{-4/(4-d)} ; якщо хтось може …
21 theory 

5
Вступ до теорії вимірювань
Мені цікаво дізнатись більше про непараметричні байєсівські (та пов'язані з ними) методики. Моє знання в галузі інформатики, і хоча я ніколи не брав курс з теорії вимірювань або теорії ймовірностей, у мене був обмежений обсяг формальної підготовки з питань ймовірності та статистики. Хтось може порекомендувати читати вступ до цих понять, …

2
Чи є статистичне застосування, яке вимагає міцної послідовності?
Мені було цікаво, чи хтось знає, чи існує застосування в статистиці, в якому замість слабкої послідовності потрібна сильна послідовність оцінки. Тобто, сильна узгодженість є важливою для заявки, і додаток не працюватиме зі слабкою послідовністю.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.