Запитання з тегом «prediction»

Прогнозування невідомих випадкових величин за допомогою статистичної моделі.

3
Очікувана помилка передбачення - виведення
Я намагаюся зрозуміти виведення очікуваної помилки прогнозування нижче (ESL), особливо щодо виведення 2,11 та 2,12 (обумовлення, крок до точкового мінімуму). Будь-які вказівки чи посилання високо оцінені. Нижче я повідомляю витяг із ESL pg. 18. Перші два рівняння - це, по порядку, рівняння 2.11 та 2.12. Нехай X∈RpX∈RpX \in \mathbb{R}^p позначає …

3
Як можна судити про точність прогнозів Нейт Сілвер?
По-перше, він дає ймовірність результатів. Так, наприклад, зараз його прогнози щодо виборів у США - 82% Клінтон проти 18% Трампа. Тепер, навіть якщо Трамп перемагає, то як я можу знати, що він виграв не лише 18% часу? Інша проблема полягає в тому, що його ймовірності змінюються з часом. Тож 31 …

2
Еластичний / гребінний / ласо-аналіз, що тоді?
Мене дуже цікавить процедура еластичної сітки для усадки / відбору прогнозів. Це здається дуже потужним. Але з наукової точки зору я не знаю добре, що робити, коли отримав коефіцієнти. На яке питання я відповідаю? Це ті змінні, які найбільше впливають на цей результат, і це коефіцієнти, які дають найкраще співвідношення …

2
Як передбачити або розширити регресійні лінії в ggplot2?
У мене є кадр даних, який містить два часові ряди: дати та номери версій версій Emacs та Firefox. За допомогою однієї команди ggplot2 легко скласти діаграму, яка використовує loess (таким чином, що виглядає трохи кумедно, що я не заперечую), щоб перетворити точки в рядки. Як я можу продовжити лінії в …

3
Як `predict.randomForest` оцінює ймовірності класу?
Як randomForestоцінює ймовірність класу пакетів, коли я використовую predict(model, data, type = "prob")? Я використовував rangerдля навчання випадкових лісів, використовуючи probability = Tаргумент для прогнозування ймовірностей. rangerв документації говорить, що це: Вирощувати ймовірнісні ліси, як у Malley et al. (2012 р.). Я імітував деякі дані і спробував обидва пакети та …

1
Яка інтуїція за обмінними зразками під нульовою гіпотезою?
Перестановочні тести (також називаються тестом рандомизації, тестом на повторну рандомізацію або точним тестом) дуже корисні і корисні, коли припущення про нормальний розподіл, необхідне, наприклад, t-testне виконується, і при перетворенні значень за ранжуванням непараметричний тест, як-от Mann-Whitney-U-test, призведе до втрати більше інформації. Однак одне і єдине припущення не слід оминути увагою …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

2
Чому це передбачення часових рядів "досить бідне"?
Я намагаюся навчитися користуватися нейронними мережами. Я читав цей підручник . Після встановлення нейронної мережі на часовій серії, використовуючи значення в для прогнозування значення на автор отримує наступний сюжет, де синя лінія є тимчасовим рядом, зелена - прогноз на дані поїздів, червона - прогнозування даних випробувань (він використав тест на …

3
Чи може модель для негативних даних із збіганням нулів (Tweedie GLM, нульовий надутий GLM тощо) передбачити точні нулі?
Розподіл Tweedie може моделювати скошені дані з точковою масою в нулі, коли параметр (показник у співвідношенні середня дисперсія) знаходиться між 1 і 2.ppp Аналогічно, надута з нуля (будь-то безперервна чи дискретна) модель може мати велику кількість нулів. У мене виникають проблеми з розумінням того, що це так, що коли я …

4
Прогностичні моделі: статистика не може перемогти машинне навчання? [зачинено]
Закрито . Це питання має бути більш зосередженим . Наразі відповіді не приймаються. Хочете вдосконалити це питання? Оновіть питання, щоб воно зосередило увагу на одній проблемі, лише відредагувавши цю публікацію . Закрито 2 роки тому . Зараз я переглядаю магістерську програму, зосереджену на статистиці / економетриці. У мого майстра всі …

1
Така річ, як зважене співвідношення?
У мене є кілька цікавих даних про найпопулярніших музичних артистів, розподілених за місцем розташування на близько 200 округів Конгресу. Я хочу побачити, чи можна опитати людину на її музичні уподобання та визначити, чи він «вона слухає, як демократ», або «слухає як республіканець». (Природно, це легке серце, але в даних є …

3
Як отримати прогнози щодо виживання часу з моделі Cox PH?
Я хочу розробити модель прогнозування (Cox PH) для смертності за всіма причинами в наборі даних учасників, з яких (майже) всі померли після закінчення спостереження (наприклад, 1 рік). Замість того, щоб прогнозувати абсолютний ризик померти в певний момент часу, я хотів би передбачити час виживання (у місяцях) для кожної людини. Чи …

1
Як передбачити один часовий ряд з іншого часового ряду, якщо вони пов'язані
Я намагаюся вирішити цю проблему вже більше року без особливого прогресу. Це частина дослідницького проекту, який я роблю, але я проілюструю це прикладом історії, який я склав, тому що фактична область проблеми трохи заплутана (відстеження очей). Ви є літаком, який відстежує ворожий корабель, який подорожує океаном, тому ви зібрали ряд …

1
Caret glmnet vs cv.glmnet
Здається, існує велика плутанина в порівнянні використання glmnetв рамках caretпошуку оптимальної лямбда та використання cv.glmnetтого ж завдання. Поставлено багато питань, наприклад: Класифікаційна модель train.glmnet vs. cv.glmnet? Який правильний спосіб використання glmnet з каретою? Перехресне підтвердження `glmnet` за допомогою` caret` але відповіді не надано, що може бути пов'язано з відтворюваністю питання. …

1
Випадковий ліс та передбачення
Я намагаюся зрозуміти, як працює Випадковий ліс. Я розумію, як будуються дерева, але не можу зрозуміти, як випадковий ліс робить передбачення щодо зразка мішка. Хтось може мені дати просте пояснення, будь ласка? :)

2
використання інформації про сусідів для введення даних або пошуку даних (у R)
У мене є набір даних з припущенням, що найближчі сусіди є найкращими прогнозами. Просто прекрасний приклад двостороннього візуалізації градієнта- Припустимо, у нас є випадок, коли мало значень не вистачає, ми можемо легко передбачити, виходячи з сусідів та тенденції. Відповідна матриця даних у R (макетний приклад для тренування): miss.mat <- matrix …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.