Запитання з тегом «predictive-models»

Прогностичні моделі - це статистичні моделі, основною метою яких є прогнозування інших спостережень системи оптимально, на відміну від моделей, метою яких є перевірка певної гіпотези або механічне пояснення явища. Таким чином, прогностичні моделі роблять менший акцент на інтерпретації та більше акцентують на продуктивності.

2
Чи прогноз є «золотим критерієм» для судження про здатність статистиків?
Я читав лінійні моделі підручника Faraway з R (1-е видання) минулих вихідних. Далекий розділ мав назву "Статистична стратегія та невизначеність моделі". Він описав (стр 158) , що він штучно створений деякі дані , використовуючи дуже складну модель, то він попросив своїх студентів моделювати дані і порівняти студентів передбачені результати проти …

1
Створюючи регресійну модель, використовуючи окремі набори моделювання / валідації, чи доцільно "рециркулювати" дані валідації?
Припустимо, у мене розділився 80/20 між спостереженнями моделювання / валідації. Я встановив модель до набору даних моделювання, і мені подобається помилка, яку я бачу в наборі даних перевірки. Перш ніж я розгорнути свою модель для оцінки майбутніх спостережень, чи доцільно поєднати перевірку з даними моделювання, щоб отримати оновлені оцінки параметрів …

2
Коли увійти / випробувати свої змінні під час використання випадкових лісових моделей?
Я роблю регресію, використовуючи випадкові ліси для прогнозування цін на основі декількох ознак. Код пишеться на Python за допомогою Scikit-learn. Як ви вирішите, чи слід трансформувати свої змінні, використовуючи exp/ logперед тим, як використовувати їх, щоб відповідати регресійній моделі? Чи потрібно це використовувати підхід Ансамблю, такий як випадковий ліс?

2
Баггінг з надмірним набором для прогнозних моделей рідкісних подій
Хтось знає, чи описано наступне і (в будь-якому випадку), чи це звучить як правдоподібний метод вивчення прогнозної моделі з дуже незбалансованою цільовою змінною? Часто в CRM-програмах пошуку даних ми будемо шукати модель, коли позитивна подія (успіх) дуже рідкісна стосовно більшості (негативний клас). Наприклад, у мене може бути 500 000 випадків, …

2
Чому відрізок P> 0,5 не є "оптимальним" для логістичної регресії?
ПЕРЕДБАЧЕННЯ: Мене не хвилюють переваги використання обрізання чи ні, або як слід обрати обріз. Моє питання суто математичне і обумовлене цікавістю. Логістична регресія моделює задню умовну ймовірність класу А проти класу В, і вона відповідає гіперплану, коли задні умовні ймовірності рівні. Тож теоретично я зрозумів, що точка класифікації 0,5 зведе …

2
Прогнозування квантильної регресії
Мені цікаво використовувати кількісну регресію для деяких моїх моделей, але хотілося б отримати деякі роз'яснення щодо того, що я можу досягти, використовуючи цю методологію. Я розумію, що можу отримати більш надійний аналіз взаємозв'язку IV / DV , особливо, коли стикаюся з виснаженнями та гетеросцедастичністю, але в моєму випадку фокус робиться …

4
Отримання правильних вихідних значень для nls-моделі в R
Я намагаюся пристосувати просту модель закону про владу до набору даних таким чином: mydf: rev weeks 17906.4 1 5303.72 2 2700.58 3 1696.77 4 947.53 5 362.03 6 Мета полягає в тому, щоб пропустити лінію електропередачі і використовувати її для прогнозування revвластей на майбутні тижні. Купка досліджень привела мене до …

2
Що таке усадка?
У певних колах усадка слів дуже багато. Але що таке усадка, то, схоже, не існує чіткого визначення. Якщо у мене є часовий ряд (або будь-яка колекція спостережень за деяким процесом), то якими різними способами я можу виміряти певний тип емпіричної усадки на серії? Про які різні теоретичні усадки я можу …

2
Як вибрати оптимальну ширину бункера при калібруванні ймовірних моделей?
Передумови: Тут є кілька чудових питань / відповідей щодо того, як відкалібрувати моделі, які прогнозують ймовірність того, що результат відбудеться. Наприклад Шкала барію та його розкладання на роздільну здатність, невизначеність та надійність . Калібрувальні графіки та ізотонічна регресія . Ці методи часто вимагають використання методу бінінгу за передбачуваними ймовірностями, так …

1
Тест на придатність у логістичній регресії; яку "форму" ми хочемо протестувати?
Я маю на увазі питання та його відповіді: Як порівняти (ймовірність) прогнозованої здатності моделей, розроблених за допомогою логістичної регресії? автор @Clark Chong та відповіді / коментарі від @Frank Harrell. і до питання Ступені свободи у тесті Хосмера-Лемешоуχ2χ2\chi^2 та коментарі. Я прочитав статті Д. В. Хосмера, Т. Хосмера, С. Ле Чессі, …

1
Чи є проблема з мультиколінеарністю та регресією сплайнів?
При використанні природних (тобто обмежених) кубічних сплайнів базові функції, створені вкрай колінеарними, і при використанні в регресії, здається, створюють дуже високу статистику VIF (коефіцієнта дисперсії), що сигналізує про мультиколінеарність. Коли ми розглядаємо випадок моделі для прогнозування, це питання? Схоже, це завжди буде так через характер конструкції шпонки. Ось приклад в …

1
Відмінності між PROC змішаними та lme / lmer у R - ступенями свободи
Примітка: це запитання є репостом, оскільки моє попереднє питання довелося видалити з юридичних причин. Порівнюючи PROC MIXED від SAS з функцією lmeз nlmeпакету в R, я натрапив на деякі досить заплутані відмінності. Більш конкретно, ступеня свободи в різних випробувань відрізняються між PROC MIXEDі lme, і я задавався питанням, чому. Почніть …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
Прогнозування декількох цілей або класів?
Припустимо, я будую модель прогнозування, де я намагаюся передбачити кілька подій (наприклад, як перекидання штампів, так і метання монети). Більшість алгоритмів, які мені знайомі з роботою лише з однією ціллю, тому мені цікаво, чи існує стандартний підхід до подібного роду речей. Я бачу два можливі варіанти. Мабуть, найбільш наївним підходом …

2
Домен-агностична особливість інженерії, яка зберігає смислове значення?
Техніка особливостей часто є важливою складовою для машинного навчання (її активно використовували, щоб виграти Кубок KDD у 2010 році ). Однак я вважаю, що і більшість технічних методів знищити будь-яке інтуїтивне значення основних рис або дуже специфічні для певного домену або навіть конкретних типів функцій. Класичним прикладом першого є аналіз …

2
SVM, змінна взаємодія та дані тренувань підходять
У мене є 2 загальних / більше теоретичних питання. 1) Мені цікаво, як SVM обробляють змінні взаємодії під час побудови прогнозних моделей. Наприклад, якщо у мене є дві функції f1 і f2, і ціль залежить від f1, f2, і скажімо, f1 * f2 (або якась функція h (f1, f2)), чи …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.