Статистика та великі дані predictive-models

1

Визначте точність моделі, яка оцінює ймовірність події

Я моделюю подію з двома результатами, a і b. Я створив модель, яка оцінює ймовірність того, що відбудеться або a, або b (тобто модель обчислить, що a відбудеться з 40% шансом, а b відбудеться з 60% шансом). Я маю великий запис результатів випробувань із оцінками моделі. Я хотів би оцінити, …

12 predictive-models scoring-rules

2

Згідно з висновком Байєса, чому деякі терміни випадають із заднього передбачення?

У кон'югатному байесівському аналізі Кевіна Мерфі про розподіл Гаусса він пише, що задній прогнозний розподіл є p(x∣D)=∫p(x∣θ)p(θ∣D)dθp(x∣D)=∫p(x∣θ)p(θ∣D)dθ p(x \mid D) = \int p(x \mid \theta) p(\theta \mid D) d \theta де - це дані, на які підходить модель, а - невидимі дані. Я не розумію, чому залежність від зникає в …

12 bayesian predictive-models inference posterior

1

Інтерпретація коефіцієнтів регресії LASSO

Зараз я працюю над створенням прогнозної моделі для двійкового результату на наборі даних із ~ 300 змінними та 800 спостереженнями. Я багато читав на цьому сайті про проблеми, пов’язані з поетапною регресією, а чому б не використовувати її. Я читав про регресію LASSO та її здатність до вибору особливостей і …

12 multiple-regression predictive-models interpretation regression-coefficients lasso

3

Регресія зі скасованими даними

Спроба підрахувати кількість відвідувань за демографічними показниками та послугами. Дані дуже перекошені. Гістограми: qq ділянки (зліва - журнал): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) cityі serviceє факторними змінними. Я отримую низьке значення p для всіх змінних, але також отримую низький r-квадрат у розмірі .05. Що я повинен зробити? Чи працювала …

12 regression multiple-regression predictive-models exponential qq-plot

1

Чому Netflix перейшов зі своєї п'ятизіркової системи рейтингу на систему «подобається / не подобається»?

Netflix використовував, щоб базувати свої пропозиції на рейтингах інших фільмів / шоу. Ця рейтингова система мала п'ять зірок. Тепер Netflix дозволяє користувачам подобатись / не подобатися (великі пальці вгору / великі пальці) фільми / шоу. Вони стверджують, що легше оцінювати фільми. Чи не була б ця двостороння класифікація статистично менш …

11 variance predictive-models prediction

1

Як інтерпретувати результати, коли і гребінець, і ласо окремо працюють добре, але дають різні коефіцієнти

Я запускаю регресійну модель як з Лассо, так і з Ріджем (для прогнозу дискретної змінної результату в межах від 0 до 5). Перш ніж запустити модель, я використовую SelectKBestметод scikit-learnзменшення набору функцій з 250 до 25 . Без початкового вибору особливостей і Лассо, і Рідж поступаються нижчим показникам точності [що …

11 regression predictive-models feature-selection lasso ridge-regression

1

Коли я повинен перестати шукати модель?

Я шукаю модель між запасами енергії та погодою. У мене є ціна MWatt, куплена між країнами Європи, і багато цінності погоди (файли Grib). Кожні години протягом 5 років (2011-2015). Ціна / добу Це на день протягом одного року. Я маю це за годину протягом 5 років. Приклад погоди 3Dscatterplot, у …

11 time-series forecasting predictive-models modeling large-data

2

Дерева рішень та регресія - Чи можуть передбачувані значення виходити за межі даних про навчання?

Якщо мова йде про дерева рішень, чи може передбачуване значення лежати поза діапазоном даних про навчання? Наприклад, якщо діапазон набору навчальних даних цільової змінної становить 0-100, коли я генерую свою модель і застосовую її до чогось іншого, чи можуть мої значення становити -5? або 150? З огляду на те, що …

11 regression predictive-models random-forest cart

3

Ресурси для вивчення методик з декількома цілями?

Я шукаю ресурси (книги, конспекти лекцій тощо) про методи, які можуть обробляти дані, які мають кілька цілей (напр .: три залежної змінної: 2 дискретні та 1 безперервна). Хтось має ресурси / знання з цього приводу? Я знаю, що для цього можна використовувати нейронні мережі.

11 regression machine-learning predictive-models references

1

Показник оцінки прогнозу для панельних / поздовжніх даних

Мені хотілося б оцінити кілька різних моделей, які забезпечують передбачення поведінки на щомісячному рівні. Дані збалансовані, і 100 000 і T = 12. Результат відвідує концерт у визначеному місяці, тож він дорівнює нулю для ~ 80% людей у будь-якому місяці, але довгий правий хвіст важких користувачів. Прогнози, які я маю, …

11 repeated-measures predictive-models stata panel-data validation

2

Чи є в цьому модельному підході надмірне обладнання

Нещодавно мені сказали, що процес, за яким я дотримувався (складова дисертації з МС), може розглядатися як надмірно придатний. Я шукаю, щоб краще зрозуміти це і побачити, чи згодні інші. Метою цієї частини статті є: Порівняйте продуктивність градієнтних підсилених регресійних дерев проти випадкових лісів на наборі даних. Подивіться на ефективність обраної …

11 machine-learning data-mining predictive-models

3

Як букмекери вибирають шанси на вступ?

Я знаю, що букмекери коригують свої шанси для того, щоб максимізувати прибуток, прогнозуючи ймовірність обсягу грошей, розміщених у кожному результаті. Як букмекери вибирають шанси на вступ?

11 predictive-models

1

Інтервали довіри для різниці в часових рядах

У мене є стохастична модель, яка використовується для імітації часових рядів певного процесу. Мене цікавить ефект зміни одного параметра на конкретне значення і хочу показати різницю між тимчасовим рядом (скажімо, модель A і модель B) і якимось довірчим інтервалом на основі моделювання. Я просто запускав купу моделей з моделі A …

11 time-series predictive-models markov-process

1

Прогнозування процесів довгої пам’яті

Я працюю з процесом з в для { 1 , - 1 } t = 1 , 2 , …xtxtx_t{1,−1}{1,−1}\{1, -1\}t=1,2,…t=1,2,…t = 1, 2, \ldots Функція автокореляції вказує на процес з довгою пам’яттю, тобто він відображає розпад закону потужності із показником <1. Ви можете імітувати аналогічний ряд у R за …

11 time-series predictive-models autocorrelation

2

Яка інтуїція стоїть за періодичною нейронною мережею довгострокової пам'яті (LSTM)?

Ідея, що стоїть за періодичною нейронною мережею (RNN), мені зрозуміла. Я розумію це таким чином: У нас є послідовність спостережень ( о⃗ 1, о⃗ 2, … , О⃗ нo→1,o→2,…,o→n\vec o_1, \vec o_2, \dots, \vec o_n ) (або, іншими словами, багатоваріантний часовий ряд). Кожне окреме спостереження о⃗ io→i\vec o_i - NNN …

11 time-series neural-networks predictive-models intuition rnn

Запитання з тегом «predictive-models»