Запитання з тегом «predictive-models»

Прогностичні моделі - це статистичні моделі, основною метою яких є прогнозування інших спостережень системи оптимально, на відміну від моделей, метою яких є перевірка певної гіпотези або механічне пояснення явища. Таким чином, прогностичні моделі роблять менший акцент на інтерпретації та більше акцентують на продуктивності.

1
Визначте точність моделі, яка оцінює ймовірність події
Я моделюю подію з двома результатами, a і b. Я створив модель, яка оцінює ймовірність того, що відбудеться або a, або b (тобто модель обчислить, що a відбудеться з 40% шансом, а b відбудеться з 60% шансом). Я маю великий запис результатів випробувань із оцінками моделі. Я хотів би оцінити, …

2
Згідно з висновком Байєса, чому деякі терміни випадають із заднього передбачення?
У кон'югатному байесівському аналізі Кевіна Мерфі про розподіл Гаусса він пише, що задній прогнозний розподіл є p(x∣D)=∫p(x∣θ)p(θ∣D)dθp(x∣D)=∫p(x∣θ)p(θ∣D)dθ p(x \mid D) = \int p(x \mid \theta) p(\theta \mid D) d \theta де - це дані, на які підходить модель, а - невидимі дані. Я не розумію, чому залежність від зникає в …

1
Інтерпретація коефіцієнтів регресії LASSO
Зараз я працюю над створенням прогнозної моделі для двійкового результату на наборі даних із ~ 300 змінними та 800 спостереженнями. Я багато читав на цьому сайті про проблеми, пов’язані з поетапною регресією, а чому б не використовувати її. Я читав про регресію LASSO та її здатність до вибору особливостей і …

3
Регресія зі скасованими даними
Спроба підрахувати кількість відвідувань за демографічними показниками та послугами. Дані дуже перекошені. Гістограми: qq ділянки (зліва - журнал): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) cityі serviceє факторними змінними. Я отримую низьке значення p для всіх змінних, але також отримую низький r-квадрат у розмірі .05. Що я повинен зробити? Чи працювала …

1
Чому Netflix перейшов зі своєї п'ятизіркової системи рейтингу на систему «подобається / не подобається»?
Netflix використовував, щоб базувати свої пропозиції на рейтингах інших фільмів / шоу. Ця рейтингова система мала п'ять зірок. Тепер Netflix дозволяє користувачам подобатись / не подобатися (великі пальці вгору / великі пальці) фільми / шоу. Вони стверджують, що легше оцінювати фільми. Чи не була б ця двостороння класифікація статистично менш …

1
Як інтерпретувати результати, коли і гребінець, і ласо окремо працюють добре, але дають різні коефіцієнти
Я запускаю регресійну модель як з Лассо, так і з Ріджем (для прогнозу дискретної змінної результату в межах від 0 до 5). Перш ніж запустити модель, я використовую SelectKBestметод scikit-learnзменшення набору функцій з 250 до 25 . Без початкового вибору особливостей і Лассо, і Рідж поступаються нижчим показникам точності [що …

1
Коли я повинен перестати шукати модель?
Я шукаю модель між запасами енергії та погодою. У мене є ціна MWatt, куплена між країнами Європи, і багато цінності погоди (файли Grib). Кожні години протягом 5 років (2011-2015). Ціна / добу Це на день протягом одного року. Я маю це за годину протягом 5 років. Приклад погоди 3Dscatterplot, у …

2
Дерева рішень та регресія - Чи можуть передбачувані значення виходити за межі даних про навчання?
Якщо мова йде про дерева рішень, чи може передбачуване значення лежати поза діапазоном даних про навчання? Наприклад, якщо діапазон набору навчальних даних цільової змінної становить 0-100, коли я генерую свою модель і застосовую її до чогось іншого, чи можуть мої значення становити -5? або 150? З огляду на те, що …

3
Ресурси для вивчення методик з декількома цілями?
Я шукаю ресурси (книги, конспекти лекцій тощо) про методи, які можуть обробляти дані, які мають кілька цілей (напр .: три залежної змінної: 2 дискретні та 1 безперервна). Хтось має ресурси / знання з цього приводу? Я знаю, що для цього можна використовувати нейронні мережі.

1
Показник оцінки прогнозу для панельних / поздовжніх даних
Мені хотілося б оцінити кілька різних моделей, які забезпечують передбачення поведінки на щомісячному рівні. Дані збалансовані, і 100 000 і T = 12. Результат відвідує концерт у визначеному місяці, тож він дорівнює нулю для ~ 80% людей у ​​будь-якому місяці, але довгий правий хвіст важких користувачів. Прогнози, які я маю, …

2
Чи є в цьому модельному підході надмірне обладнання
Нещодавно мені сказали, що процес, за яким я дотримувався (складова дисертації з МС), може розглядатися як надмірно придатний. Я шукаю, щоб краще зрозуміти це і побачити, чи згодні інші. Метою цієї частини статті є: Порівняйте продуктивність градієнтних підсилених регресійних дерев проти випадкових лісів на наборі даних. Подивіться на ефективність обраної …

3
Як букмекери вибирають шанси на вступ?
Я знаю, що букмекери коригують свої шанси для того, щоб максимізувати прибуток, прогнозуючи ймовірність обсягу грошей, розміщених у кожному результаті. Як букмекери вибирають шанси на вступ?

1
Інтервали довіри для різниці в часових рядах
У мене є стохастична модель, яка використовується для імітації часових рядів певного процесу. Мене цікавить ефект зміни одного параметра на конкретне значення і хочу показати різницю між тимчасовим рядом (скажімо, модель A і модель B) і якимось довірчим інтервалом на основі моделювання. Я просто запускав купу моделей з моделі A …

1
Прогнозування процесів довгої пам’яті
Я працюю з процесом з в для { 1 , - 1 } t = 1 , 2 , …xtxtx_t{1,−1}{1,−1}\{1, -1\}t=1,2,…t=1,2,…t = 1, 2, \ldots Функція автокореляції вказує на процес з довгою пам’яттю, тобто він відображає розпад закону потужності із показником <1. Ви можете імітувати аналогічний ряд у R за …

2
Яка інтуїція стоїть за періодичною нейронною мережею довгострокової пам'яті (LSTM)?
Ідея, що стоїть за періодичною нейронною мережею (RNN), мені зрозуміла. Я розумію це таким чином: У нас є послідовність спостережень ( о⃗ 1, о⃗ 2, … , О⃗ нo→1,o→2,…,o→n\vec o_1, \vec o_2, \dots, \vec o_n ) (або, іншими словами, багатоваріантний часовий ряд). Кожне окреме спостереження о⃗ io→i\vec o_i - NNN …

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.