Яка різниця між прогнозами "у вибірці" та "поза вибіркою"?


17

Я не розумію, у чому саме різниця між прогнозом "у вибірці" та "поза вибіркою"? Прогноз у вибірці використовує підмножину наявних даних до прогнозних значень поза періодом оцінки. За вибірковим прогнозом натомість використовуються всі доступні дані Чи правильно це ?

Дуже конкретно правильне таке визначення?

В рамках вибіркового прогнозу використовується підмножина наявних даних для прогнозованих значень поза періодом оцінки та порівнювати їх з відповідними відомими або фактичними результатами. Це робиться для оцінки здатності моделі прогнозувати відомі значення. Наприклад, в межах вибіркового прогнозу з 1980 по 2015 роки можуть використовуватися дані з 1980 по 2012 роки для оцінки моделі. Використовуючи цю модель, синоптик потім прогнозував би значення на 2013-2015 роки та порівнював прогнозовані значення з фактично відомими значеннями. Прогноз поза вибіркою натомість використовує всі наявні дані у вибірці для оцінки моделей. У попередньому прикладі оцінка проводиться протягом 1980–2015 років, а прогноз (і) розпочнуться у 2016 році.


Чи можете ви надати якийсь контекст? Відповіді, які ви надаєте на власне запитання, здаються нормальними, але термінологія може бути специфічною.
IWS

Звідки ви взяли ці визначення?
gung - Відновіть Моніку

In-sample - це дані, які ви знаєте на момент складання моделей і які ви використовуєте для створення цієї моделі. Поза вибірковими є дані, які були небачені, і ви створюєте лише прогнозування / прогноз. За більшості окружних обчислень модель буде виконуватись гірше поза вибіркою, ніж у вибірці, де всі параметри були відкалібровані.
Рік

@IWS Я додав особливого питання :)
Енґін YILMAZ

@Richard Будь ласка, прочитайте нове особливе запитання ...
Енґін YILMAZ

Відповіді:


32

Під "зразком" мається на увазі вибірка даних, яку ви використовуєте для встановлення моделі.

По-перше - у вас є зразок
Другий - ви підходите до моделі на зразок
Третій - ви можете використовувати модель для прогнозування

Якщо ви прогнозуєте спостереження, яке було частиною вибірки даних - це прогноз у вибірці.

Якщо ви прогнозуєте спостереження, яке не входило до вибірки даних - це прогноз поза вибіркою.

Тож питання, яке ви повинні задати собі, таке: чи застосовувалося конкретне спостереження для відповідності моделі чи ні? Якщо його використовували для встановлення моделі, прогноз спостереження є вибірковим. Інакше це поза вибіркою.

якщо ви використовуєте дані 1990-2013 рр. для відповідності моделі, а потім прогнозуєте на 2011-2013 роки, це прогнозований вибір. але якщо ви використовуєте лише 1990-2010 рр. для підгонки моделі, а потім прогнозуєте 2011-2013 рр., то її позамобільний прогноз.


Ми маємо вибірку з 1990 по 2013 рік, тоді ми підходимо до моделі на вибірці, тоді ми прогнозуємо 2011-2013 рр., Це в вибірці? або Ми маємо вибірку з 1990 по 2013 рік, тоді ми підходимо до моделі з 1990 по 2010 рік, ми прогнозуємо 2011-2013 роки, це не вибірка?
Енґін ЙІЛМАЗ

так, якщо ви використовуєте дані 1990-2013 рр. для відповідності моделі, а потім прогнозуєте на 2011-2013 роки, це прогнозований вибір. але якщо ви використовуєте лише 1990-2010 рр. для підгонки моделі, а потім прогнозуєте 2011-2013 рр., то її позамобільний прогноз.
Кінь царя Соломона

3

Припустимо, у вашому зразку у вас є послідовність з 10 точок даних. Ці дані можна розділити на дві частини - наприклад, перші 7 точок даних для оцінки параметрів моделі та наступні 3 точки даних для перевірки працездатності моделі. Використовуючи пристосовану модель, прогнози, зроблені для перших 7 точок даних, називатимуться у вибірці прогнозу, а такі ж, як і для останніх 3 точок даних, будуть викликані зразком прогнозу. Це те саме, що ідея розділити дані на навчальний набір і набір перевірки.


1

Внутрішньовибірковий прогноз - це процес формальної оцінки можливостей прогнозування моделей, розроблених за допомогою спостережуваних даних, щоб побачити, наскільки ефективні алгоритми у відтворенні даних. Він схожий на навчальний набір в алгоритмі машинного навчання, а позабіржовий подібний до тестового набору.


Ви даєте коротке пояснення пробного прогнозування - чи могли б Ви також надати те саме для вибірок (тобто коротке пояснення не просто порівняння з тестовими наборами)?
ReneBt


-1

У прогнозуванні часових рядів "Приклад" означає дані поїздів, "Пробірка" - дані тесту

У часовій серії спочатку ми можемо прогнозувати результати для даних "Приклад" (тобто поїзд). Пізніше ми можемо прогнозувати результати для даних «вибірок» (тобто тесту).

model = ARIMA(order = (p,d,q), seasonal_order=(P,D,Q,S))
model.fit(train_data)

train_predictions = model.predict_in_sample()
test_predictions = model.predict(n_periods=len(test_data.index))

predictions = pd.concatenate((train_predictions, test_predictions),axis=0)

Я думаю, що ваша відповідь занепадає, тому що вона не відповідає на питання - зокрема, "Дуже конкретно, таке визначення правильне?" не звертається.
Martin Modrák
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.