Я прочитав безліч чудових дискусій на сайті щодо інтерпретації довірчих інтервалів та інтервалів прогнозування, але одна концепція все ще трохи спантеличує:
Розглянемо рамку OLS, і ми отримали відповідну модель . Нам дали і попросили передбачити його відповідь. Ми обчислюємо і, як бонус, ми також надаємо 95% інтервал прогнозування навколо нашого прогнозування, a a Отримання формули меж прогнозування в лінійній моделі . Назвемо цей інтервал передбачення PI. х*х*Т β
Тепер, що з наступного (або жодного) не є правильним тлумаченням ІП?
- Для , зокрема, лежить в межах PI з імовірністю 95%. y ( x ∗ )
- Якщо нам дано велику кількість s, ця процедура для обчислення ІП покриє справжні відповіді в 95% часу.
З формулювань @ Гунга в інтервалі прогнозування лінійної регресії , здається, колишня правда (хоча я дуже міг неправильно трактувати.) Інтерпретація 1 здається для мене протиінтуїтивною (в тому сенсі, що ми робимо висновки Байєса з частотистського аналізу), але якщо це правильно, це тому , що ми передбачали на реалізацію випадкової величини VS. оцінює з параметром ?
(Редагувати) Бонусне питання: Припустимо, ми знали, що таке справжня , тобто процес генерування даних, чи зможемо ми говорити про ймовірності щодо будь-якого конкретного прогнозування, оскільки ми просто дивимось на ?ϵ
Моя остання спроба в цьому: ми можемо "концептуально розкласти" (вживаючи слово дуже вільно) інтервал передбачення на дві частини: (A) інтервал довіри навколо передбачуваної середньої реакції та (B) сукупність інтервалів, які просто кількісні. діапазони терміна помилки. (B) ми можемо робити імовірнісні твердження про те, що залежать від того, щоб знати справжню передбачувану середню, але в цілому ми можемо трактувати лише інтервали прогнозування як часто-частотні КІ навколо прогнозованих значень. Це дещо правильно?