Наприклад, у мене є історичні дані про збитки, і я обчислюю екстремальні кванти (величина ризику або ймовірна максимальна втрата). Отримані результати призначені для оцінки збитків чи прогнозування їх? Де можна провести лінію? Я збентежений.
Наприклад, у мене є історичні дані про збитки, і я обчислюю екстремальні кванти (величина ризику або ймовірна максимальна втрата). Отримані результати призначені для оцінки збитків чи прогнозування їх? Де можна провести лінію? Я збентежений.
Відповіді:
"Прогнозування" та "оцінка" дійсно іноді використовуються взаємозамінно в нетехнічній писемності, і вони, схоже, функціонують аналогічно, але між ними існує різка відмінність у стандартній моделі статистичної проблеми. An оцінили дані використовують вгадати параметр в той час як предиктор використовує дані вгадати в якому - то випадковому значенні , яке не є частиною набору даних. Для тих, хто не знайомий з тим, що означають "параметр" та "випадкове значення" у статистиці, далі надається детальне пояснення.
У цій стандартній моделі дані вважаються складовою (можливо, багатоваріантної) спостереження випадкової величини X , розподіл якої, як відомо, лежить лише у визначеному наборі можливих розподілів, "станах природи". Оцінка т є математичною процедуру , яка присвоює кожне можливе значення х деякий властивість т ( х ) про стан природи & thetas , таких як його середнє ц ( & thetas ; ) . Таким чином , оцінка є здогадом про справжній стан природи. Ми можемо сказати, наскільки хороша оцінка, порівнявши t ( x ) до .
Предиктор відноситься до незалежного спостереження іншого випадкової величини Z , розподіл якої має відношення до істинного стану природи. Прогноз - це здогад про інше випадкове значення. Ми можемо сказати , наскільки добре конкретний прогноз тільки шляхом порівняння р ( х ) до значення , що реалізовується Z . Ми сподіваємось, що в середньому угода буде хорошою (в сенсі усереднення всіх можливих результатів х і одночасно над усіма можливими значеннями Z ).
Звичайний найменший квадрат дає стандартний приклад. Дані складаються з пар асоціюють значення y i залежної змінної зі значеннями x i незалежної змінної. Стан природи визначається трьома параметрами α , β та σ : це говорить про те, що кожне y i є незалежним малюнком від нормального розподілу із середнім α + β x i та стандартним відхиленням σ . α , β і - параметри (числа), які вважаються фіксованими та незмінними. Інтерес зосереджується на α (перехоплення) та β (нахил). МНК оцінка, написана ( α , β ) , добре в тому сенсіщо α прагне бути ближче до альфа і β прагне бути ближче до р ,незалежнотогощо істинного (але невідомо) значень альфа і β може бути.
Прогноз OLS складається з спостереження нового значення залежної змінної, пов'язаного з деяким значенням x незалежної змінної. x може бути або не бути серед x i в наборі даних; це несуттєво. Один інтуїтивно хороший прогноз, що це нове значення, ймовірно, буде близька до & alpha ; + β х . Кращі прогнози говорять про те, наскільки близько може бути нове значення (їх називають інтервалами прогнозування ). Вони враховують той факт , що альфаі β є невизначеним (оскільки вони залежать математично від випадкових величин ( у я ) ), що σ не відомий напевно (і , отже , повинен бути оцінений), а також припущення про те, що У ( х ) має нормальний розподіл при стандартному відхиленні σ і середньому α + β x (зверніть увагу на відсутність шапки!).
Особливо зауважимо, що цей прогноз має два окремих джерела невизначеності: невизначеність даних призводить до невизначеності в оціненому схилі, перехоплення та залишкового стандартного відхилення ( σ ); крім того, існує невизначеність у тому, яке значення Y ( x ) відбудеться. Ця додаткова невизначеність - оскільки Y ( x ) є випадковою - характеризує прогнози. Передбачення може виглядати як оцінки ( в кінці кінців, α + β х оцінки & alpha ; :-) і може мати навіть саму математичну формулу ( p ( x ), іноді може бути такою ж, як t ( x ) ), алеце буде мати більшу кількість невизначеності, ніж оцінка.
Ось тоді на прикладі OLS ми чітко бачимо розмежування: оцінка вгадує параметри (які є фіксованими, але невідомими числами), тоді як прогноз здогадується про значення випадкової величини. Джерело потенційної плутанини полягає в тому, що прогнозування зазвичай будується на оцінених параметрах і навіть може мати ту саму формулу, що і оцінка.
На практиці можна відрізнити оцінювачі від прогнозів двома способами:
мета : оцінювач прагне пізнати властивість справжнього стану природи, тоді як прогноз намагається вгадати результат випадкової величини; і
невизначеність : передбачувач зазвичай має більшу невизначеність, ніж пов'язаний оцінювач, через додаткову невизначеність у результаті цієї випадкової величини. Отже, добре задокументовані та описані прогнози зазвичай мають діапазони невизначеності - інтервали прогнозування - ширші за смуги невизначеності оцінок, відомі як довірчі інтервали. Характерною особливістю інтервалів прогнозування є те, що вони можуть (гіпотетично) скорочуватися в міру зростання набору даних, але вони не скорочуватимуться до нульової ширини - невизначеність у випадковому результаті "не зводиться" - тоді як ширина довірчих інтервалів буде, як правило, скорочуються до нуля, що відповідає нашій інтуїції, що точність оцінки може стати довільно доброю при достатній кількості даних.
При застосуванні цього для оцінки потенційної втрати інвестицій, розглянемо спочатку мета: ви хочете знати , скільки ви могли б на самому ділі втратити на цій інвестиції (або цієї конкретної кошика інвестицій) в протягом певного періоду, або ви дійсно просто вгадати , що це очікувані збитки (можливо, у великій сукупності інвестицій)? Перший - це передбачення, другий - оцінка. Тоді розглянемо невизначеність. Як би змінилася ваша відповідь, якби у вас було майже нескінченне ресурсів для збору даних та проведення аналізів? Якщо це стане дуже точним, ви, ймовірно, оцінюєте очікувану прибутковість інвестицій, тоді як якщо ви залишаєтесь невпевненими у відповіді, ви робите прогноз.
Таким чином, якщо ви все ще не впевнені, з якою твариною ви маєте справу, запитайте це у свого оцінника / прогноктора: наскільки це неправильно і чому? За допомогою обох критеріїв (1) та (2) ви дізнаєтесь, що у вас є.
Оцінка завжди для невідомого параметра, тоді як прогнозування - для випадкової величини.
Різниці в моделях немає. Дійсно є (незначна) різниця в проведених акціях. Оцінка - це калібрування вашої імовірнісної моделі з використанням даних ("навчання" в термінології AI). Прогнозування - це «відгадування» майбутнього спостереження. Якщо припустити, що це «здогадування» засноване на минулих даних - це може бути випадок оцінки; наприклад прогнозування зросту наступної людини, яку ви збираєтеся зустріти, використовуючи оцінку середнього зросту у сукупності. Зауважте, що це прогнозування не завжди є примірником оцінки. Стать наступної людини, яку ви збираєтесь зустріти, не є параметром населення в класичному розумінні; Прогнозуючи стать, можливо, знадобиться деяка оцінка, але це потребуватиме ще декількох ...
У випадку вартості ризику прогнозування та оцінка збігаються, оскільки ваші прогнозовані збитки - це орієнтовна тривалість збитку.
Зазвичай "оцінка" зарезервована для параметрів, а "прогнозування" - для значень. Однак іноді відмінність стає розмитою, наприклад, ви, можливо, бачили щось на кшталт "оцінити значення завтра" замість "прогнозувати значення завтра".
Цікавий ризик (VaR) - цікавий випадок. VaR не є параметром, але ми не кажемо "прогнозуємо VaR". Ми говоримо "оцінюємо VaR". Чому?
Причина в тому, що VaR не є випадковою величиною, якщо ви знаєте розподіл, і вам потрібно знати розподіл, щоб обчислити VaR. Отже, якщо ви використовуєте параметричний підхід VaR, то спочатку оцінюєте параметри розподілу, а потім обчислюєте VaR. Якщо ви використовуєте непараметричний VaR, то ви безпосередньо оцінюєте VaR аналогічно тому, як ви б оцінювали параметри. У цьому плані він схожий на квантил.
З іншого боку, сума збитків є випадковою величиною. Отже, якщо вас попросять прогнозувати втрати, ви прогнозуєте, що вони не оцінюють. Знову ж таки, іноді ми кажемо «оцінити» втрати. Отже, лінія розмита, як я писав раніше.
Нижче я знаходжу дефініції більш пояснювальні:
Оцінка - це обчислене наближення результату. Цей результат може бути прогнозом, але не обов'язково. Наприклад, я можу підрахувати, що кількість автомобілів на мосту Золоті ворота о 17 годині вчора становила 900, якщо припустити, що три смуги, що йдуть у напрямку до Маріна, є потужністю, кожен автомобіль займає 30 футів місця, а міст - 9000 футів ( 9000/30 х 3 = 900).
Екстраполяція - це оцінка значення змінної за межами відомого діапазону значень, припускаючи, що оцінене значення слідує певній схемі з відомих. Найпростішою і найпопулярнішою формою екстраполяції є оцінка лінійної тенденції на основі відомих даних. Альтернативи лінійній екстраполяції включають поліноміальну та конічну екстраполяцію. Як і оцінка, екстраполяція може використовуватися для прогнозування, але вона не обмежується прогнозуванням.
Прогнозування просто говорить щось про майбутнє. Прогнози зазвичай зосереджені на результатах, а не на шляху до цих результатів. Наприклад, я міг би передбачити, що до 2050 року всі транспортні засоби будуть працювати з електродвигунами, не пояснюючи, яким чином ми отримуємо від низького рівня прийняття в 2011 році до повного прийняття до 2050 року. Як видно з попереднього прикладу, прогнози не обов'язково грунтуються на даних.
Прогнозування - це процес складання прогнозу чи прогнозування. Терміни прогноз і прогнозування часто використовуються взаємозамінно, але іноді прогнози відрізняються від прогнозів тим, що прогнози часто дають пояснення шляхів до результату. Наприклад, прогноз прийняття електромобілів може включати шлях до повного прийняття електричного транспортного засобу за схемою прийняття у формі S, де мало автомобілів електричні до 2025 року, точка перегину відбувається в 2030 році з швидким прийняттям, а більшість автомобілів електричні після 2040 рік.
Оцінка, екстраполяція, прогнозування та прогнозування не є взаємно вичерпними та сукупно вичерпними. Хороші довгострокові прогнози складних проблем часто потребують використання інших методів, ніж екстраполяція, щоб отримати правдоподібні результати. Прогнози та прогнози можуть також відбуватися без будь-якого виду обчислених оцінок.
див. визначення посилань1 визначення2