Чому важливі дистрибуції?


10

Це може так само погіршитися, як найдурніші запитання, коли-небудь задані на цьому форумі, але, отримавши надійні та змістовні відповіді на попереднє запитання, я подумав, що знову розтягну свою удачу.

Я деякий час був дуже заплутаний щодо важливості статистичних розподілів, особливо, коли вони стосуються прибутку активів і, зокрема, розподілу активів.

Моє запитання має бути конкретним: припустимо, що у мене є 20 років даних S&P 500 щомісячних повернень, чому мені потрібно взяти на себе певний вид розподілу (тобто нормальний / полет Джонсона / Леві тощо) для мого рішення про розподіл активів, коли я можу просто просто прийміть рішення щодо розподілу активів на основі історичних даних, які я маю при собі?


3
пам’ятайте, що якщо ви знайшли відповіді на попереднє запитання корисними, ви можете позначити їх як «прийняті», натиснувши прапорець біля відповіді. це дає можливість іншим знати, що ваше питання вирішено.
Джефф

2
Насправді є нещодавнє повідомлення від JDCook на цю тему. Щоб окреслити його відповідність вашому запитанню, я процитую з першого пункту "Коли статистики аналізують дані, вони не просто переглядають дані, які ви їм приносите. Вони також розглядають гіпотетичні дані, які ви могли б привести. Іншими словами вони вважають, що могло статися так само, як і насправді. "
user603

Я вважаю, що Талеб мав щось зухвало сказати про проблеми прийняття рішень виключно з історичних даних :-). (Історичні дані , як правило , безпосередньо не виявити рідкісні , але , можливо , з смертельним наслідком «чорний лебідь» події до тих пір , поки не стане занадто пізно.)
whuber

2
... як більшість індиків реалізується через пару тижнів.
Рьогі

Для розширення точки @ user603 - ви хочете робити висновки поза вашим зразком. Зокрема, точка розподілу активів стосується майбутньої поведінки, а не минулої поведінки. Сюди можна віднести, наприклад, те, як ведуть себе хвости, де у вас мало спостережень. Ви можете привнести додаткові знання / розуміння / упередження щодо процесу за допомогою розподільних припущень. Якщо ці припущення десь поблизу справа, ви можете додати багато інформації.
Glen_b -Встановіть Моніку

Відповіді:


5

Використання передбачуваного розподілу (тобто параметричного аналізу) зменшить обчислювальну вартість вашого методу. Я припускаю, що ви хочете виконати завдання регресії або класифікації. Це означає, що в якийсь момент ви збираєтеся оцінити розподіл деяких даних. Непараметричні методи корисні, коли дані не відповідають добре вивченому розподілу, але, як правило, потрібно або більше часу для обчислення, або більше пам'яті для зберігання.

Крім того, якщо дані генеруються процесом, який відповідає розподілу, наприклад, вони є середнім рівнем рівномірних випадкових процесів, то використання цього розподілу має більше сенсу. У випадку усереднення набору рівномірної змінної правильний розподіл, мабуть, є розподілом Гаусса.


0

Доповнення відповіді Джеймса : параметричні моделі також (як правило) потребують меншої кількості вибірок, щоб добре підходити: це може збільшити їхню потужність узагальнення: тобто вони можуть передбачити нові дані краще, навіть помиляючись. Звичайно, це залежить від ситуації, моделей та розмірів вибірки.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.