Коли я не можу замінити випадкову змінну її середньою?


10

Часте спрощення моделювання та моделювання полягає в заміні випадкової величини на її середнє значення.

Коли це спрощення призведе до неправильного висновку?


2
Чи означає "Var" змінну чи дисперсію або значення ризику ?
Генрі

3
Було б весело запустити послугу, яка платить за підписку своїх членів Netflix. Ми стягуватимемо лише , де довільно обрано у домені , тож, так знайте, безкоштовний Netflix! Пізніше ми запропонуємо деяким клієнтам можливість замість цього заплатити . x[-100,100]x2USD|х| USDмонтгодх[100,100]x2 USDmontгод
Нат

3
Ну у дуже простому випадку, якщо ми будемо до кінця, ми могли б втратити майже всю інформацію, яка нас цікавить. Розглянемо регресію Y на X, де ми замінили і Y, і X середнім значенням. Будь-яка інформація про схил втрачається.
Дейсон

1
Ви питаєте про заміну пропущених значень чи запитуєте про заміну випадкової змінної у конкретному контексті (наприклад, створення прогнозів на основі моделі випадкових ефектів)?
IWS

Відповіді:


20

Якщо ви заміните відсутнє значення якоюсь точковою оцінкою, ви нехтуєте всією його змінністю. Таким чином, ви не поширите всю оригінальну мінливість для вашої моделі. Схоже, ваші оцінки параметрів мають занадто низькі . Якщо ви робите висновок, ваші значення p будуть упереджено низькими. Ваш s буде занадто вузьким. Якщо ви робите прогнози, буде занадто вузьким.

Загалом: ви будете занадто впевнені у своїх висновках.


2
Хороша відповідь! Подумайте так: Випадкова величина має розподіл. Її можна перекидати вліво, вправо. Я можу бути бімодальним і т. Д. Зменшуючи змінну до її середнього значення, ви видаляєте всю ту зайву інформацію (невизначеність) і замінюєте розподіл (інтервали) на одну оцінку балів.
одинадцять

1
Якщо ви заміните відсутнє значення якоюсь точковою оцінкою, ви також припускаєте, що дані відсутні випадково. Середнє значення випадкової величини може не дорівнювати середньому значенню даних, коли воно відсутнє.
Ніл Г

@NeilG Вибачте за nitpick, але заміна пропущеного значення середнім значенням не означає прямо припускати, що дані відсутні як випадково. Тим більше, що - дещо заплутаною - термінологія навколо відсутніх даних вважає "випадковим зниклим безвісти" дані, які відсутні у випадковому порядку, інші умови, але відомі ( en.wikipedia.org/wiki/Missing_data ). ІМО, спосіб заміни даних не означає нічого про міркування. Це міркування повинно бути явним і вести до відповідного способу поводження з відсутніми даними. З цього приводу я повністю згоден з відповіддю Стефана.
IWS

@IWS Добре, що показники відсутності залежать від спостережуваних даних. Відсутність навмання означає, що показники відсутності залежать від даних, що не спостерігаються. Якщо ви заміните змінну на її середнє значення, яке залежить від того, як вона спостерігається, це може не збігатися з її безумовним середнім значенням - якщо дані випадково відсутні.
Ніл Г

@NeilG Ви не маєте на увазі " повністю пропущені випадково", коли в останньому реченні останнього коментаря ви пишете "пропав безладно"? Якщо так, то ми погоджуємось, але я просто змирився з термінологією. (див. сторінку wiki, яку я розмістив у своєму коментарі вище, мене завжди вчили, читали та використовували цю термінологію)
IWS

13

Окрім пунктів Стефана:

  • Практично в будь-якій програмі, де вас цікавлять нелінійні функції випадкової величини, підміна середньої величини загалом введе зміщення та, можливо, суперечливі результати. Середня швидкість і середня маса частинки, як правило, не співпадають із середньою кінетичною енергією, оскільки масштаби енергії з V ^ 2.
  • Середнє значення може навіть не бути можливим результатом для випадкової величини. Якщо мої можливі результати - 0 "пацієнт помирає" і 1 "життя пацієнта", можливо, не корисно мати модель, яка описує пацієнта як 0,1 "переважно мертвого, але трохи живого".

1
Обов’язково: youtube.com/watch?v=xbE8E1ez97M
Alexis

1
@ Алексис, але звичайно!
Джеффрі Брент

0

Приклад із реального життя (пов'язаний з двома отриманими вами відповідями) на фінансових ринках. Ціна опціону базується на ймовірності того, що ціна активу перевищить (або нижче) заданого рівня.

Наприклад, ціна опціону на придбання активу за ціною 100, коли очікувана вартість активу дорівнює 80. Якщо ви заміните випадкову змінну (ціну активу) на її середню, ви отримаєте ціну нульову (як ви ніколи не отримали б на 100 актив, який коштує 80). Якщо врахувати стохастичність активу (і це правильний спосіб зробити це), ви отримаєте позитивну ціну, оскільки існує певна ймовірність того, що ціна активу перевищить 100.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.