Я дивлюся на деякі проблеми, а в деяких на тестування коефіцієнтів, іноді я бачу людей, які використовують розподіл Стьюдента, а іноді бачу нормальний розподіл. Яке правило?
Я дивлюся на деякі проблеми, а в деяких на тестування коефіцієнтів, іноді я бачу людей, які використовують розподіл Стьюдента, а іноді бачу нормальний розподіл. Яке правило?
Відповіді:
Нормальний розподіл - це великий розподіл вибірки у багатьох змістовних статистичних проблемах, які стосуються певної версії теореми про центральний межа: у вас є (приблизно) незалежні відомості, які додаються для отримання відповіді. Якщо оцінки параметрів асимптотично нормальні, їх функції також будуть асимптотично нормальними (у звичайних випадках).
З іншого боку, розподіл Стьюдента виводиться за більш обмежених умов серед нормальних похибок регресії. Якщо ви можете придбати це припущення, ви можете придбати t -розподіл, який використовується для тестування гіпотези в лінійній регресії. Використання цього розподілу забезпечує більш широкі інтервали довіри, ніж використання звичайного розподілу. Змістовне значення цього полягає в тому, що у малих вибірках потрібно оцінити міру невизначеності, середню регресію в квадратичній помилці або стандартне відхилення залишків σ . (У великих зразках ви ніби мають стільки інформації, ніби ви її знали, тому t -розподіл перероджується до нормального розподілу.)
Бувають випадки лінійної регресії, навіть із обмеженими зразками, коли розподіл Стьюдента не може бути виправданим. Вони пов'язані з порушеннями умов другого порядку щодо регресійних помилок; а саме, що вони є (1) постійною дисперсією та (2) незалежною. Якщо ці припущення порушені, і ви виправляєте стандартні помилки, використовуючи оцінювач Eicker / White для гетерокедастичних, але незалежних залишків; або оцінювач Newey-West для послідовно корельованих помилок або кластеризованих стандартних помилокдля даних, пов'язаних з кластером, немає можливості виправити розумне обгрунтування для розподілу студентів. Однак, використовуючи відповідну версію аргументу асимптотичної нормальності (трейгулярні масиви тощо), ви можете виправдати нормальне наближення (хоча ви повинні мати на увазі, що ваші довірчі інтервали, ймовірно, будуть занадто вузькими).
Мені подобається представлення розподілу студентів t як суміш нормального розподілу та гамма-розподілу:
Зауважимо, що середнє значення гамма-розподілу - а дисперсія цього розподілу дорівнює V [ ρ | ν ] = 2 . Таким чином, ми можемо розглядати t-розподіл як узагальнення припущення про постійну дисперсію до припущення про "подібну" дисперсію. ν восновному контролює, наскільки подібними ми дозволяємо бути відхиленнями. Ви також розглядаєте це як "випадкову зважену" регресію, оскільки ми можемо використовувати вищезазначений інтеграл як представлення "прихованої змінної" таким чином:
Де і ρ i ∼ G a m m a ( ν
Зауважте, що не існує "правила" для вирішення цих речей, хоча моя та інші відповіді на це запитання можуть бути корисними для пошуку деяких тестів, які ви можете зробити на шляху кінцевої дисперсії (студент t - нескінченна дисперсія на ступінь свободи, меншу або рівну до двох).