Чому б не використовувати розподіл Т для оцінки середньої величини, коли вибірка велика?


17

Основні курси статистики часто пропонують використовувати звичайне розподіл для оцінки середнього параметра популяції, коли розмір вибірки n великий (як правило, більше 30 або 50). Т-розподіл Стьюдента використовується для менших розмірів вибірки для врахування невизначеності у стандартному відхиленні вибірки. Коли розмір вибірки великий, стандартне відхилення вибірки дає хорошу інформацію про стандартне відхилення сукупності, що дозволяє оцінити нормальний розподіл. Я це розумію.

Але навіщо використовувати оцінку, коли ви зможете точно отримати свій довірчий інтервал? Незалежно від розміру вибірки, який сенс використовувати звичайний розподіл, якщо це лише оцінка того, що ви можете отримати саме за допомогою T-розподілу?


@Glen_b Так, це були б оцінки інтервалів. Щодо цих інтервалів: "Ви повинні використовувати таблицю розподілу t при робочих проблемах, коли стандартне відхилення сукупності (σ) невідомо і розмір вибірки невеликий (n <30)" (від web.pdx.edu/~stipakb/ завантажити / PA551 / NormalVersusTdistribution.doc). Чому люди не використовують Т-розподіл весь час, коли стандартне відхилення населення не відомо (навіть коли n> 30)?
Pertinax

Відповіді:


15

Просто для уточнення відношення до заголовка ми не використовуємо t-розподіл для оцінки середнього значення (принаймні в сенсі точкової оцінки), а для побудови інтервалу для нього.

Але навіщо використовувати оцінку, коли ви зможете точно отримати свій довірчий інтервал?

Це гарне запитання (до тих пір, поки ми не будемо надто наполягати на "точно", оскільки припущення, що він буде точно розподілений т, насправді не виконуються).

"Ви повинні використовувати таблицю розподілу t при робочих проблемах, коли стандартне відхилення сукупності (σ) невідоме і розмір вибірки невеликий (n <30)"

Чому люди не використовують Т-розподіл весь час, коли стандартне відхилення населення не відомо (навіть коли n> 30)?

Я вважаю поради - у кращому випадку - потенційно оманливими. У деяких ситуаціях розподіл t все ж слід використовувати, коли ступінь свободи є значно більшою, ніж це.

Там, де норма є розумним наближенням, залежить від різноманітних речей (і так залежить від ситуації). Однак, оскільки (за допомогою комп’ютерів) просто не вдається просто використовувати т , навіть якщо df дуже великий, вам доведеться замислюватися, чому потрібно турбуватися про те, щоб зробити щось інше при n = 30.

Якщо розміри вибірки дійсно великі, це не помітно змінить інтервал довіри, але я не думаю, що n = 30 завжди достатньо близький до "дійсно великого".


тn


2
n=30α=5%

1
@ StéphaneLaurent Для більшості цілей це повинно бути штрафом на рівні 5%, але такі судження дуже залежать від особистості. Бувають ситуації - я зустрічався з однією лише сьогодні - коли цей рівень помилок може бути достатньою для значення.
Glen_b -Встановіть Моніку

2
@ StéphaneLaurent Ви можете отримати гідне розуміння від Johnson, VE (2013). Переглянуті стандарти статистичних даних . Праці Національної академії наук , 110 (48): 19313–19317. Ця стаття вписується в пост- Чому більшість опублікованих досліджень є помилковою критикою досліджень ( a la How Science Goes Wrong )
Алексіс

4
@ StéphaneLaurent Ваша стаття відповідає на моє запитання. На приклад, грубий переклад його висновку: "Використання нормального розподілу як наближення до t-розподілу Стьюдента є виключно продуктом технологічних обмежень 20 століття. Ці обмеження зникли із сучасним статистичним програмним забезпеченням, і його більше немає. будь-яка причина використовувати ці неконсервативні наближення ".
Pertinax

2
@TheThunderChimp Caveat: якщо відома дисперсія популяції (наприклад, оцінка частки населення - середня дихотомна величина), то стандартний нормальний ( z ), а не розподіл t є відповідним.
Олексій

7

Це історичний анахронізм. Їх у статистиці багато.

Якщо у вас не було комп'ютера, важко було використовувати t-дистрибутив, а набагато простіше використовувати звичайний розподіл. Як тільки розмір вибірки стає більшим, два розподіли стають схожими (наскільки великим є "великий" - ще одне питання).


1
Це здається досить дрібною відповіддю на глибше запитання.
Олексій

2
Не впевнений, що ти маєш на увазі. Ви не думаєте, що це причина? (Відповідь, яка найбільш обґрунтована, робить той самий пункт - хоча красномовніше і детальніше.)
Джеремі Майлз

1
Я заявив, що ваша відповідь мені звучить так: Тому що історія. Коротка резюме вашого запитання.
Олексій

2
Дякую за те, що повідомили мені - це приємніше, ніж анонімне голосування, для якого я не знав причини.
Джеремі Майлз

3
Історично "використовували" ці розподіли, шукаючи значення в таблицях. Єдиним способом, яким було б легше використовувати нормальний розподіл, було б те, що не потрібно було вибирати стовпчик, що відповідає ступеням свободи. Це навряд чи викликає занепокоєння. Що ж межа використання в тому , що в якийсь - то момент це НЕ має ніякого сенсу , щоб розширити таблиці в великих ступенів свободи: книги стали б занадто великим.
whuber

1

ex2n


1
При яких розмірах чисельні помилки при оцінці t перевищують прибуток від його використання?
jona

2
безумовно, ви можете обчислити значення t довільної точності, і тому вони можуть бути настільки ж точними, як і величини, з якими ви їх порівнюєте.
Ніл Г

"Іншими словами," точне "t-значення не є" точним ", і в межах помилки наближення значення таке ж, як значення CDF для стандартного нормального." Я не впевнений, що це надійне правило.
shadowtalker

2
Ця відповідь пропускає суть. Як приклад, значення кумулятивного нормального розподілу та кумулятивного розподілу Стьюдента при-2 стають непомітними для 16-ї значущої цифри (тобто приблизно до подвійної точності) лише тоді, коли розмір вибірки перевищує 5.9325×1016. Це вказує на те, що числова помилка не є жодною практичною проблемою.
whuber

1
Вубер, ти маєш рацію. Я неправильно використав "числову помилку". Я мав на увазі всі помилки обробки чисел: числове наближення інтегралів, числові помилки для роботи з кінцевою точністю та числові помилки через усічення. Якби можна було працювати з нескінченною точністю, не було б виправдання для заміни t-розподілу на нормальне
VictorZurkowski
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.