Чому потрібен t-тест, враховуючи, що у нас є z-тест?


9

Чи може хтось дати пояснення, чому t-тест "трапляється"? Мене вчили використовувати t-тест, коли ви не знаєте стандартного відхилення сукупності (тобто ви знаєте лише стандартне відхилення вашого зразка), але я не впевнений, чому це може відрізняти його від z-тесту .


Я оновив вашу назву, щоб перейти до питання, яке, на вашу думку, ви задаєте; не соромтесь редагувати, якщо я неправильно
пояснив

Відповіді:


3

Я не думаю, що я розумію ваше питання повністю. Ви запитуєте, чому б ви використовували t-тест?

Якщо ви розумієте, чому б ви використовували z-тест, ви повинні добре уявити, чому б ви використовували t-тест. Для великих зразків z-тест і t-тест повинні дати подібні або однакові результати. Але хоча z-тест припускатиме нормальне розподіл, t-тест враховуватиме невизначеність у розподілі вибірки при менших розмірах зразків.


3
Hmm, t-тест також передбачає нормальний розподіл. Можливо, ви хотіли сказати, що нам потрібно менше інформації про це розповсюдження.
ДжонК

@JohnK Я не думаю, що має сенс сказати, що тест передбачає розподіл в першу чергу, але я думаю, що Бенджамін мав на увазі, що t-оцінка / статистика передбачає розподіл Т, а не розподіл Z.
Даторакі

3

Сам z-тест - це фактично тест відношення ймовірності між ймовірністю, що передбачає нульову гіпотезу, та ймовірністю припущення альтернативної гіпотези. Припускаючи основні нормальні розподіли з відомими відхиленнями і лише перевіряючи засоби, алгебра спрощує до z-тесту, який ми знаємо і любимо (DeGroot 1986, с. 442–447).

Використання тієї ж самої процедури максимальної ймовірності, але трактування дисперсії як невідомої створює різну пару ймовірностей та їх співвідношення, і, дозволяючи алгебрі спроститись, дає статистику:

н(Х¯н-мк0)Sн2н-1
(DeGroot 1986, стор. 485–489). Змінюється і тестувальний розподіл, оскільки чисельник вищезгаданої статистики зазвичай розподіляється,Х¯, а знаменник поширюється у вигляді квадратного кореня квадратних нормалей, S2, що є квадратним коренем випадкової змінної chi-квадрата. Gosset (Student) показав, що якщо у вас є випадкова величина:
YN(0,1)Zχн2ХYZн
то X розподіляється з розподілом t і n ступенів свободи.

Таким чином, щоб стверджувати це без суворості, t-тест - це природний результат того самого процесу відношення ймовірності, який стоїть за z-тестом, коли дисперсія даних сама по собі невідома і оцінюється через максимальну ймовірність.


1
це було дуже освітянським. Я зовсім забув, що t-тест походить від максимуму likelihoood
модератор

1

Несумлінна відповідь полягає в тому, що ви хочете використовувати t-тест, коли у вас є невелика кількість зразків через ймовірність, що зразки незвично близькі між собою (щодо фактичної дисперсії популяції). У такому випадку знаменник у формулі t-статистики буде незвично малим, і тому сама t-статистика буде незвично великою. Таким чином, ви набагато більше шансів отримати велике значення для t-stat, якщо у вас є невелика кількість зразків, ніж ви отримаєте порівняно великий z-stat, тому вам потрібно більше значення, щоб відхилити нуль за допомогою t-тест, ніж z-тест при тому ж рівні значущості.


Я вважаю аргумент привабливим, але, замислюючись, непереконливо. Зрештою, якщо випадково зразки знаходяться незвично далеко один від одного (що має статися так само легко, як і незвично близькі), то, здається, саме така логіка призведе до протилежного висновку.
whuber

0

Найважливішим диференціатором є розмір вибірки, як правило: якщо н менше, ніж 30 слід використовувати t-тест, інакше z-тест.

Хороший огляд основних припущень та відмінностей (та подібності) обох тестів наведено тут:
http://www.le.ac.uk/bl/gat/virtualfc/Stats/ttest.html

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.