Міцний t-тест на середню


17

Я намагаюсь перевірити нульовий проти локальної альтернативи для випадкової змінної , за умови легкого та середнього перекосу та куртозу випадкової величини. Виконуючи пропозиції Вілкокса у «Вступі до надійної оцінки та тестування гіпотез», я переглянув тести, засновані на підстриженому середньому, медіані, а також М-оцінці місця розташування (одноетапна процедура Вілкокса). Ці надійні випробування перевершують стандартний t-тест за потужністю при тестуванні з розподілом, який не перекошений, але лептокуртотичний.E[X]=0E[X]>0X

Однак при тестуванні з косим розподілом ці однобічні тести є або занадто ліберальними, або занадто консервативними згідно з нульовою гіпотезою, залежно від того, розподіл ліво- чи праворуч косий відповідно. Наприклад, з 1000 спостережень, тест на основі медіани фактично відкине ~ 40% часу, при номінальному рівні 5%. Причина цього очевидна: для перекошених розподілів медіана та середнє значення досить різні. Однак у своїй заяві мені справді потрібно перевірити середнє, а не середнє, а не підстрижене середнє.

Чи є більш надійний варіант t-тесту, який насправді тестує середній показник, але він непроникний для перекосу та куртозу?

В ідеалі процедура добре би працювала і у випадку без косого, високого куртозу. Тест "один крок" майже досить хороший, параметр "згин" встановлений відносно високим, але він менш потужний, ніж обрізані середні тести, коли немає перекосу, і має деякі проблеми з підтриманням номінального рівня відхилень під нахилом .

передумови: причина, по якій я дуже дбаю про середню, а не про медіану, полягає в тому, що тест буде використовуватися у фінансовій програмі. Наприклад, якщо ви хотіли перевірити, чи має портфель позитивний очікуваний прибуток журналу, середня дійсно підходить, тому що якщо ви інвестуєте в портфель, ви отримаєте всі прибутки (що означає середній раз кількість зразків), а не дублікатів медіани. Тобто, я на насправді хвилює сума черпає з RV .nnX


Чи є причина, яка забороняє використовувати тест Велча? Погляньте на мою відповідь на це запитання ( stats.stackexchange.com/questions/305/… ), де я посилаюся на документ, який виступає за використання Велча у разі ненормативності та гетеросцедастичності.
Генрік

1
ну проблема полягає в тому, що я хочу тест на 1 зразок, а не на 2 зразка! Я тестую нульове , а не E [ X 1 ] = E [ X 2 ] . Я перегляну Кубінгер та ін. співавт., папір (Ich kann schlecht Deutsche). E[X]=μE[X1]=E[X2]
shabbychef

Дякуємо за уточнення. У цьому випадку папір Kubinger не буде для вас дуже корисним. Вибачте.
Генрік

Відповіді:


5

Чому ви дивитесь непараметричні тести? Чи порушені припущення t-тесту? А саме, порядкові чи ненормальні дані та непостійні відхилення? Звичайно, якщо ваш зразок досить великий, ви можете виправдати параметричний t-тест його більшою потужністю, незважаючи на відсутність нормальності в вибірці. Так само, якщо ви турбуєтеся про неоднакові дисперсії, в параметричному тесті є виправлення, які дають точні p-значення (корекція Велча).

В іншому випадку порівняння результатів із t-тестом не є хорошим способом вирішити це, оскільки результати t-тесту є необ'єктивними, коли припущення не виконуються. Mann-Whitney U - це відповідна непараметрична альтернатива, якщо це те, що вам справді потрібно. Ви втрачаєте силу лише в тому випадку, якщо використовуєте непараметричний тест, коли ви могли б виправдано використовувати t-тест (тому що припущення виконані).

І, ще трохи, перейдіть сюди ...

http://www.jerrydallal.com/LHSP/STUDENT.HTM


дані, безумовно, не є нормальними. надлишок куртозу - порядку 10-20, перекос - від -0,2 до 0,2. Я роблю 1-зразковий t-тест, тому я не впевнений, що я слідкую за вами щодо «неоднакових варіацій» або U-тесту.
shabbychef

Я приймаю поради "використовувати параметричний тест". це не точно вирішує моє питання, але моє запитання, ймовірно, було занадто відкритим.
shabbychef

12

Я погоджуюся, що якщо ви хочете перевірити, чи різняться засоби групи (на відміну від тестування відмінностей між груповими медіанами чи підстриженими засобами тощо), то ви не хочете використовувати непараметричний тест, який перевіряє іншу гіпотезу.

  1. Загалом, p-значення з t-тесту мають тенденцію бути досить точними, враховуючи помірні відхилення припущення про нормальність залишків. Ознайомтеся з цим аплетом, щоб зрозуміти про цю надійність: http://onlinestatbook.com/stat_sim/robustness/index.html

  2. Якщо ви все ще стурбовані порушенням припущення про нормальність, ви можете скористатися завантаженням . наприклад, http://biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf

  3. Ви також можете перетворити перекошену залежну змінну для вирішення проблем із відхиленням від нормальності.


2
+1 приємна і чітка відповідь. Джеромі, чи можу я поставити запитання щодо пункту 3? Я розумію міркування щодо трансформації даних, але щось завжди турбувало мене з цього приводу. Яка обґрунтованість звітності результатів t-тесту про перетворені дані до нетрансформованих даних (де вам не дозволено робити t-тест)? Іншими словами, якщо дві групи відрізняються, наприклад, коли дані перетворюються в журнал, то на яких підставах можна сказати, що і необроблені дані відрізняються? Майте на увазі, я не статистик, тому, можливо, я просто сказав щось абсолютно дурне :)
nico

2
@nico Я не впевнений у тому, як повідомити або подумати про результати, але якщо все, що ти хочеш показати, це те, що для деяких X та Y, mu_X! = mu_Y, то, правда, для всіх X_i <X_j, журнал ( X_i) <log (X_j) і для всіх X_i> X_j, log (X_i)> log (X_j). Ось чому для непараметричних тестів, які працюють з рангами, перетворення даних не впливають на результат. Я думаю, що з цього ви можете припустити, що якщо якийсь тест покаже, що mu_log (X)! = Mu_log (Y), то mu_X! = Mu_Y.
JoFrhwld

дякую за відповідь (и). Дійсно, t-випробування підтримує номінальну швидкість I типу при м'яко перекошеному / куртотичному введенні. проте я сподівався на щось із більшою силою. re: 2, я реалізував Wilcox ' trimpbі trimcibt, але вони трохи надто повільні, щоб робити мої тести на владу, принаймні на мій смак. Re: 3, я думав про цей метод, але мене цікавить середнє значення неперетворених даних (тобто я не порівнюю 2 RV з t-тестом; в цьому випадку монотонне перетворення було б добре для порівняння на основі рангів, як зазначає @JoFrhwld.)
shabbychef

2
@nico Якщо розподіл залишків населення однаковий у двох групах, то я думаю, що колись існує різниця у сировинній групі населення, значить, також існують відмінності в групових засобах перетворення, що забезпечує збереження порядку. Зважаючи на це, p-значення та довірчі інтервали, як правило, незначно змінюватимуться залежно від того, використовуєте ви необроблені дані чи трансформовані дані. Взагалі я вважаю за краще використовувати перетворення, коли вони здаються значущим показником для розуміння змінної (наприклад, шкала Ріхтера, децибели, журнали підрахунків тощо).
Джеромі Англім


0

У мене недостатньо репутації для коментаря, тому як відповідь: Погляньте на цей розрахунок. Я думаю, що це чудова відповідь. Коротко:

Асимптотичні показники значно чутливіші до відхилень від нормальності у вигляді косості, ніж у вигляді куртозу ... Таким чином, t-тест Стьюдента чутливий до косості, але порівняно міцний щодо важких хвостів, і розумно використовувати тест на нормальність, яка спрямована на альтернативи перекосу перед застосуванням t-тесту.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.