Чи перетворення журналу є дійсною технікою для тестування ненормальних даних?


19

Рецензуючи документ, автори констатують: "Змінні безперервного результату, що виявляють косий розподіл, були перетворені, використовуючи природні логарифми, до того, як були проведені t випробування для задоволення необхідних припущень щодо нормальності".

Чи прийнятний це спосіб аналізу ненормативних даних, особливо якщо базовий розподіл не обов'язково є нормальним?

Це може бути дуже дурним питанням, але я раніше цього не бачив…


3
Ну, якщо початковий розподіл не є нормальним для журналу, то перетворені дані не задовольняють передумовним припущенням нормальності, так що ж отримує трансформація?
Макрос

@Macro - досить правда! (+1) - вони, ймовірно, просто хотіли наблизити розподіли до симетричних, що непогано хочеться зробити для тестування, але, якщо вони не перевіряли і не записували його, ми не знаємо, чи журнал трансформація викликала негативний перекос, який, можливо, погіршив питання ...
jbowman

2
Ми можемо зробити висновок, що оскільки це було зроблено для задоволення нормальності, а нормальність перевірялася на першому місці, то нормальність перевірялася згодом. Це сильно неявно в мові тут.
Джон

10
Т-тест для логарифмів не є ні тим самим, як t-тест для неперетворених даних, ні непараметричний тест. Т-тест на журналах порівнює геометричні засоби, а не звичайні арифметичні засоби. Це одне з декількох важливих міркувань при визначенні того, чи можна використовувати логарифми (що це може бути, залежно від програми).
whuber

Відповіді:


9

Звичайне намагання застосувати певну трансформацію до нормальності (використовуючи, наприклад, логарифми, квадратні корені, ...), коли стикаємося з не нормальними даними. Хоча логарифм дає хороші результати для перекошених даних досить часто, немає гарантії, що він буде працювати в цьому конкретному випадку. Слід також пам’ятати, що коментар @whubers вище при аналізі трансформованих даних: "Т-тест для логарифмів не є ні тим самим, як t-тест для неперетворених даних, ні непараметричний тест. T-тест на журналах порівнює геометричний означає, а не (звичайні) арифметичні засоби ".

н-1i=1н(хi-х¯)3(н-1i=1н(хi-х¯)2)3/2

Замість того, щоб вибирати перетворення (наприклад, логарифми), оскільки воно працює більшу частину часу, я вважаю за краще використовувати процедуру Box-Cox для вибору перетворення з використанням даних даних. Однак з цим є деякі філософські питання; зокрема, чи має це впливати на кількість ступенів свободи в t-тесті, оскільки ми використовували деяку інформацію з вибірки, вибираючи, яку трансформацію використовувати.

Нарешті, хорошою альтернативою для використання або t-тесту після трансформації, або класичного непараметричного тесту є використання аналога t-тесту завантажувального завантаження . Він не вимагає припущення про нормальність і є тестом про неперероблені засоби (а не про що-небудь інше).


1
+1 Добре, продумане обговорення з хорошою рекомендацією наприкінці. Щоб отримати докладнішу інформацію про версію для завантаження / переустановку / перестановку t-тесту, перегляньте останню тему на сайті stats.stackexchange.com/q/24911 .
whuber

0

Взагалі кажучи, якщо припущення, необхідні для проведення t-тесту, не виконуються, то було б доцільніше використовувати непараметричний тест.


5
Можливо. Непараметричні тести майже завжди порівнюють медіани (або інші процентилі), а не засоби, і тому справді вирішують дещо інше питання. Але це не здається корисною відповіддю на поточне запитання, в якому конкретно (і тільки) задається питання про тестування журналів даних.
whuber
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.