Висловіть відповіді у вигляді оригінальних одиниць у трансформованих даних Box-Cox


13

Для деяких вимірювань результати аналізу належним чином представлені в трансформованій шкалі. У більшості випадків, однак, бажано представити результати в оригінальній шкалі вимірювання (інакше ваша робота більш-менш нікчемна).

Наприклад, у випадку даних, що перетворюються в журнал, виникає проблема з інтерпретацією у вихідній шкалі, оскільки середнє значення зареєстрованих значень не є журналом середнього. Прийняття антилогіартиму оцінки середнього значення в логарифмічній шкалі не дає оцінки середнього значення за вихідною шкалою.

Якщо, однак, дані, перетворені журналом, мають симетричні розподіли, виконують такі співвідношення (оскільки журнал зберігає впорядкованість):

Середній[журнал(Y)]=Середня[журнал(Y)]=журнал[Середня(Y)]

(антилогіартим середнього значення журнальних значень є медіаною на вихідній шкалі вимірювань).

Тож я можу лише робити висновки про різницю (або співвідношення) медіанів за початковою шкалою вимірювання.

Двопробні t-тести та інтервали довіри є найбільш надійними, якщо популяції є приблизно нормальними з приблизно стандартними відхиленнями, тому ми можемо спокусити використовувати Box-Coxтрансформацію для припущення про нормальність (я також думаю, що це також дисперсія, що стабілізує трансформацію ).

Однак якщо застосувати t-інструменти до Box-Coxперетворених даних, ми отримаємо висновки про різницю засобів перетворених даних. Як ми можемо інтерпретувати ті, що знаходяться в оригінальній шкалі вимірювання? (Середнє значення перетворених значень не є перетвореним середнім). Іншими словами, взяття оберненого перетворення оцінки середнього значення за трансформованою шкалою не дає оцінку середнього значення за початковою шкалою.

Чи можу я зробити висновок лише про медіанів у цьому випадку? Чи є трансформація, яка дозволить мені повернутися до засобів (за початковою шкалою)?

Це питання було спочатку розміщений як коментар тут

Відповіді:


11

Якщо ви хочете зробити висновки конкретно про середнє значення вихідної змінної, тоді не використовуйте перетворення Box-Cox. Перетворення IMO Box-Cox є найбільш корисними, коли трансформована змінна має власну інтерпретацію, а трансформація Box-Cox лише допомагає вам знайти правильну шкалу для аналізу - це, як правило, трапляється напрочуд часто. Два несподівані показники, які я знайшов таким чином, були 1/3 (коли змінна відповіді була об’ємом сечового міхура) та -1 (коли змінною реакції було вдихання за хвилину).

Перетворення журналу - це, мабуть, єдиний виняток із цього. Середнє значення в лог-шкалі відповідає середньому геометричному значенню в початковій шкалі, що є принаймні чітко визначеною величиною.


Що ж, у вас є й інші винятки. -1 відповідає гармонійному середньому, ...
kjetil b halvorsen

9

Якщо трансформація Box-Cox дає симетричний розподіл, то середнє значення перетворених даних повертається до медіани в початковому масштабі. Це справедливо для будь-якого монотонного перетворення, включаючи трансформації Box-Cox, перетворення IHS тощо. Отже, умовиводи про засоби, що трансформуються, відповідають висновкам про медіану у вихідній шкалі.

Оскільки вихідні дані були перекошені (або ви б не використовували перетворення Box-Cox в першу чергу), чому ви хочете зробити висновки про засоби? Я би подумав, що робота з медіанами матиме більше сенсу в цій ситуації. Я не розумію, чому це сприймається як "проблема з інтерпретацією в початковому масштабі".


λ

Дякую. Можливо, тому, що зразок (з популяції, який, на мою думку, повинен слідувати приблизно симетричному розподілу), може просто випадково перекоситися.
Джордж Донтас

4
Приємний приклад необхідності робити висновки про засоби, незважаючи ні на що, надається деякими оцінками екологічного ризику. Щоб значно спростити, уявіть, що ви плануєте забудовувати землю в парк. Ви випробовуєте ґрунти на предмет певної складової, і, як це часто буває, виявляєте, що її концентрація розподіляється приблизно в нормі. Тим не менш, люди, що користуються парком - які можуть безпосередньо потрапляти під ці ґрунти - будуть ефективно «відбирати» ґрунти рівномірно, коли вони рухаються. Їх експозиція з часом буде середньоарифметичною концентрацією, а не її геометричним середнім.
whuber

1
Іноді нас цікавлять проблеми, які випливають із формулювань загальної кількості чогось. Якщо ви знаєте середнє значення, ви можете перейти від середнього до загального (помноживши на кількість спостережень). Немає способу перейти від медіани до загальної!
Джордж Донтас

6

Якщо ви хочете зробити висновок про засоби в початковій шкалі, ви можете скористатися висновком, який не використовує припущення про нормальність.

Але будьте обережні. Просте підключення за допомогою прямого порівняння засобів через сканування повторного відтворення (або тестування перестановки, або завантаження), коли обидва зразки мають різні відхилення, може бути проблемою, якщо ваш аналіз передбачає, що відхилення будуть рівними (і однакові відхилення на трансформованій шкалі будуть різницевими відхиленнями за оригінальною шкалою, якщо засоби відрізняються). Такі прийоми не уникають необхідності думати про те, що ти робиш.

f(х+год)т[мк+(Y-мк)]Yмкσ2т()

т(мк)

-

Найпростіший випадок, коли у вас нормальність у лог-шкалі, а значить, і логічна норма у вихідній шкалі. Якщо ваша дисперсія відома (що в кращому випадку трапляється дуже рідко), ви можете побудувати лонормальні CI та PI в оригінальній шкалі, і ви можете дати передбачуване середнє значення від середнього розподілу відповідної кількості.

тт

Вам потрібно дуже ретельно подумати над тим, на яке саме питання ви намагаєтесь відповісти.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.