Трансформація надзвичайно перекошених розподілів


13

Припустимо, що у мене є змінна, розподіл якої перекоситься позитивно на дуже високий ступінь, така що взяття журналу буде недостатньо для того, щоб привести його в діапазон косості для нормального розподілу. Які мої варіанти на даний момент? Що я можу зробити, щоб перетворити змінну в нормальний розподіл?


2
Просто для переконання, що «перекошений негатив» означає довгий хвіст, спрямований вліво або вправо? Якщо це дійсно негативно скасовано (довгий хвіст ліворуч), трансформація журналу не буде працювати дуже добре.
Penguin_Knight

6
Взаємне перетворення сильніше логарифмічного і часто зберігає значення, оскільки одиниці вимірювання просто перевернуті. Наприклад, зворотний час на те, щоб зробити щось, є своєрідною швидкістю, і навпаки. Взаємність миль на галон або км на літр має сенс. Зворотні запитання інвертують порядок і можуть бути заперечені, якщо це є кращим. Вони, природно, є частиною схеми Box-Cox з цією додатковою деталізацією. Усі значення повинні бути позитивними, щоб це добре працювало. (В принципі, це буде працювати з усіма негативними значеннями, але я ще не бачу прикладу на практиці.)
Нік Кокс,

2
ln(ln())>1ln(ln(0,7))ln(ln(7))можна зробити, тому що я використовую мм. (Це логарифми дають складні результати для негативних аргументів, я не думаю, що це статистично допомагає.)
Нік Кокс,

2
@Aksakal Занадто сильно, щоб сказати, що "перетворення журналу не є інструментом для виправлення косості": якщо косості є єдиною проблемою, журнали часто працюють дуже добре. Якщо Ваша думка полягає в тому, що косоокість граничних розподілів не повинна бути головною проблемою, я схильний погоджуватися.
Нік Кокс

3
Я, природно, погоджуюся, але якби я використовував квадрати або логарифми, я не почував би себе зобов’язаним пропонувати посилання, і подібне тут. Але корисність зворотних зворотів, особливо часу та швидкості, підкреслила (наприклад) Tukey, JW 1977. Дослідницький аналіз даних. Редінг, Массачусетс: Аддісон-Веслі та в кількох своїх роботах. Милі на галон і галон на милю (або навпаки літри на км і км на літр) є загальним місцем в обговоренні даних про продуктивність автомобіля. Щільності та їх взаємні оцінки є досить стандартними прикладами в географії та демографії.
Нік Кокс

Відповіді:


13

λ

Реалізувати його дуже просто, використовуючи функцію LL, або якщо у вас є пакет stat, як SAS або MATLAB, використовуйте їх команди: це команда boxcox в MATLAB і PROC TRANSREG в SAS.

Крім того, в R це в пакеті MASS, функція boxcox ().


5

Для позитивного перекосу (хвіст знаходиться на позитивному кінці осі x) існують квадратні кореневі перетворення, перетворення журналу та зворотні / зворотні перетворення (у порядку збільшення гостроти). Таким чином, якщо перетворення журналу недостатньо, можна використовувати наступний рівень перетворення. Box Cox запускає всі перетворення автоматично, тому ви можете вибрати найкращу.


-5

Більшість програмних пакетів використовуватиме номер Ейлера як основу журналу за замовчуванням, AKA: природний журнал. Ви можете використовувати більш високий базовий номер для введення даних із надмірно косою правою стороною. Як ви це зробите для синтаксису, залежить від програмного забезпечення, яке ви використовуєте.

Якщо вам потрібно буде повернутись із перетворених значень після того, як проведені оцінки, можливо, буде трохи простіше використовувати цей метод, тому що все, що вам потрібно зробити, - це виконати експоненціальний оператор у вашій змінній, незалежно від того, якою була ваша база журналів.


6
е
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.