Мені було цікаво, чи може хтось допомогти мені з інформацією про куртоз (тобто чи є можливість трансформувати ваші дані, щоб зменшити їх?)
У мене є набір анкет з великою кількістю випадків та змінних. Для кількох моїх змінних дані показують досить високі значення куртозу (тобто лептокуртичного розподілу), що випливає з того, що багато учасників дали точно таку ж оцінку для змінної. У мене особливо великий розмір вибірки, тому згідно з теоремою центрального межі, порушення норм все одно має бути добре.
Проблема, однак, полягає в тому, що особливо високий рівень куртозу призводить до того, що в моєму наборі даних є кілька однозначних людей. Таким чином, навіть якщо я перетворюю дані або видаляю / коригую залишки, високий рівень куртозу означає, що наступні найбільш екстремальні показники автоматично стають застарілими. Я прагну використовувати (аналіз дискримінантних функцій). Кажуть, що DFA є надійним у відході від нормальності, за умови, що порушення спричинене хиткістю, а не чужими людьми. Крім того, як кажуть, на DFA особливо впливають люди, що переживають дані (Tabachnick & Fidel).
Будь-які ідеї, як обійти це? (Моя початкова думка була якимось способом контролю за куртозом, але хіба це не добре, якщо більшість мого зразка дають подібні оцінки?)