Які існують різні типи кодування для категоричних змінних (в R) і коли ви їх використовуєте?


14

Якщо вам підходить лінійна модель або змішана модель, існують різні типи кодувань, які дозволяють перетворити категоричну або номінальну змінну в ряд змінних, для яких оцінюються параметри, такі як манекенне умовлення (за замовчуванням R) та кодування ефектів.

Я чув, що кодування ефектів (іноді їх називають відхиленням або контрастним кодуванням) є кращим, коли у вас взаємодія, але які можливі контрасти і коли ви використовуєте, який тип контрасту?

Контекст є змішаним моделюванням в R lme4, але я вважаю, що більш широкі відповіді чудові. Вибачте, якщо я пропустив подібне запитання.

EDIT: Дві корисні посилання: пояснення ефектів та манекенне кодування пояснено.


якщо у вас є сучасна прикладна статистика з S-Plus, у цьому розділі є чудовий розділ у шостому розділі з цього питання
richiemorrisroe

4
Я не думаю , що ви знайдете повну відповідь на ваше запитання, але є багато корисної інформації про різні типи кодувань тут .
gung - Відновіть Моніку

@gung Сайт виглядає дійсно цікаво. Однак, схоже, воно не охоплює контрастне кодування (чи існує інша назва для нього).
Генрік

Я не впевнений; Цікаво, чи є непогане спілкування. Назва цієї сторінки - "контрастне кодування".
gung - Відновіть Моніку

1
Я не зовсім розумію, яке питання залишається. Якщо ви хотіли список різних типів кодувань, у вас це є. Яка головна мета вашого питання зараз?
gung - Відновіть Моніку

Відповіді:


4

Інші можуть просвітити мене, якщо я помиляюся, але ось іде ...

Який ефект для рівня порівняно із середнім показником попередніх рівнів? тобто вам цікаво знайти поріг ефекту

  • Використовуйте контрасти Гельмерта. Я вважаю це сукупним порівнянням. Я використовував це, коли зацікавлений у визначенні межі дози та відповіді препарату. Порівняння кількох рівнів одночасно означає, що менше інформації викидається. Я вважаю це сукупним порівнянням.

Який вплив рівня відносно базового рівня? тобто вас цікавить одна група порівняння базової лінії.

  • Використовуйте фіктивну змінну кодування (контрасти лікування). Я думаю, що це є базовим порівнянням. Я використовував це, коли зазвичай існує одна група / рівень, встановлена ​​як важлива в інших дослідженнях, і моє дослідження демонструє, що асоціації існують і при перевищенні цього порогу.

Яка дія двох сусідніх рівнів змінної?

  • Використовуйте диференціацію вперед / назад. Я вважаю це порівняно послідовними порівняннями короткого інтервалу. Я використав це для порівняння ефектів для різних рівнів соціально-економічної позиції, коли кожна група композиційно відрізняється за власним правом і не представляє більше інтересу, ніж будь-яка інша.
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.