Змінна показника для двійкових даних: {-1,1} проти {0,1}


10

Я зацікавлений в лікувально-коваріат взаємодій в контексті експериментів / рандомізованих контрольованих досліджень, з бінарним призначення лікування індикатора .T

Залежно від конкретного методу / джерела, я бачив і і для оброблених та необроблених суб'єктів відповідно.T={1,0}T={1,1}

Чи є якесь правило, коли використовувати або ?{1,0}{1,1}

Чим інтерпретація відрізняється?


FWIW ... Цей перший посилання забезпечує досить вичерпний огляд різних схем кодування ... ats.ucla.edu/stat/r/library/contrast_coding.htm У цьому другому посиланні обговорюється індикаторне (фіктивне), ефект та ортогональне (контрастне) кодування ... факультет.cas.usf.edu/mbrannick/regression/anova1.html
Майк Хантер

Відповіді:


10

Інтерпретація як оцінювача змінної індикатора, так і перехоплення відрізняється. Почнемо з :{1,0}

Скажімо, у вас є така модель

yi=β0+treatmentβ1

де

treatment={0if placebo1if drug

У такому випадку ви отримуєте такі формули для :yi

yi={β0+0β1=β0if placeboβ0+1β1=β0+β1if drug

Отже, інтерпретація є ефектом плацебо, а інтерпретація - це різниця між ефектом плацебо та дією препарату. Насправді ви можете інтерпретувати як поліпшення, яке пропонує препарат.β0β1β1


Тепер давайте розглянемо :{1,1}

Потім у вас є знову така модель (знову):

yi=β0+treatmentβ1

але де

treatment={1if placebo1if drug

У такому випадку ви отримуєте такі формули для :yi

yi={β0+1β1=β0β1if placeboβ0+1β1=β0+β1if drug

Інтерпретація тут полягає в тому, що є середнім ефектом плацебо та ефектом препарату, а - різниця двох методів лікування до цього значення.β0β1


Отже, який ви використовуєте?

Інтерпретація в в основному є базовою лінією. Ви встановлюєте стандартне лікування, а всі інші методи лікування (їх може бути декілька) порівнюються з цим стандартним / базовим рівнем. Особливо, коли ви починаєте додавати в інші коріаріати, це залишається легко інтерпретувати стосовно стандартного медичного питання: як ці препарати порівнюють із плацебо чи встановленим препаратом?β0{0,1}

Але врешті-решт це все питання інтерпретації, яку я пояснив вище. Тож слід оцінити свої гіпотези і перевірити, яке тлумачення робить висновки найбільш простими.


6
Константа при використанні кодування -1, 1 є середнім, якщо кількість респондентів у лікуваній групі така ж, як кількість респондентів у контрольній групі.
Маартен Буїс

@MaartenBuis Це середнє значення iff, коли дизайн врівноважений, але в іншому випадку він все ще є середнім значенням двох засобів, що я мав на увазі. Я змінив формулювання, щоб відобразити це. y
JAD

9
Корисні. Я завжди намагаюся заохочувати використовувати слово індикатор, а не манекен (як в оригінальному питанні!) Принаймні з двох причин. По-перше, я почув занадто багато історій, в яких презентації пройшли дуже погано, оскільки такі терміни, як "гендерна манекен", були дико неправильно сприйняті як зневажливі або образливі менш технічні люди. По-друге, термін " манекен" робить весь пристрій дещо схожим на видум або ухилення, тоді як це ідеально чистий і елегантний метод. Я не маю особливих шансів змінити закріплені практики в деяких сферах, але ось намагаюся.
Нік Кокс

Домовились, звучить і професійніше. Плюс це кращий опис того, що він насправді робить.
JAD

2
Радий, що ви згодні. Ось простий спосіб пояснити: його називають індикатором, тому що він вказує!
Нік Кокс

6

У контексті лінійної регресії є більш природним (і стандартним) методом кодування бінарних змінних (будь то розміщення їх у лівій частині правої частини регресії). Як пояснює @Jarko Dubbeldam, ви, звичайно, можете використовувати іншу інтерпретацію, і значення коефіцієнтів буде різним.xi{0,1}

Щоб навести приклад іншим способом, кодування вихідних змінних є стандартним при програмуванні або виведенні математики, що лежить в основі підтримуючих векторних машин . (Викликаючи бібліотеки, ви хочете передати дані у форматі, який очікує бібліотека. Це, мабуть, формула 0, 1.)yi{1,1}

Спробуйте використовувати позначення, які є стандартними для того, що ви робите / використовуєте.


Для будь-якого виду лінійної моделі з терміном перехоплення два методи будуть рівнозначними в тому сенсі, що вони пов'язані простим лінійним перетворенням. Математично не має значення, чи використовуєте ви матрицю даних чи матрицю даних де - повний ранг. У узагальнених лінійних моделях ваші розрахункові коефіцієнти в будь-якому випадку будуть пов'язані лінійним перетворенням а встановлені значення будуть однаковими.XX~=XAAAy^


+1, я не міг придумати налаштування, у якому використовувався . {1,1}
JAD

AdaBoost - ще один приклад, який використовуєyi{1,1}
Френсіс

5
Загалом, можна сказати, що використовується переважно в класифікації, оскільки це робить застосування знакової функції можливим способом класифікації. {1,1}
JAD

@matthewgunn Автор говорить про коваріати, тобто входи, а не виходи. {-1, 1} має сенс для векторів підтримки виводу, але це не має значення для введення. Дивіться тут: en.wikipedia.org/wiki/Support_vector_machine#Linear_SVM
Франциско Арсео

@FranciscoArceo Point прийнято; Я відредагував, щоб бути більш точним.
Меттью Ганн

2

Це більш абстрактно (і, можливо, марно), але зазначу, що ці два уявлення в математичному сенсі насправді є груповими уявленнями, і між ними існує ізоморфізм.

Значення індикаторної змінної , в основі булевого значення, є "фактор істинний" або "фактор помилковий". Враховуючи дві події та , ви можете запитати "чи фактори цих двох подій рівноцінні, наприклад, чи вони обидві істинні, або обидві помилкові?" У логічній логіці це . Це визначає групову структуру . Тепер і обидва утворюють подання цієї групи, при цьому операції групи і відповідно. Ізоморфізм від першого представлення до другого задаєтьсяTT1T2T1T2Z21,01,1ab=1(a+b)ab=abϕ(a)=2a1.

Це подання також поширюється на постійні змінні індикатора, тобто ймовірності. Якщо - вірогідність що є правдою, то ймовірність є істинною . Під ізоморфізмом це . Кількість - це підписаний показник від -1 до 1. Отже, обчислення ймовірностей булевих операцій на цій основі часто набагато простіші.T T T p p = p p + ( 1 - p ) ( 1 - p ) t ( p ) = 2 p - 1 t t = t t tpTTTpp=pp+(1p)(1p)t(p)=2p1tt=ttt


Це вражаюче, але я вважаю достатнім зауважити, що будь-яке дійсне відповідність між {-1, 1} та {0, 1} повинно бути одне до одного: не потрібно посилатися ні на що, крім математики середньої школи. Ми обов'язково говоримо про одну і ту ж інформацію, просто кодуємо по-різному.
Нік Кокс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.