Випадкове завдання: навіщо турбуватися?


9

Випадкове призначення є цінним, оскільки забезпечує незалежність лікування від потенційних результатів. Ось як це призводить до неупереджених оцінок середнього ефекту від лікування. Але інші схеми призначення можуть також систематично забезпечувати незалежність лікування від потенційних результатів. То чому нам потрібне випадкове призначення? По-іншому, у чому полягає перевага випадкового присвоєння перед не випадковими схемами присвоєння, які також призводять до неупередженого висновку?

Дозволяє Zбути вектором лікувальних призначень, у яких кожен елемент дорівнює 0 (одиниця, не призначена лікуванню), або 1 (одиниця, призначена лікуванню). У статті JASA Angrist, Imbens та Rubin (1996, 446-47) кажуть, що лікування призначенеZi є випадковим, якщо Pr(Z=c)=Pr(Z=c)для всіх c і c таких, що ιTc=ιTc , де ι - вектор стовпця з усіма елементами, рівними 1 .

Словом, твердження полягає в тому, що призначення Zi є випадковим, якщо будь-який вектор призначень, що включає m призначення для лікування, такий же ймовірний, як і будь-який інший вектор, що включає m призначення для лікування.

Але, щоб забезпечити незалежність потенційних результатів від призначення лікування, достатньо забезпечити, щоб кожна одиниця дослідження мала однакову ймовірність призначення на лікування. І це може статися легко, навіть якщо більшість векторів призначення лікування мають нульову ймовірність бути обраними. Тобто, це може відбуватися навіть при невипадковому призначенні.

Ось приклад. Ми хочемо провести експеримент з чотирма одиницями, в яких обробляються рівно дві. Існує шість можливих векторів призначення:

  1. 1100
  2. 1010
  3. 1001
  4. 0110
  5. 0101
  6. 0011

де перша цифра в кожному номері вказує, чи була оброблена перша одиниця, друга цифра вказує, чи була оброблена друга одиниця тощо.

Припустимо, ми проводимо експеримент, в якому виключаємо можливість призначення векторів 3 і 4, але в якому кожен з інших векторів має рівні (25%) шанси бути вибраними. Ця схема не є випадковим призначенням у значенні AIR. Але в очікуванні це призводить до неупередженої оцінки середнього ефекту від лікування. І це не випадково. Будь-яка схема присвоєння, яка дає суб'єктам рівну ймовірність призначення на лікування, дозволить об'єктивно оцінити ATE.

Отже: навіщо нам потрібне випадкове призначення у значенні AIR? Мій аргумент входить у висновок про рандомізацію; якщо натомість думати з точки зору висновку на основі моделі, чи здається, що визначення AIR є більш виправданим?


3
Я не читав Angrist та ін., Тож, можливо, мені щось не вистачає, але у мене є прислів я з вашою фразою. Ми не використовуємо випадкове призначення, щоб гарантувати, що лікування не залежить від потенційних результатів. Незалежно від того, чи буде лікування незалежним від результатів у справжньому експерименті, залежить, чи існує прямий причинно-наслідковий зв'язок між методом лікування та результатом. Швидше, випадкове призначення гарантує, що обробка не залежить від прихованих змінних (або потенційних плутанин). Ми сподіваємось виключити, що результат був спричинений чимось іншим, ніж лікування, яке може бути виключено.
gung - Відновіть Моніку

1
@gung, я думаю, що ви плутаєте "потенційні результати" та "результати". Це правда, що випадкове призначення не забезпечує незалежність лікування від результатів (тобто від спостережуваних результатів). Але потенційні результати не такі, як спостережувані результати, і випадкове призначення дійсно забезпечує незалежність лікування від потенційних результатів. Я не редагуватиму оригінальну публікацію, щоб розширити цю проблему; це може зайняти мене занадто далеко від головної теми. Але en.wikipedia.org/wiki/Rubin_causal_model може бути корисним у цьому питанні.
user697473

3
"[T] o, щоб забезпечити незалежність потенційних результатів від призначення лікування, достатньо забезпечити, щоб кожна одиниця в дослідженні мала однакову ймовірність призначення на лікування." Це неправильно. Припустимо, ви записали чоловіків та жінок у дослідження. Переверніть справедливу монету: якщо голови, призначте всіх жінок до групи лікування (а всіх чоловіків - до контрольної групи); якщо хвости, всі самці будуть в групі лікування, а всі жінки контрольної групи. Кожен суб'єкт (очевидно) має 50% шансів віднести до групи лікування, але лікування повністю змінено з гендерною ознакою. xx
whuber

1
@whuber, ваш коментар не здається правильним. Щоб зрозуміти, чому, припустимо, = 1. Потенційні результати чоловіка Y (1) = 1 і Y (0) = 0. (Тобто, = 1, якщо чоловік лікується, 0, якщо ні.) Для жінки, потенційні результати - Y (1) = -1 і Y (0) = 2. (Конкретні потенційні результати не мають великого значення, але малі цілі числа спрощують все.) Тоді E [Y (1) | Z] = E [Y (1)] = 0. Подібні рівності справедливі для E [Y (0)]. Більш загально, ваш механізм присвоєння не плутається з гендерною ознакою, і він дасть об'єктивну оцінку ATE. Якщо я щось розумію, будь ласка, повідомте мене про це. xYm
користувач697473

3
Звичайно, оцінка "неупереджена" в тому ж сенсі, що зупинений годинник дає неупереджену оцінку часу! Насправді, це гірше, ніж це: цей метод випадкового відбору дає результати, які не можна віднести до лікування, оскільки їх так само можна віднести до статі. Ось що означає заплутаність. Зосередження уваги на отриманні неупереджених результатів при знищенні всієї корисної інформації в експерименті
поспішне

Відповіді:


8

Про це йде коментар Гунга. Загальний середній ефект лікування не в цьому суть.

Припустимо, у вас є нових випадків діабету, коли суб'єкт знаходиться у віці від до років та нових хворих на діабет старше . Ви хочете призначити половину на лікування. Чому б не перекинути монету, а на головах лікувати всіх молодих пацієнтів, а на хвостах лікувати всіх старших пацієнтів? Кожен мав би100051510003050%шанс бути обраним для лікування, тому це не змістить середній результат лікування, але викине багато інформації. Це не буде несподіванкою, якби виявилося, що неповнолітні діабети чи молодші пацієнти реагують набагато краще або гірше, ніж пацієнти старшого віку, які страждають на діабет типу II або гестаційний. Спостережуваний ефект лікування може бути неупередженим, але, наприклад, він матиме набагато більші стандартні відхилення, ніж це відбувається при випадковому призначенні, і, незважаючи на великий вибірки, ви не зможете багато сказати. Якщо ви використовуєте випадкове призначення, то з великою часткою ймовірності близько випадків у кожній віковій групі отримають лікування, тож ви зможете порівняти лікування без лікування у межах кожної вікової групи. 500

Можливо, ви зможете зробити краще, ніж використовувати випадкове призначення. Якщо ви помітили фактор, який, на вашу думку, може вплинути на реакцію на лікування, можливо, ви хочете переконатися, що суб'єкти з цим атрибутом розбиті більш рівномірно, ніж це трапляється шляхом випадкового призначення. Випадкове призначення дозволяє вам добре працювати з усіма чинниками одночасно, так що ви зможете згодом проаналізувати багато можливих шаблонів.


Дякую, Дуглас. Ця відповідь для мене має сенс. Для запису я не мав на увазі нічого екстремального, як ваш приклад або приклад @ whuber вище. Я думав замість випадків, коли ми усуваємо з розгляду лише кілька векторів лікування. (Розглянемо випадок, коли клієнт каже: "Ви можете поводитися з цією людиною чи з тією, але не з обома".
user697473

Я думаю, якщо ви усунете лише кілька векторів, то ви не зміните кількість інформації, яку ви можете витягти набагато. Точне кількісне визначення цього може бути безладним - існують наївні межі, які, мабуть, занадто песимістичні.
Дуглас Заре

@DouglasZare У мене є питання щодо вашого крайнього прикладу. Я вважаю, що мета полягає у тому, щоб виявити, чи ефективне лікування для населення, яке має як молодих, так і старих пацієнтів. Тоді ваш метод генерує два зразки, які не можна вважати репрезентативною вибіркою з розподілу потенційних результатів де всі люди приймають лікування та розподілу потенційного результату де всі люди беруть під контроль. Тож ваш спостережуваний ефект від лікування є упередженимFtFc
KevinKim

1

У вашому прикладі ви можете також залишити 2 і 5 і не суперечити собі. На рівні предмета все ще існує однаковий шанс бути 1 або 0, коли шанси вибрати 1 або 6. шанси 1: 1. Але тепер те, що ви зробили, видаливши 3 і 4, стає більш очевидним.


Спасибі, Джон. Так, ви праві. Здається, що ми можемо усунути стільки векторів призначення лікування, скільки нам подобається, в будь-якому поєднанні, якщо ми використовуємо решта векторів таким чином, що кожній одиниці надається однакова ймовірність призначення лікування.
user697473

Я не думаю, що ти отримуєш те, що я говорю. Я представив - це абсурдна справа для вашого аргументу, який аргументує це.
Джон

Ваш приклад є крайнім, але я не бачу в цьому нічого абсурдного. Це справедлива демонстрація моменту: не випадкові схеми призначення (як, наприклад, використання лише векторів 1 і 6) можуть призвести безпосередньо до неупередженої оцінки середнього ефекту від лікування. Звідси випливає, що нам не потрібно випадкове призначення, щоб отримати неупереджені оцінки ATE. Звичайно, все ж можуть бути причини, чому погано усунути вектори від 2 до 5. (Див. Коментар Дугласа Заре вище .) Я ще не роздумував над цими причинами.
user697473

Ти повинен. Тому ви не можете їх усунути.
Джон

1

Ось ще одна зі схованих чи заплутаних змінних: час (або інструментальний дрейф, ефекти зберігання зразків тощо).
Тому є аргументи проти рандомізації (як каже Дуглас: ви можете зробити краще, ніж рандомізація). Наприклад, ви можете заздалегідь знати, що ви хочете, щоб ваші справи з часом були збалансовані. Так само, як ви можете заздалегідь знати, що ви хочете, щоб стать і вік були збалансовані.

Іншими словами, якщо ви хочете вручну вибрати одну із своїх 6 схем, я б сказав, що 1100 (або 0011) - це вирішально поганий вибір. Зауважте, що перші можливості, які ви викинули, - це найбільш збалансовані за часом ... І найгірші два залишаються після того, як Джон запропонував визначити також 2 та 5 (проти яких ви не протестували).
Іншими словами, ваша інтуїція, які схеми є "приємними", на жаль, призводить до поганого експериментального дизайну (IMHO це досить часто; можливо, впорядковані речі виглядають приємніше - і напевно простіше відслідковувати логічні послідовності під час експерименту).

Можливо, вам вдасться зробити краще з не рандомізованими схемами, але ви також можете зробити набагато гірше. ІМХО, ви повинні мати можливість наводити фізичні / хімічні / біологічні / медичні / ... аргументи для конкретної не випадкової схеми, яку ви використовуєте, якщо ви переходите до не випадкової схеми.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.