Що не так з (деякою) псевдо-рандомізацією


23

Я натрапив на дослідження, в якому пацієнти, яким було понад 50 років, були псевдовипадковими у рік народження. Якщо рік народження був парним числом, звичайний догляд, якщо непарне число, втручання.

Це легше здійснити, важче підривати (легко перевірити, яке лікування мав би отримати пацієнт), легко запам’ятати (завдання тривало кілька років). Але все-таки мені це не подобається, я відчуваю, що правильна рандомізація була б кращою. Але я не можу пояснити, чому.

Я помиляюся, що відчуваю це, чи є вагома причина віддати перевагу «реальній» рандомізації?


1
Ласкаво просимо на сайт! Радий побачити вашу публікацію тут.
Andy W

За відповідями вище, мені краще "рандомізувати" ДЕНЬ народження! Незвичайний день для лікування, навіть день для контролю ... Адальберто
AADF

6
@Adalberto Це не вистачає основного моменту, що полягає в тому, що будь-яка визначена, не рандомізована процедура віднесення суб'єктів до груп не може бути впевнена у бажаних властивостях, які має рандомізована процедура. Припустимо, ви витрачаєте роки на таке дослідження лише після того, щоб рецензент зазначив несподівану, але сильну прихильність між лікуванням та паритетом дня народження? Оскільки ми не можемо передбачити всі подібні заплутаності, ми вирішуємо проблему шляхом випадкового призначення.
whuber

Відповіді:


28

Ви маєте рацію скептично. Взагалі слід використовувати «реальну» рандомізацію, оскільки зазвичай не має всіх знань про відповідні фактори (непомітні). Якщо одна з таких спостережень співвідноситься з віком, який є непарним чи парним, то це також корелює з тим, чи отримували вони лікування чи ні. Якщо це так, ми не можемо визначити ефект лікування: наслідки, які ми спостерігаємо, можуть бути наслідком лікування або через неспостережуваний фактор (и).

Це не проблема з реальною рандомізацією, де ми не очікуємо ніякої залежності між лікуванням та спостереженнями (хоча, звичайно, для невеликих проб це може бути).

Щоб побудувати історію, чому ця процедура рандомізації може бути проблемою, припустимо, що дослідження включало лише суб'єктів, які були у віці 17/18 років, коли, скажімо, почалася війна у В'єтнамі. З 17 років не було шансу бути складеним (виправте мене, якщо я помиляюся на цьому), тоді як такий шанс був у 18. Якщо припустити, що шанс був незначним, і що досвід війни змінює людей, то це означає, що через роки ці дві групи є різними, навіть якщо вони просто один рік один від одного. Тож, можливо, лікування (наркотик) виглядає так, що воно не працює, але оскільки тільки група з ветеранами В'єтнаму отримала його, це може бути насправді пов'язано з тим, що він не працює на людей з ПТСР (або інших факторів, пов'язаних з будучи ветераном). Іншими словами, вам потрібно, щоб обидві групи (лікування та контроль) були ідентичними, крім лікування, для виявлення ефекту від лікування.

Тож, якщо ви не зможете виключити, що між групами не спостерігається непомічених відмінностей (але як це зробити, якщо цього не спостерігається?), Бажана реальна рандомізація.


Спасибі. Гарний приклад. (Я забув назвати це псевдо-рандомізацією, я це відредагував у питанні).
Джеремі Майлз

2
(+1) Коли я читав питання, В'єтнам був першим прикладом, який відразу ж припав до тями. Було дивно бачити, що ти взяв саме таку саму справу. Я вважаю, що це найбільш очевидний вибір з огляду на заявлений вік досліджуваних, хоча віки на початку-середини 60-х років трохи ближче.
кардинал

Вибачення за тематичний пінг: Meta пропонує пропозицію зробити [рандомізований експеримент] синонімом тегу [випадковий розподіл] ( stats.meta.stackexchange.com/a/4651 ). У вас є достатня репутація в цьому тезі, щоб проголосувати за цю пропозицію тут: stats.stackexchange.com/tags/random-allocation/synonyms - тепер для цього потрібно 4 оновлення. Якщо ви не погоджуєтесь з пропозицією, подумайте, коментуючи Meta, щоб пояснити, чому. Цей коментар незабаром видалю. Ура.
амеба каже, що поверніть Моніку

18

Це хороша вправа, щоб час від часу підтримувати суперечливі погляди, тож дозвольте почати, запропонувавши кілька причин на користь цієї форми псевдо рандомізації. Вони, головним чином, в тому, що він мало відрізняється від будь-якої іншої форми систематичного відбору проб, наприклад, отримання зразків середовищ навколишнього середовища в точках сітки в полі або відбору проб для кожного іншого дерева в саду, і тому ця вибірка може мати порівнянні переваги .

Аналогія тут досконала: вік був "зведений" за роком, починаючи з нуля, і віднесення до груп, що чергувались по цій (одновимірній) сітці. Деякі переваги такого підходу полягають у гарантуванні широкого, рівномірного розповсюдження зразка по полю чи в саду (або віці, в даному випадку), що дозволяє вирівняти впливи, пов'язані з місцем розташування (або часом). Це може бути особливо корисним, коли теорія припускає, що місцеположення є переважаючим фактором варіації відповіді. Більше того, за винятком справді крихітних зразків, аналізуючи дані так, нібивони були простою випадковою вибіркою вводять порівняно мало помилок. Крім того, можлива деяка рандомізація: у полі ми можемо випадковим чином вибрати джерело та орієнтацію сітки. У цьому випадку ми можемо принаймні рандомізувати, чи є парні роки контролю або суб'єктів лікування.

Ще одна перевага сітчастого відбору проб - виявлення локалізованих змін. На місцях це були б "кишені" незвичайних відповідей. Статистично ми можемо розглядати їх як прояви просторової кореляції. У сучасній ситуації, якщо є певний шанс, що порівняно вузький віковий діапазон відчує незвичні реакції, тоді сітчастий дизайн є прекрасним вибором, оскільки суто рандомізований дизайн випадково може містити великі прогалини у віках однієї з груп. (Але кращою конструкцією може бути стратифікація: використовуйте співвідношення віку для формування двох аналітичних прошарків, а потім, незалежно в межах кожного прошарку, рандомізувати пацієнтів у групи контролю та лікування.)

9бути пов'язаними з факторами, важливими для експерименту. Це викликає стурбованість у питанні менше, ніж гіпотетичне: воно реально. На цьому етапі попередні відповіді в цій темі можуть представити додаткові думки, які я хотів би зробити, тому я зупинюсь і запрошу вас їх перечитати.


(+1) Зокрема, для встановленого контраргументу.
кардинал

13

Я погоджуюся, що приклад, який ви даєте, є досить нешкідливим, але ...

Якщо залучені агенти (або особа, яка здійснює втручання, або люди, які отримують втручання) дізнаються про схему призначення, вони можуть скористатися нею. Такий самовибір повинен бути досить очевидним, чому це проблематично у більшості експериментальних конструкцій.

Один із приклад, який мені відомо в кримінології, йде так: Експеримент мав на меті перевірити стримувальну дію ночі у в'язниці після побутової суперечки проти просто прохання винуватця залишити на ніч. Офіцерам видали буклет аркушів, а колір поточного аркуша зверху мав на меті визначити, до якого поводження з винуватцем. у конкретному інциденті передбачалося отримати.

Закінчилося те, що офіцери навмисно не послухалися дизайну дослідження та обрали аркуш, виходячи з особистих уподобань щодо того, що слід зробити винуватцю. Це не є крайнім, щоб підозрювати подібні підробки років, принаймні, можливо у вашому прикладі.


Хороший приклад, спасибі, але частина міркувань полягала в тому, що роздуття було набагато складніше - вони не могли стверджувати, що аркуш (скажімо) жовтий, тому що я можу зайти і перевірити дату народження та побачити, чи правильно вони призначені.
Джеремі Майлз

3
Я згоден @JeremyMiles, це просто ще одна причина, хоча для подвійних сліпих рандомізованих досліджень. Це просто аргументований аргумент проти псевдовипадкової рандомізації - що легше обійти призначене лікування, ніж фактична рандомізація. (Мій приклад насправді не є прикладом псевдо-рандомізації, але він коротко ілюструє точку.)
Енді W

Ну, це залежить від того, як була зроблена (справжня) рандомізація - люди, які брали участь у дослідженні, робили це частково, щоб уникнути проблем із підривом. Якщо ви використовуєте фактичну рандомізацію, вам потрібно добре вести облік, щоб переконатися, що особа, яка визначає рандомізацію, спілкується з особою, яка здійснює лікування, а особа, яка доставляє, робить правильно. З вашого прикладу, якби вони використовували номер будинку (скажімо), офіцерам, можливо, було б важче підривати час, хоча це було не випадково.
Джеремі Майлз

1
Вибачення за тематичний пінг: Meta пропонує пропозицію зробити [рандомізований експеримент] синонімом тегу [випадковий розподіл] ( stats.meta.stackexchange.com/a/4651 ). У вас є достатня репутація в цьому тезі, щоб проголосувати за цю пропозицію тут: stats.stackexchange.com/tags/random-allocation/synonyms - для цього зараз потрібно 4 оновлення. Якщо ви не погоджуєтесь з пропозицією, подумайте, коментуючи Meta, щоб пояснити, чому. Цей коментар незабаром видалю. Ура.
Амеба каже, що поверніть Моніку

0

Повна рандомізація, заснована на випадковому розподілі, не передбачувана, у вашому випадку відомо, чи буде призначено випадок втручання чи контролю до підтвердження відповідності.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.