Як вирішити парадокс Сімпсона?


35

Парадокс Сімпсона - це класична головоломка, яку обговорюють на вступних курсах статистики по всьому світу. Однак мій курс був задоволений, щоб просто зазначити, що проблема існує і не дає рішення. Мені хотілося б знати, як вирішити парадокс. Тобто, стикаючись з парадоксом Сімпсона, де два різних варіанти, схоже, змагаються за те, що вони є найкращим вибором залежно від того, як розподіляються дані, який вибір слід вибрати?

Щоб зробити проблему конкретною, розглянемо перший приклад, наведений у відповідній статті Вікіпедії . Він заснований на реальному дослідженні про лікування каменів у нирках.

введіть тут опис зображення

Припустимо, я лікар, і тест виявляє, що у пацієнта є камені в нирках. Використовуючи лише інформацію, представлену в таблиці, я хотів би визначити, чи слід приймати лікування А чи лікування Б. Здається, що якщо я знаю розмір каменю, то ми повинні віддавати перевагу лікуванню А. Але якщо ми цього не зробимо, ми повинні віддавати перевагу лікуванню B.

Але розглянемо інший правдоподібний спосіб дійти відповіді. Якщо камінь великий, ми повинні вибрати A, а якщо він малий, ми повинні знову вибрати А. Отже, навіть якщо ми не знаємо розміру каменю, методом випадків ми бачимо, що нам слід віддати перевагу А. Це суперечить нашим попереднім міркуванням.

Отже: Пацієнт заходить у мій кабінет. Тест виявляє, що у них є камені в нирках, але не дає мені інформації про їх розмір. Яке лікування я рекомендую? Чи є прийняте рішення цієї проблеми?

Вікіпедія натякає на резолюцію, використовуючи "причинно-наслідкові байєсівські мережі" та "тестування", але я не маю поняття, що це таке.


2
У Базовому Сімпсоні Paradox посилання згадана вище приклад даних спостережень. Ми не можемо однозначно визначитися між лікарнями, оскільки пацієнтів, ймовірно, не випадково віднесли до лікарень, а поставлене питання не дає нам знати, чи, наприклад, в одній лікарні прагнуть отримати пацієнтів з більшим ризиком. Розбиття результатів в операціях AE не вирішує цього питання.
Еміль Фрідман

@EmilFriedman Я погоджуюсь, що це правда, що ми можемо однозначно приймати рішення між лікарнями. Але, безумовно, дані підтримують одне над іншим. (Неправда, що дані не навчили нас нічого про якість лікарень.)
Картопля

Відповіді:


14

У своєму запитанні ви заявляєте, що не знаєте, що таке "причинно-наслідкові байєсівські мережі" та "тести задньої двері".

Припустимо, у вас є причинно-наслідкова мережа Байесів. Тобто спрямований ациклічний графік, вузли якого представляють пропозиції, а спрямовані краї представляють потенційні причинно-наслідкові зв’язки. У вас може бути багато таких мереж для кожної з ваших гіпотез. Є три способи зробити переконливий аргумент про силу чи існування краю .А?Б

Найпростіший спосіб - втручання. Ось що пропонують інші відповіді, коли кажуть, що «правильна рандомізація» виправить проблему. Ви випадково змусити мати різні значення і виміряти B . Якщо ви можете це зробити, ви закінчили, але ви не завжди можете це зробити. У вашому прикладі може бути неетично давати людям неефективне лікування смертельно небезпечних захворювань, або вони можуть сказати щось у своєму лікуванні, наприклад, вони можуть вибрати менш жорсткі (лікування B), коли їхні камені в нирках невеликі та менш болючі.АБ

Другий спосіб - метод вхідних дверей. Ви хочете , щоб показати , що діє на B через C , тобто A C B . Якщо припустити , що C потенційно викликаний A , але не мають ніяких інших причин, і ви можете виміряти , що C корелюють з A і B корелюють з C , то можна зробити висновок , докази повинні бути протікають через C . Оригінальний приклад: А курить, В - рак, САБСАСБСАСАБССАБС- накопичення дьогтю. Дьоготь може виходити лише від куріння, і він співвідноситься як з курінням, так і з раком. Тому куріння викликає рак через дьоготь (хоча можуть бути й інші причинно-наслідкові шляхи, що пом'якшують цей ефект).

Третій спосіб - метод задніх дверей. Ви хочете , щоб показати , що і B не корелюють з - за «задніх дверей», наприклад , спільна справа, тобто A D B . Так як ви припускали причинний модель, ви просто повинні блокувати всі шляхи (шляхом спостереження змінних і кондиціонування на них) , що докази можуть текти вгору від А і до Б . Трохи складно заблокувати ці шляхи, але Pearl дає чіткий алгоритм, який дозволяє вам знати, які змінні вам потрібно спостерігати, щоб блокувати ці шляхи.АБАDБАБ

Гунг прав, що при гарній рандомізації плутанини не матимуть значення. Оскільки ми припускаємо, що втручання у гіпотетичну причину (лікування) не дозволено, будь-яка загальна причина між гіпотетичною причиною (лікування) та наслідком (виживаність), наприклад, віком або розміром каменю нирок, буде визнанкою. Рішення полягає в правильних вимірах, щоб заблокувати всі задні двері. Для подальшого читання див:

Перлина, Юдея. "Причинно-наслідкові діаграми для емпіричного дослідження". Біометріка 82.4 (1995): 669-688.


ХYZХYХYZYХZХY

Х


2
Дуже приємна відповідь. Не могли б ви коротко сказати, як застосувати цю рамку до прикладу, який я навожу у запитанні? Чи дає це очікувана відповідь (А)?
Картопля

Спасибі! Чи знаєте ви добрий, короткий вступ до "поширення віри"? Мені цікаво дізнатися більше.
Картопля

@Potato: Я дізнався про це з його книги "Імовірнісні міркування в інтелектуальних системах". В Інтернеті є багато навчальних посібників, але важко знайти такий, який будує інтуїцію, а не просто представляє алгоритм.
Ніл G

22

У мене є попередня відповідь, яка тут обговорює парадокс Сімпсона : Базовий парадокс Сімпсона . Це може допомогти вам прочитати це, щоб краще зрозуміти явище.

Коротше кажучи, парадокс Сімпсона виникає через заплутаність. У вашому прикладі поводження бентежить* з видом ниркових каменів у кожного хворого. Ми знаємо з повної таблиці представлених результатів, що лікування А завжди краще. Таким чином, лікар повинен обрати лікування А. Єдиною причиною, коли лікування B виглядає краще в сукупності, є те, що його частіше призначали пацієнтам із менш важким станом, тоді як лікування А проводилось пацієнтам із більш важким станом. Тим не менш, лікування А було краще при обох умовах. Як лікаря, ви не переймаєтесь тим, що в минулому гірше лікування проводилося пацієнтам, які мали менший стан, ви дбаєте лише про пацієнта перед вами, і якщо ви хочете, щоб цей пацієнт покращився, ви забезпечите їх з найкращим доступним лікуванням.

* Зауважте, що суть проведення експериментів і рандомізації лікування - це створення ситуації, коли лікування не збивається з пантелику. Якщо дослідження, про яке йдеться, було експериментом, я б сказав, що в процесі рандомізації не вдалося створити справедливих груп, хоча це, можливо, було спостережливим дослідженням - я не знаю.


Ви вибираєте підхід до нормалізації, який також пропонує інша відповідь. Я вважаю це проблематичним. Можна виставити два розділи одного і того ж набору даних, які дають різні висновки при нормалізації. Дивіться моє посилання та цитую у відповідь на іншу відповідь.
Картопля

2
Я не читав статті Стенфорда. Однак я не вважаю міркування в цитаті переконливими. Цілком можливо, що в деякій популяції лікування B краще, ніж лікування A. Це не має значення. Якщо це стосується деякої кількості населення, то це лише тому, що характеристики населення заплутані. Ви стикаєтесь з пацієнтом (а не з населенням), і цей пацієнт швидше покращиться під час лікування. Не враховуючи, чи є у пацієнта великі або маленькі камені в нирках. Ви повинні вибрати лікування А.
gung - Відновити Моніку

2
Чи розгублений молодий / старий розділ? Якщо ні, це не буде проблемою. Якщо так, то ми б використали повну інформацію, щоб прийняти найкраще рішення. Виходячи з того, що нам відомо на даний момент, «лікування B найкраще виглядає в сукупності» - це червона оселедець. Це трапляється лише через заплутаність, але це (статистична) ілюзія.
gung - Відновіть Моніку

2
У вас буде складніша таблиця, яка враховувала б і розмір каменю нирок, і вік. Ви можете ознайомитись із прикладом справи про ґендерну упередженість Берклі на сторінці Вікіпедії.
gung - Відновіть Моніку

1
Ненавиджувати такі коментарі довго, але ... я б не сказав, що парадокс завжди пов'язаний з непорозумінням. Це пов’язано із співвідношенням між змінними, які матиме змішувальна змінна, але я б не називав усі змінні, що призводять до збентеження парадоксу Сімпсона (наприклад, вага 30-річних та 90-річних років x кількість картопляних чіпсів, спожитих на анум - ... тому що 90 року діти набагато легше почати з основним ефектом чіпів може бути негативними без взаємодії включеннога я б не назвав вік осоромити хоча (див першого рис на Вікіпедії сторінці.)
Джон


4

Ви хочете вирішити один приклад чи парадокс взагалі? Для останнього немає жодного, оскільки парадокс може виникнути з кількох причин і його потрібно оцінювати в кожному конкретному випадку.

Парадокс в першу чергу є проблематичним при повідомленні підсумкових даних і є критичним при навчанні людей, як аналізувати та повідомляти дані. Ми не хочемо, щоб дослідники звітували зведені статистичні дані, які приховують або придушують шаблони даних або аналітики даних, не в змозі визнати, що таке реальна модель у даних. Рішення не було надано, оскільки немає жодного рішення.

У цьому конкретному випадку лікар із таблицею явно завжди вибирає «А» і ігнорує підсумковий рядок. Не має значення, знають вони розмір каменю чи ні. Якщо хтось, що аналізує дані, повідомив лише підсумкові рядки, представлені для A і B, тоді виникне проблема, оскільки отримані лікарем дані не відображають реальності. У цьому випадку вони, ймовірно, повинні були також залишити останній рядок поза таблицею, оскільки це правильно лише під одним тлумаченням того, якою має бути підсумкова статистика (можливі дві). Залишаючи читача інтерпретувати окремі клітини, як правило, дав би правильний результат.

(Здається, ваші багатючі коментарі свідчать, що вас найбільше турбують нерівні N питань, а Сімпсон ширший за це, тому я неохоче зупиняюсь на нерівній проблемі N. Можливо, задайте більш цілеспрямоване питання. Крім того, ви, здається, думаєте, що я Я виступаю за висновок про нормалізацію. Я - ні. Я стверджую, що вам потрібно врахувати, що підсумкова статистика є відносно довільною, і що вибір деяким аналітиком породжував парадокс. Далі я стверджую, що ви дивитесь на клітини, які ви є.)


Ви стверджуєте, що ми повинні ігнорувати підсумковий рядок. Чому це "зрозуміло"?
Картопля

Зрозуміло, тому що лікування А краще з великими або дрібними каменями, а В виходить лише через нерівні N. Крім того, заключний рядок - це тлумачення, а не євангелія. Існує щонайменше два способи обчислити цей рядок. Ви обчислили б це так, лише якщо хочете щось сказати про конкретний зразок.
Іван

Вибачте, я не розумію, чому зведений рядок є невірним звітом. Я думаю, я пропускаю вашу центральну точку. Не могли б ви пояснити?
Картопля

1
Можна нормалізувати і тоді середню, що дає "правильний" результат (А). Але це незаконно. Наступна цитата з відповідної статті Станфордської енциклопедії філософії, доступна тут: plato.stanford.edu/entries/paradox-simpson
Картопля

2
"Звороти Сімпсона показують, що існує чимало способів розподілу популяції, які відповідають асоціаціям у загальній чисельності населення. Розділ за статтю може означати, що і чоловіки, і жінки погіршувались, коли отримували нове лікування, тоді як розділ тієї ж популяції за віком вказувалося, що пацієнтам до п'ятдесяти років, і пацієнтам п'ятдесяти років і старшим стало краще, ніж вони отримали нове лікування. Нормалізація даних про різні способи розподілу одного і того ж населення дасть несумісні висновки про асоціації, що займають загальну кількість населення ".
Картопля

4

Одне важливе «відібрати» полягає в тому, що якщо призначення лікування непропорційне між підгрупами, потрібно враховувати підгрупи під час аналізу даних.

Другим важливим «відривом» є те, що спостережливі дослідження особливо схильні давати неправильні відповіді через невідому присутність парадоксу Сімпсона. Це тому, що ми не можемо виправити той факт, що Лікування А, як правило, призначалося складнішим випадкам, якщо ми не знаємо, що це було.

У правильно рандомізованому дослідженні ми можемо (1) виділити лікування випадковим чином, так що надання «несправедливої ​​переваги» одному лікуванню є малоймовірним і автоматично буде опікуватися при аналізі даних, або (2) якщо є важлива причина Для цього розподіліть методи лікування випадковим чином, але непропорційно на основі відомої проблеми, а потім врахуйте це питання під час аналізу.


+1, однак "автоматично опікуйся", не зовсім правда (принаймні, в безпосередній ситуації, про що ти передусім переймаєшся). Це правда в довгостроковій перспективі, але ви все одно можете мати помилки типу I та II типу через помилку відбору проб (тобто пацієнти, які перебувають у стані 1-го лікування, мали випадкові випадки, що мають більш важкі захворювання).
gung - Відновіть Моніку

Але ефект помилки вибірки буде враховано при аналізі таблиці непередбачених ситуацій та обчисленні та правильній інтерпретації p-значення.
Еміль Фрідман
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.