Інтерпретація теореми Байєса, застосована до позитивних результатів мамографії


11

Я намагаюся обернути голову навколо результату теореми Байєса, застосованого до прикладу класичної мамографії, при цьому поворот мамографії є ​​ідеальним.

Це є,

Захворюваність на рак:.01

Ймовірність позитивної мамографії, якщо пацієнт має рак:1

Ймовірність позитивної мамографії, якщо пацієнт не має раку:.01

Байєс:

P (рак | мамограма +) =1.01(1.01)+(.091.99)

=.5025

Отже, якщо випадкова людина з населення приймає мамографію і отримує позитивний результат, чи є 50% шансів захворіти на рак? Мені не вдається інтуїтивно зрозуміти, як крихітний 1% шанс помилкового позитиву у 1% населення може спричинити 50% результат. Логічно, я думаю, що справді справжня позитивна мамографія з крихітною помилковою позитивною швидкістю була б набагато точнішою.


2
Помилково позитивна ставка не на 1%, а на 99% населення. Ось чому ви отримуєте ймовірність, яка може здатися низькою, через дуже високу попередню ймовірність того, що хтось здоровий. Також майте на увазі, що це лише один тест, що трапиться, якщо ви будете здавати тест не один раз? Тоді точність тесту починає мати значення більше.
dsaxton

Якщо це ідеальна мамограма, то помилково позитивна норма буде дорівнювати нулю, і тоді p (C | M) = 1 * 0,01 / (1 * 0,01 + 0 * 0,99) = 1,0, оскільки наближається помилково позитивна швидкість мамографії досконалості (0), тоді другий член на дні наближається до нуля. "Крихітна" помилково позитивна ставка поєднується з аналогічно крихітною базовою ставкою, щоб отримати протизаконний результат.
Дейв X

Я вважаю, що моя логіка, формально-дедуктивна, є чудовою річчю, але породжує надзвичайно погані інтуїції щодо імовірнісного висновку. Тут інструменти bmj.com/content/343/bmj.d6386 можуть допомогти вашій інтуїції.
кон'югатприор

На моє розуміння, питання задається інтуїцією про те, як умовна ймовірність може бути такою низькою, враховуючи припущення; не про фактичну статистику мамографії в реальному житті (на що, схоже, відповіді).
Juho Kokkala

Я знаю, в знаменнику є помилка друку (2-й член повинен бути (.01 * 0,99)? Хоча результат є правильним. Насправді не інтуїція, але спрощення у вас P (C | +) = P (C) / (P (C) + (P (+ |! C) P (! C)) і P (C) дуже низький, тому P (C | +) надзвичайно чутливий до P (+ |! C), тобто вам знадобиться P ( + |! C) << P (C), щоб P (C | +) підійшов до 1
Девід Уотерворт

Відповіді:


11

Я відповім на це питання і з медичної, і з статистичної точки зору. Він привернув багато уваги у складі лай-преси, особливо після бестселера «Сигнал і шум » Нейт Сілвер, а також ряду статей у публікаціях, таких як The New York Times, що пояснюють цю концепцію. Тож я дуже радий, що @ user2666425 відкрив цю тему на резюме.

Спочатку дозвольте мені уточнити, що не є точним. Я можу вам сказати, що ця цифра була б мрією. На жаль, існує багато помилково негативних мамографів, особливо у жінок з щільною тканиною молочної залози. Орієнтовна цифра може становити або вище , залежно від того, чи можна зводити всі різні види раку молочної залози в один (інвазивний v DCIS) та інші фактори. З цієї причини застосовуються й інші способи, засновані на сонографічній або МРТ-технології. Різниця між і є критичною в скринінговому тесті.p(+|C)=120%0.81

Теорема Байєса говорить нам, що , і останнім часом привертає багато уваги, як це стосується на мамографію у молодших жінок з низьким рівнем ризику . Я усвідомлюю, що це не саме те, про що ви питаєте, про що я звертаюсь у заключних параграфах, але це найбільш обговорювана тема. Ось смак питань:p(C|+)=p(+|C)p(+)p(C)

  1. До (або ймовірність наявності раку , заснований на поширеності) в більш молодих пацієнтів, скажімо , від 40 - 50 років , досить мало. За даними NCI, він може округлити його до (див. Таблицю нижче). Ця відносно низька ймовірність перед тестом сама по собі знижує умовну ймовірність виникнення раку після тесту, враховуючи, що мамограма була позитивною, незалежно від ймовірності та зібраних даних.1.5%

  2. Ймовірність помилкового позитиву стає дуже важливим питанням процедури скринінгу, яка застосовуватиметься до тисяч і тисяч апріорних здорових жінок. Отже, хоча помилково позитивна ставка у (що набагато вище, якщо зосередитись на сукупному ризику ) може здатися не так поганою, це насправді питання колосальних психологічних та економічних витрат, особливо зважаючи на низький рівень ймовірність тесту у молодших пацієнтів з низьким рівнем ризику. Ваша цифра значно поза межею - реальність така, що "ляки" надзвичайно поширені через багато факторів, включаючи медико-юридичні проблеми.710%1%

Отже, перерахунок і дуже важливо, для молодих жінок без факторів ризику :

p(C|+)=p(+|C)p(+)p(C)=

=p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)p(C)=0.80.80.015+0.070.9850.015=0.148 .

Ймовірність захворіти на рак, коли скринінг-мамограма була прочитана як позитивна, може бути лише у молодих жінок з низьким ризиком. На відміну від мамографічних показань подається непряма оцінка впевненості в діагнозі, який має рентгенолог (його називають BI-RADS), і цей баєсовський аналіз кардинально зміниться, коли ми переходимо від BI-RADS 3 до BI-RADS 5 - усі вони "позитивні" тести в широкому сенсі.15%

Цю цифру логічно можна змінити залежно від того, які оцінки ви враховуєте у своєму розрахунку, але правда полягає в тому, що останнім часом4045 рекомендації щодо початкового віку для вступу в програму скринінгової мамографії були зміщені з до .

У літніх жінок поширеність (а отже, ймовірність перед тестом) лінійно зростає з віком. Згідно з поточним звітом, ризик того, що жінці буде діагностовано рак молочної залози протягом наступних 10 років , починаючи з наступного віку, такий:

Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)

Це призводить до накопичувального ризику протягом життя приблизно :10%

Розрахунок серед жінок похилого віку з поширеністю склав би:4%

p(C|+)=0.80.80.04+0.070.960.04=0.3232% нижче, ніж ви обчислили.

Я не можу переосмислити, скільки «лякань» є навіть у старших верств населення. Як скринінгова процедура, мамографія є просто першим кроком, тому має сенс позитивну мамографію інтерпретувати в основному, оскільки існує можливість, що у пацієнта є рак молочної залози, що вимагає подальшої роботи з ультразвуком, додатковим (діагностичним) мамографічним тестуванням, наступні мамограми, МРТ або біопсія. Якщо був дуже високим, ми б не мали справу з скринінговим тестом, це був би діагностичний тест , наприклад біопсія.p(C|+)

Конкретна відповідь на ваше запитання:

Це є «лякає», то з , а не , як і в OP, в поєднанні з відносно низькою поширеністю захворювань (низька ймовірність попереднього тестування або високого ), особливо у молодих жінок, що пояснює цю нижчу ймовірність після тесту у віках. p(+|C¯)710%1%p(C¯)Зауважте, що цей "помилковий показник тривоги" множиться на значно більшу частку випадків без онкологічних захворювань (порівняно з хворими на рак) у знаменнику, а не на "крихітний 1% шанс помилкового позитиву у 1% населення". згадка. Я вважаю, що це відповідь на ваше запитання. Підкреслимо, хоча це було б неприйнятно в діагностичному тесті, все ж варто проводити процедуру скринінгу.

Проблема інтуїції: @Juho Kokkala порушив питання, яке ОП запитувало про інтуїцію . Я думав, що це має на увазі підрахунки та заключні параграфи, але досить справедливо ... Ось так я б пояснив це другові ... Давайте зробимо вигляд, що йдемо на полювання на фрагменти метеора з металошукачем у Вінслоу, штат Арізона. Саме тут:

Зображення від meteorcrater.com

... і металошукач вимикається. Ну, якби ви сказали, що шанси на те, що саме з монети скинувся турист, ви, мабуть, матимете рацію. Але ви отримаєте суть: якби місце не було настільки ретельно відстежено, було б набагато більше ймовірності, що звуковий сигнал від детектора на такому місці вийшов з фрагмента метеору, ніж якби ми були на вулицях Нью-Йорку.

Те, що ми робимо з мамографією, - це здорове населення, яке шукає мовчазної хвороби, яка, якщо її не спіймають рано, може бути смертельною. На щастя, поширеність (хоча і дуже висока порівняно з іншими менш виліковними раками) є достатньо низькою, що ймовірність випадкового виникнення раку невисока, навіть якщо результати "позитивні" , особливо у молодих жінок.

З іншого боку, якби не було помилкових позитивних результатів, тобто ( ,p(C¯|+)=0

100%p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)p(C)=p(+|C)p(+|C)p(C)p(C)=1 , на скільки вірогідність ударивши метеорний фрагмент, якщо наш металошукач вийшов, був би на незалежним від площі, яку ми досліджували, якби замість звичайного металошукача ми використовували ідеально точний прилад для виявлення амінокислот космосу в метеорі фрагмент (складений приклад). Ще ймовірніше буде знайти фрагмент у пустелі Арізони, ніж у Нью-Йорку, але якби детектор почув звуковий сигнал, ми б знали, що знайшли метеор.100%

Оскільки у нас ніколи немає абсолютно точного вимірювального приладу чи системи, дріб буде , і чим вона недосконаліша, тим менша частка , або попередня , яка буде "передана" LHS рівняння як задня . Якщо ми зупинимось на конкретному типі детектора, то ймовірність дробу буде діяти постійною в лінійному рівнянні форми , де <1р(С)задньої=α*дозадньої<доlikelihoodunconditional p(+)=p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)<1p(C)posterior=αpriorposterior<prior, і чим менше попереднє, тим лінійно менше буде заднє. Це називається залежністю від поширеності в позитивній прогностичної цінності (PPV) : ймовірність того, що суб'єкти з позитивним скринінг - тест дійсно є хвороба.


5

Ключовою проблемою мамографії, яка не була належно вирішена в дискурсі, є неправильне визначення поняття "позитивне". Це описано в розділі Діагностика в http://biostat.mc.vanderbilt.edu/ClinStat - див. Посилання на біостатистику в біомедичних дослідженнях там.

Однією з найбільш широко використовуваних діагностичних систем кодування в мамографії є ​​оцінка BI-RADS, а оцінка 4 - частий "позитивний" результат. Визначення категорії 4 - "Не характерно для раку молочної залози, але обґрунтована ймовірність злоякісного характеру (від 3 до 94%); слід враховувати біопсію". З діапазоном ризику, який коливається в межах від 0,03 до 0,94 для однієї категорії , тобто неймовірна неоднорідність того, що насправді означає "позитив", не дивно, що у нас безлад.

Це також ознака неясного мислення, що система BI-RADS не має категорії для тих, хто має оціночний ризик 0,945.

Як так красномовно стверджує Нейт Сілвер у "Сигналі та шумі" , якби ми думали ймовірно, ми б приймали кращі рішення навколо. Видалення таких термінів, як "позитивний" та "негативний" для медичних тестів, призведе до усунення помилкових позитивних результатів та помилкових негативів та оптимальної передачі невизначеності (та обґрунтування для більшої кількості тестів до постановки діагнозу).


Ми писали в практичній синхронізації - перегляньте мої коментарі нижче про BI-RADS. Я не могла погодитися більше (тонни особистого досвіду щодо цього як рентгенолога).
Антоні Пареллада

3

Про це є приємне обговорення у книзі « Розраховані ризики»

Значна частина книги стосується пошуку більш чітких способів розмови та роздумів щодо ймовірності та ризику. Приклад:

Ймовірність того, що у жінки віком 40 років є рак молочної залози, становить близько 1 відсотка. Якщо у неї рак молочної залози, ймовірність того, що вона здасть позитивний результат на скринінг-мамографію, становить приблизно 90 відсотків. Якщо у неї немає раку молочної залози, ймовірність того, що вона все-таки випробує позитив, становить 9 відсотків. Які шанси на те, що жінка, яка тестує позитив, насправді має рак молочної залози?

Саме так у книзі представлено рішення, використовуючи «природні частоти». Поміркуйте, 10 000 жінок, 1% мають рак, тобто 100 жінок. З них 90% повернуть позитивні тести (тобто 90 жінок з раком перевірять позитивні). З 9900 без раку 9% повернуть позитивний тест або 891 жінка. Так є 891 + 90 = 981 жінка з позитивними тестами, з яких у 90 є рак. Тож шанс, що у жінки з позитивним тестом є рак, це 90/981 = 0,092

Якщо 100% жінки з раком тест позитивний, це просто змінить цифри на 100 / (100 + 891) = 0,1

Природно-частотний підхід до розуміння помилкових позитивних результатів


1

Можливо, ця лінія мислення правильна ?:

Для будь-якої випадкової людини існує 1% шансів на те, що у них рак, і тому є шанс, що мамограма випадкової людини буде позитивною. Якщо у них немає раку, є 1% шанс, що мамографія буде позитивною..011

Тож це інтуїтивно близько до монетного перевороту для випадкової людини. Я не знаю, як пояснити додаткові на користь раку, отримавши позитивну мамографію.0.0025


1

Ось надто спрощений, але інтуїтивно зрозумілий спосіб. Розгляньте 100 людей. У одного є рак і буде тестувати позитивно. З 99, хто цього не зробив, один з них отримає хибнопозитивний тест. Отже, з двох позитивних результатів, у одного буде рак, а в одного - немає.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.