Коригування для коваріатів при аналізі кривих ROC


20

Це запитання стосується оцінки бальних результатів у багатовимірному скринінг-анкеті для прогнозування бінарної кінцевої точки за наявності корельованих шкал.

Мене запитали про зацікавленість контролю за супутніми підрезультатами при розробці показників обрізання за кожним виміром шкали вимірювання (особистісних рис), які можуть бути використані для обстеження на алкоголізм. Тобто в цьому конкретному випадку людина не була зацікавлена ​​в налаштуванні на зовнішні коваріати (предиктори) - що призводить до (часткової) області під кривою ROC, регульованої коваріатом, наприклад (1-2) - але, по суті, за іншими показниками з тієї ж анкети, оскільки вони співвідносяться один з одним (наприклад, "імпульсивність" з "пошуком відчуття"). Це означає, щоб створити ГЛМ, який включає в лівій частині показник відсотків (для якого ми прагнемо скорочення) та інший бал, обчислений з тієї ж анкети, тоді як з правого боку результатом може бути статус пиття.

Для уточнення (за запитом @robin) припустимо, що у нас бали, скажімо x j (наприклад, тривога, імпульсивність, невротизм, пошук відчуттів), і ми хочемо знайти відсічне значення t j (тобто "позитивний випадок "якщо x j > t j ," від'ємний випадок "в іншому випадку) для кожного з них. Ми зазвичай підходимо до інших факторів ризику, таких як стать або вік, коли розробляємо таку межу (використовуючи аналіз кривих ROC). Тепер, як щодо коригування імпульсивності (ІМП) для статі, віку та пошуку сенсації (СС), оскільки СС, як відомо, співвідноситься з ІМП? Іншими словами, ми матимемо граничне значення для ІМП, коли усуваються вплив віку, статі та рівня тривожності.j=4xjtjхj>тj

Окрім того, що я сказав, що скорочення має залишатися максимально простим, моя відповідь була

Щодо коваріатів, я б рекомендував оцінювати AUC з і без коригування, просто щоб побачити, чи збільшиться прогнозована ефективність. Тут ваші коваріати - це лише інші підскореї, визначені тим самим вимірювальним приладом, і я ніколи не стикався з такою ситуацією (як правило, я підлаштовуюсь за відомими факторами ризику, такими як вік чи стать). [...] Крім того, оскільки вас цікавлять прогностичні питання (тобто скринінг ефективності анкети), ви також можете бути зацікавлені в оцінці позитивного прогнозного значення (PPV, ймовірність пацієнтів з позитивними результатами тесту, які правильно класифіковані) ви можете класифікувати предмети як "позитивні" або "негативні", залежно від їх підскорень у вашій анкеті. Зауважте, однак,

Чи маєте ви більш ретельне розуміння цієї конкретної ситуації, коли можливо це посилання на відповідні документи?

Список літератури

  1. Джейнс, Н та Пепе, MS (2008). Налаштування коваріатів у дослідженнях діагностичних, скринінг або прогностичних маркерів: стара концепція в нових умовах . Американський журнал епідеміології , 168 (1): 89-97.
  2. Джейнс, Н та Пепе, MS (2008). Розміщення коваріатів в аналізі ROC . Серія робочого документу UW Biostatistics , папір 322.

Я не є експертом, але я знайшов речення "контроль за супутніми підскореннями при розробці обрізаних балів для кожного виміру шкали вимірювання" трохи езотеричним. Чи можете ви дати мені ще одне пояснення (інакше мені було складно зрозуміти питання)?
Робін Жирард

j=4тjхj>тj

Якщо кінцевою метою є передбачити бінарне значення, дане [корельовані] відповіді на запитання опитування, це виглядає дуже схоже на стандартну проблему бінарної класифікації. Чи було б доречно думати про це так? Або дуже важливо придумати "значення обрізання" (про які я нічого не знаю)?
DavidR

@DavidR Ну, ідея полягає у визначенні граничного значення (читай, "підданий ризику вище певного значення"), яке має багато застережень із статистичної точки зору, але більшість лікарів клініки звикли або вважають за краще працювати сюди. (Вибачте, що не помітили ваш коментар раніше!)
chl

Відповіді:


7

Те, як ви передбачили аналіз, насправді не є таким, як я б запропонував вам почати думати про це. Перш за все, легко показати, що якщо потрібно застосовувати обрізи, обрізи застосовуються не за окремими ознаками, а за загальною прогнозованою ймовірністю. Оптимальне відсічення для одного коваріату залежить від усіх рівнів інших коріаріатів; вона не може бути постійною. По-друге, криві ROC не грають ніякої ролі у досягненні мети прийняття оптимальних рішень для окремого суб'єкта.

Для обробки корельованих масштабів існує безліч методів зменшення даних, які можуть допомогти. Один з них - це формальний аналіз надмірності, коли, у свою чергу, кожен прогноктор нелінійно прогнозується від усіх інших прогнозів. Це реалізовано у redunфункції в Hmiscпакеті R. Змінна кластеризація, аналіз основних компонентів та аналіз факторів - це інші можливості. Але, на мій погляд, основна частина аналізу повинна будувати хорошу модель ймовірностей (наприклад, бінарну логістичну модель).


1
+1 за важливу відмінність щодо індивідуального та групового рішення. Я мав би передбачити вашу відповідь, враховуючи вашу відповідь тут чи іншу вашу відповідь у списку розсилки medstats . Я також знайшов вашу розмову про прямі заходи діагностичної корисності на основі моделей діагностичного ризику, особливо прояснюючих у цьому відношенні.
chl

Розмови про прямі заходи діагностичної корисності на основі моделей діагностичного ризику можна знайти тут kc.vanderbilt.edu/quant/Seminar/HarrellPresentMay12.pdf
Epifunky

3

Суть статті Джейнса, Пепе про кривату ROC, регульованої коваріатом, дозволяє більш гнучко тлумачити оцінені значення кривих ROC. Це метод стратифікації кривих ROC серед конкретних груп населення. Орієнтовна справжня позитивна частка (TPF; еквівалентна чутливість) та справжня негативна частка (TNF; еквівалентність еквівалента) інтерпретуються як "ймовірність правильного результату скринінгу з огляду на стан хвороби Y / N серед осіб тієї ж самої [коригувана змінна список] ". З першого погляду, це здається, що ви намагаєтеся вдосконалити діагностичний тест, включивши більше маркерів у панель.

Хорошим підґрунтям для розуміння цих методів було б трохи краще прочитати про модель пропорційної небезпеки Кокса та подивитися книгу Пепе "Статистична оцінка медичних тестів для класифікації та ...". Ви помітите, що вимірювання надійності екранінгу поділяють багато подібних властивостей з кривою виживання, вважаючи придатний показник як час виживання. Так само, як модель Кокса дозволяє стратифікувати криву виживання, вони пропонують дати стратифіковані заходи надійності.

Причина, яка нам важлива, може бути виправданою в контексті моделі бінарних змішаних ефектів: припустимо, вам цікаво передбачити ризик стати мет-наркоманом. SES має настільки очевидний домінуючий вплив на це, що здається нерозумним оцінювати діагностичний тест, який може ґрунтуватися на особистому поведінці, не маючи якихось стратифікацій. Це тому, що [просто з цим], навіть якщо багата людина проявила маніакальні та депресивні симптоми, вони, ймовірно, ніколи не спробують мет. Однак у бідної людини виявиться набагато більший ризик виникнення таких психологічних симптомів (і більш високий показник ризику). Грубий аналіз ризику показав би дуже низьку ефективність вашої прогнозної моделі, оскільки однакові відмінності у двох групах були недостовірними. Однак якщо ви стратифіковані (багаті проти бідних),

Суть коріаріатного пристосування полягає в розгляді різних груп однорідними через меншу поширеність та взаємодію в моделі ризику між окремими верствами.


(+1) Це цікава відповідь, дуже дякую. Моє головне занепокоєння під час написання цього повідомлення полягало в тому, що значення обрізання будуть дещо «взаємозалежними». Але я перевірю книгу Пепе ( тим часом знайшов тут кілька роздаткових матеріалів ).
chl

Існують проблеми з використанням одних і тих же даних для розробки та оцінки медичного тесту, але виправити це легко. Вам слід розглянути якусь перехресну перевірку або поділити дані на підмножини "навчання" та "перевірку". Зазвичай це правильний підхід до розробки моделі діагностики / прогнозування / прогнозування ризику.
АдамО
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.