Експеримент з виявлення сигналу, як правило, представляє спостерігачеві (або діагностичній системі) сигнал або несигнал, і спостерігача пропонують повідомити, чи вважають вони, що представлений елемент є сигналом чи несигналом. Такі експерименти дають дані, які заповнюють матрицю 2x2:
Теорія виявлення сигналів являє собою такі дані, що представляють сценарій, коли рішення "сигнал / не сигнал" базується на континуумі сигналу, на якому випробування сигналу, як правило, мають більше значення, ніж випробування без сигналу, а спостерігач просто вибирає значення критерію, над яким вони повідомлять про "сигнал":
На наведеній діаграмі зелений та червоний розподіли представляють розподіл "сигнал" та "не сигнал" відповідно, а сіра лінія являє собою обраний критерієм спостерігача. Праворуч від сірої лінії область під зеленою кривою представляє хіти, а область під червоною кривою - помилкові тривоги; зліва від сірої лінії область під зеленою кривою пригнічує відсутність, а ділянка під червоною кривою представляє правильні відхилення.
Як можна уявити, згідно з цією моделлю частка відповідей, що потрапляють у кожну клітинку таблиці 2х2 вище, визначається:
- Відносна частка випробувань, відібраних із зеленого та червоного розподілів (базовий показник)
- Критерій, обраний спостерігачем
- Розмежування між розподілами
- Варіантність кожного розподілу
- Будь-який відхід від рівності дисперсії між розподілами (рівність дисперсії зображена вище)
- Форма кожного розподілу (обидва гауссові вище)
Часто вплив №5 та №6 можна оцінити, лише спонукавши спостерігача приймати рішення на різних рівнях критеріїв, тому ми поки що це ігноруємо. Крім того, №3 та №4 мають сенс лише відносно один одного (наприклад, наскільки велике розділення відносно змінності розподілів?), Узагальнене мірою "дискримінаційності" (також відоме як d '). Таким чином, теорія виявлення сигналів передбачає оцінку двох властивостей з даних виявлення сигналу: критерій та дискримінантність.
Однак я часто помічав, що звіти про дослідження (особливо з галузі медицини) не застосовують рамки виявлення сигналів і замість цього намагаються проаналізувати величини, такі як "Позитивне прогнозне значення", "Негативне прогнозне значення", "Чутливість" та "Специфічність" ", всі вони представляють різні граничні значення з таблиці 2х2 вище ( див. тут для розробки ).
Яку корисність надають ці граничні властивості? Моя схильність полягає в тому, щоб повністю їх знехтувати, оскільки вони заплутують теоретично незалежні впливи критеріїв та дискримінації, але, можливо, мені просто не вистачає уяви, щоб розглянути їх переваги.