З огляду на справжню позитивну, хибну негативну ставку, чи можете ви обчислити хибну позитивну, справжню негативну?


Відповіді:


53

У цій галузі існує досить багато термінологічної плутанини. Особисто мені завжди корисно повернутися до матриці плутанини, щоб подумати над цим. У тесті на класифікацію / скринінг ви можете мати чотири різні ситуації:

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

У цій таблиці "справжній позитивний", "хибний негативний", "хибнопозитивний" та "справжній негативний" - це події (або їх вірогідність). Тому у вас є, мабуть, справжня позитивна ставка та хибна негативна ставка . Розрізнення має значення, оскільки воно підкреслює, що обидва числа мають чисельник і знаменник.

Де дещо стає заплутаним, це те, що ви можете знайти декілька визначень "помилково позитивна ставка" та "помилкова негативна ставка" з різними знаменниками.

Наприклад, Wikipedia надає такі визначення (вони здаються досить стандартними):

  • Справжня позитивна швидкість (або чутливість):ТПR=ТП/(TP+FN)
  • Помилковий показник:ЖПR=ЖП/(ЖП+ТN)
  • Справжня від’ємна норма (або специфічність):ТNR=ТN/(ЖП+ТN)

У всіх випадках знаменником є стовпчик усього. Це також дає підказку для їх інтерпретації: Справжня позитивна швидкість - це ймовірність того, що тест говорить "A", коли реальна величина дійсно є A (тобто це умовна ймовірність, обумовлена ​​A є істинною). Це не говорить про те, наскільки вірогідними ви є правильні виклики "A" (тобто ймовірність того, що справжній позитивний результат буде обумовлений результатом тесту "A").

Якщо припустити, що помилкова негативна ставка визначена так само, ми маємо (зауважте, що ваші цифри відповідають цьому). Однак ми не можемо безпосередньо вивести помилково позитивну оцінку ні від справжньої позитивної, ні від помилкової негативної ставки, оскільки вони не дають інформації про специфіку, тобто про те, як поводиться тест, коли «не А» є правильною відповіддю. Відповідь на ваше запитання буде таким: "ні, це неможливо", оскільки у вас немає інформації в правому стовпчику матриці плутанини.ЖNR=1-ТПR

Однак в літературі є інші визначення. Наприклад, Fleiss ( Статистичні методи для ставок і пропорцій ) пропонує наступне:

  • "[...] помилково позитивний показник [...] - це частка людей, серед тих, хто реагує на позитивні, які насправді вільні від захворювання."
  • "Помилково негативний показник [...] - це частка людей серед тих, хто відгукнувся на тест, у яких все-таки є захворювання."

(Він також визнає попередні визначення, але вважає їх "марнотратством дорогоцінної термінології" саме тому, що вони мають прямий зв'язок з чутливістю та специфічністю.)

ЖПR=ЖП/(ТП+ЖП)ЖNR=ЖN/(ТN+ЖN)

Флісс не використовує або не визначає фрази "справжня негативна швидкість" або "справжня позитивна норма", але якщо ми припустимо, що це також є умовними ймовірностями, що даються для конкретного результату / класифікації тесту, то відповідь @ guill11aume є правильною.

У будь-якому випадку вам потрібно бути обережними з визначеннями, оскільки немає жодних незаперечних відповідей на ваше запитання.


4
Дуже добре (+1). Я одразу перейшов на одне тлумачення, але ви абсолютно праві, що альтернативне визначення є стандартним.
gui11aume

1
@ gui11aume. Спасибі! Це було моє почуття, але, думаючи про це, я вже не такий впевнений. Переглядаючи посилання, це може залежати від галузі (машинне навчання проти медичного тестування).
Гала

Мій досвід полягає в тому, що останнє визначення, TPR = TP / (TP + FP), FPR = FP / (TP + FP), є більш стандартним.
подорожні

1
Ось публікація про відмінності: link.springer.com/article/10.1007/s10899-006-9025-5#enumeration Зверніть увагу на нову термінологію "Тест FPR" проти "Прогнозний FPR"
подорожні

8

EDIT: див. Відповідь Гаеля Лорана, яка є більш точною.

Якщо ваш справжній позитивний показник становить 0,25, це означає, що кожен раз, коли ви називаєте позитивну, ви маєте ймовірність 0,75 помилитися. Це ваша хибнопозитивна ставка. Так само щоразу, коли ви називаєте негатив, у вас є ймовірність 0,25 права, що є вашою справжньою негативною ставкою.


Залежить від того, що намагається охарактеризувати: тест у постановці на те, щоб заздалегідь знати правду, або намагатися визначитися з імовірністю після тесту, щойно враховує результати.
kd4ttc

3

Ні, якщо це має сенс, якщо "позитивний" і "негативний" не мають сенсу для проблеми. Я бачу багато проблем, де "позитивні" та "негативні" - це довільний вимушений вибір на порядковій чи безперервній змінній. FP, TP, sens, spec корисні лише для явищ, які не мають нічого.


Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.