Я збираюся пояснити це кількома різними способами, тому що це допомогло мені зрозуміти це.
Візьмемо конкретний приклад. Ви робите тест на хворобу на групі людей. Тепер визначимося з деякими термінами. Я маю на увазі кожне з наступних дій:
Справжній позитивний (ТП) : Має захворювання, визначене як захворювання
Хибнопозитивний (FP) : не має захворювання, ідентифікованого як захворювання
Справжній негативний (TN) : не має захворювання, ідентифікованого як таке, що не має захворювання
Хибнонегативний (FN) : Має захворювання, визначене як таке, що не має захворювання
Візуально це, як правило, показано за допомогою матриці плутанини :
Помилкових спрацьовувань (FPR) є число людей, які не мають цього захворювання , але визначені як такі, що захворювання (всі Fps), поділене на загальне число людей, які не мають цього захворювання (включає в себе всі FPs і ТНС) .
ЖПR = FПЖП+ ТN
Показник помилкового виявлення (FDR) - це кількість людей, які не мають захворювання, але ідентифіковані як такі, що мають захворювання (усі ПП), поділене на загальну кількість людей, які ідентифіковані як такі, що мають захворювання (включає всі FP та TP ).
ЖD R = FПЖП+ ТП
Отже, різниця в знаменнику, тобто з чим ви порівнюєте кількість помилкових позитивних результатів?
FPR говорить вам частку всіх людей , які не мають захворювання , які будуть визначені як такі, що захворювання.
FDR говорить вам частину всіх людей , ідентифікованих як такі, що захворювання , які не мають це захворювання.
Тому обидва корисні, чіткі заходи відмови. Залежно від ситуації та пропорцій ТП, ФП, ТН і ФН, ви можете піклуватися про одне про інше.
Давайте тепер поставимо до цього кілька цифр. Ви відміряли 100 людей на хворобу, і ви отримали наступне:
Справжні позитиви (ТП) : 12
Помилкові позитиви (FP) : 4
Справжні негативи (ТН) : 76
Хибні негативи (FN) : 8
Щоб показати це за допомогою матриці плутанини:
Потім,
ЖПR = FПЖП+ ТN= 44 + 76= 480= 0,05 = 5 %
ЖD R = FПЖП+ ТП= 44 + 12= 416= 0,25 = 25 %
Іншими словами,
FPR повідомляє, що 5% людей, які не мали захворювання, були ідентифіковані як хворі. FDR повідомляє, що у 25% людей, яких було визначено як захворювання, насправді не було цього захворювання.
EDIT на основі коментаря @ amoeba (також цифри у прикладі вище):
н
[Побічна примітка: Вікіпедія вказує, що хоча FPR математично еквівалентний коефіцієнту помилок типу I, він вважається концептуально відмінним, оскільки один зазвичай встановлюється апріорі, а інший зазвичай використовується для вимірювання ефективності тесту після цього. Це важливо, але я не буду це обговорювати тут].
І для трохи більшої повноти:
Очевидно, що FPR і FDR - не єдині відповідні показники, які можна обчислити за допомогою чотирьох величин у матриці плутанини. З багатьох можливих показників, які можуть бути корисними в різних контекстах , два відносно поширених, з якими ви, швидше за все, зіткнетеся, є:
Справжній позитивний показник (TPR) , також відомий як чутливість , - це частка людей, які мають захворювання, ідентифікованих як захворювання.
ТПR = TПТП+ FN
Справжній негативний показник (ТНР) , також відомий як специфічність , - це частка людей, які не мають захворювання, ідентифікованих як такі, що не мають захворювання.
ТNR = TNТN+ FП