Я збираюся переконатись у цьому на досвіді випадків дискримінації. Я точно можу встановити, звідки беруться значення "один на 741" тощо . Однак у перекладі було втрачено стільки інформації, що решта моєї реконструкції спирається на те, що я бачив, як люди ведуть статистику в установах судових залів. Я можу лише здогадуватися про деякі деталі.
0.050.01
Експерти статистики для позивачів часто намагаються сформулювати свої результати в цих звичних термінах. Деякі з експертів проводять статистичний тест, в якому нульова гіпотеза виражає "відсутність негативного впливу", припускаючи, що рішення про працевлаштування були чисто випадковими і не підлягали будь-яким іншим характеристикам працівників. (Будь то альтернатива з однохвостим або двохвостим, може залежати від експерта та обставин.) Потім вони перетворюють значення p цього тесту в ряд "стандартних відхилень", відсилаючи його до стандартного нормального розподілу, - навіть коли стандарт Normal не має значення для оригінального тесту. Таким чином, вони сподіваються чітко донести свої висновки до судді.
Вигідний тест даних, які можна узагальнити в таблицях на випадок надзвичайних ситуацій, - це точний тест Фішера. Поява "Точного" в його назві особливо сподобається позивачам, оскільки воно конотує статистичне визначення, яке було зроблено без помилок (що б це не було!).
Ось тоді моя (спекулятивна реконструкція) розрахунків Департаменту праці.
χ2
Вони перетворили його p-значення в нормальний показник Z ("кількість стандартних відхилень").
Вони округлили бал Z до найближчого цілого числа: "перевищує три стандартних відхилення", "перевищує п'ять стандартних відхилень" і "перевищує шість стандартних відхилень". (Оскільки деякі з цих Z-балів обігнули до до більш стандартних відхилень, я не можу виправдати «перевершує», все , що я можу зробити , це процитувати.)
У скарзі ці інтегральні показники Z були перетворені назад у p-значення! Знову використовувався стандартний нормальний розподіл.
Ці p-значення описуються (імовірно, в оману) як "ймовірність того, що цей результат стався випадково".
1/12801/5650001/5800000073011601307301160130−3.16−4.64−5.521/7411/35000001/1000000000
Ось R
код, який використовується для виконання цих обчислень.
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))