Статистика.com опублікував проблему тижня: рівень шахрайства з житловим страхуванням становить 10% (один із десяти претензій є шахрайським). Консультант запропонував систему машинного навчання для розгляду претензій та класифікації їх як шахрайства чи без шахрайства. Система на 90% ефективніше виявляє шахрайські претензії, але лише 80% ефективна в правильній класифікації заяв про не шахрайство (помилково вона позначає кожну п’яту як "шахрайство"). Якщо система класифікує претензію як шахрайську, яка ймовірність, що вона справді є шахрайською?
https://www.statistics.com/news/231/192/Conditional-Probability/?showtemplate=true
Ми з однолітком самостійно придумали однакову відповідь, і це не відповідає опублікованому рішенню.
Наше рішення:
(.9 * .1) / ((. 9 * .1) + (. 2 * .9)) = 1/3
Їх рішення:
Це проблема за умовною ймовірністю. (Це також байєсівська проблема, але застосування формули в Правилі Байєса лише допомагає затьмарити те, що відбувається.) Розгляньте 100 претензій. 10 буде шахрайським, і система правильно позначить 9 з них як "шахрайство". 90 претензій буде нормальним, але система неправильно класифікує 72 (80%) як "шахрайство". Таким чином, загалом було позначено 81 заяву як шахрайські, але лише 9 з них, 11%, насправді є шахрайськими.
Хто мав рацію