Оскільки в даному випадку точність є правильно класифікованою часткою зразків, ми можемо застосувати тест гіпотези щодо системи з двох пропорцій.
Нехай р 1 і р 2 бути точність , отримані з класифікаторів 1 і 2 відповідно, а п буде число вибірок. Кількість зразків, правильно класифікованих у класифікаторах 1 та 2, є х 1 та х 2 відповідно.p^1p^2nx1x2
p^1=x1/n,p^2=x2/n
Статистика тесту наводиться за допомогою
Z=p^1−p^22p^(1−p^)/n−−−−−−−−−−√ де p^=(x1+x2)/2n
Наш намір полягає в тому, щоб довести, що глобальна точність класифікатора 2, тобто , краща, ніж у класифікатора 1, який є p 1 . Це обрамляє нашу гіпотезу якp2p1
- H0:p1=p2 (нульова гіпотеза вказує, що обидва рівні)
- Ha:p1<p2 (альтернативна гіпотеза, що стверджує, що новіша краща за існуючу)
Область відхилення задається
Z<−zα(якщо вірно відхилити і прийняти H a )H0Ha
де отримується від звичайного нормального розподілу, що відноситься до рівня значущості, α . Наприклад, z 0,5 = 1,645 для 5% рівня значущості. Це означає, що якщо відношення Z < - 1.645 вірно, то з 95% рівнем довіри ( 1 - α ) можна сказати, що класифікатор 2 є більш точним, ніж класифікатор 1.zααz0.5=1.645Z<−1.6451−α
Список літератури:
- Р. Джонсон та Дж. Фрейнд, Вірогідність Міллера та Фрейнда та статистика для інженерів, 8-е вид. Prentice Hall International, 2011. (Первинне джерело)
- Тест гіпотези-стислої резюме формули . (Прийнято з [1])