Мені було цікаво, чи може хтось дати короткий пробіг щодо визначень та використання p-значень, рівня значущості та помилки типу I.
Я розумію, що р-значення визначаються як "ймовірність отримання тестової статистики принаймні такої ж екстремальної, як та, яку ми насправді спостерігали", тоді як рівень значущості - це лише довільне значення відсічення для вимірювання, чи значення р є значним чи ні . Помилка I типу - це помилка відхиленої нульової гіпотези, яка була правдою. Однак я не впевнений у різниці між рівнем значущості та помилкою типу I, чи вони не є однаковою концепцією?
Наприклад, припустимо дуже простий експеримент, коли я перевертаю монету 1000 разів і рахую кількість разів, коли вона приземляється на "голови". Моя нульова гіпотеза H0 полягає в тому, що голови = 500 (неупереджена монета). Потім я встановлюю рівень значущості на альфа = 0,05.
Я перевертаю монету 1000 разів, а потім обчислюю p-значення, якщо значення p> 0,05, я не можу відкинути нульову гіпотезу, а якщо p-значення <0,05, то я відкидаю нульову гіпотезу.
Тепер, якщо я робив цей експеримент неодноразово, кожен раз обчислюючи значення p і відхиляючи чи не відхиляючи нульову гіпотезу і зберігаючи підрахунок, скільки я відхилив / не зміг відхилити, я б у кінцевому підсумку відкинув 5% нульових гіпотез які насправді були правдивими, чи правильно це? Це визначення помилки I типу. Отже, рівень значущості при тестуванні значущості Фішера - це по суті помилка I типу від тестування гіпотези Неймана-Пірсона, якщо ви проводили повторні експерименти.
Що ж стосується p-значень, якби я отримав p-значення 0,06 з мого останнього експерименту, і я зробив кілька експериментів і підрахував усі ті, що я отримав p-значення від 0 до 0,06, то я б також не мав а 6% шанс відхилити справжню нульову гіпотезу?