Інші відповіді хороші, але я подумав, що ще одна відповідь з незначним фокусом може бути гарним доповненням.
Чи впливає розмір вибірки зазвичай на помилково позитивний показник?
Судячи з коментарів, я вважаю, що питання запропоновано цією статтею , яка включає пару помилок (або принаймні неправильних слів).
По-перше (і що найбільше турбує загалом), воно невірно визначає значення p, але, більш доречно, воно включає речення "Якщо ви вимірюєте велику кількість речей щодо невеликої кількості людей, ви майже гарантовано отримаєте" статистично значимий "результат . "
Значення р - це ймовірність, якщо припустити, що нульова гіпотеза є істинною, спостерігати результат як мінімум такий же крайній, як і той, що насправді спостерігався. Як зазначено в інших відповідях, це означає, що він повинен бути рівномірно розподілений між 0 і 1 незалежно від розміру вибірки, базових розподілів тощо.
Таким чином, речення повинне було зазначати: "Якщо виміряти велику кількість речей щодо невеликої кількості людей , ви майже гарантовано отримаєте" статистично значимий "результат".
Як правильно підраховано у статті, навіть якщо шоколад точно нічого не робить, було 60% шансу (припускаючи незалежність тощо) отримати значний результат.
Насправді вони отримали три значні результати, що досить дивно (p = 0,06 при - ймовірно нереалістичному - припущенні незалежності).
Чи впливає розмір вибірки ніколи на помилково-позитивний показник?
Насправді іноді це відбувається, хоча це дійсно має значення лише в тому випадку, якщо розмір вибірки дійсно невеликий.
Я сказав, що (припускаючи, що нульова гіпотеза правдива) р-значення повинно бути розподілено рівномірно. Але рівномірний розподіл є безперервним, тоді як велика кількість даних є дискретними лише з кінцевим числом можливих результатів.
Якщо я кидаю монету кілька разів, щоб перевірити, чи вона упереджена, є лише кілька можливих результатів, а отже, і кілька можливих p-значень, тому розподіл потенційних p-значень є дуже поганим наближенням до рівномірного розподілу. Якщо я переверну його досить кілька разів, то, можливо, неможливо отримати суттєвий результат.
Ось приклад випадку, коли це насправді сталося.
Тож у вас вийде щось на кшталт "Якщо ви вимірюєте певні типи речей щодо достатньо малої кількості людей, ви ніколи не отримаєте" статистично значимого "результату, незалежно від того, скільки речей ви намагаєтеся".
Це означає, що ви не повинні турбуватися про розмір вибірки, якщо результат позитивний?
Ні. Деякі позитивні результати є помилковими, а деякі - справжніми. Як обговорювалося вище, зазвичай можна з упевненістю припустити, що показник помилково-позитивного значення є фіксованим (як правило, 5%). Але менший розмір вибірки завжди робить справжні позитивні результати менш імовірними (те, що менший розмір вибірки означає, що тест має меншу потужність ). І якщо у вас однакова кількість помилкових позитивів, але менше справжніх позитивних результатів, випадково обраний позитивний результат швидше буде помилковим.