Відносний розмір p значень при різних розмірах вибірки


13

Як змінюється відносний розмір значення ap для різних розмірів вибірки? Наприклад, якщо ви отримали при для кореляції, а потім при ви отримали те саме значення p 0,20, який би був відносний розмір p значення для другого тесту порівняно з вихідним значенням p коли ?p=0.20n=45n=120n=45


1
Поясніть, будь ласка, сенс, у якому ви змінюєте розміри вибірки. Ви намагаєтесь порівняти значення p для двох незалежних експериментів з різними речами чи, натомість, ви, можливо, розглядаєте можливість збільшення вибірок розміром шляхом збору додаткових незалежних спостережень? 4512045
whuber

На жаль, мені не було дано більше інформації, ніж у запитанні

1
Це для якоїсь теми?
Glen_b -Встановіть Моніку

Відповіді:


19

Подумайте, що кидати монету, яка, як ви підозрюєте, може надто часто підходити до голови.

Ви проводите експеримент з подальшим тестом гіпотез з одною хворобою. За десять кидок ви отримуєте 7 голів. Щось, щонайменше, на відстані 50%, може легко трапитися з справедливою монетою. Нічого незвичайного там немає.

Якщо б замість цього, ви отримали 700 голів на 1000 кидок, результат принаймні настільки далекий від справедливого, як це було б дивовижною для справедливої ​​монети.

Тож 70% голів зовсім не дивно для справедливої ​​монети в першому випадку і дуже дивно для справедливої ​​монети у другому випадку. Різниця - розмір вибірки.

Зі збільшенням кількості вибірки наша невпевненість у тому, де може бути середнє населення (частка голів у нашому прикладі) зменшується. Таким чином, більші вибірки узгоджуються з меншими діапазонами можливих значень популяції - більше значень, як правило, стає "виключеним", оскільки вибірки стають більшими.

Чим більше даних у нас є, тим точніше ми можемо визначити, де може бути середнє значення сукупності ... тому фіксоване значення середнього значення, яке неправильно, виглядатиме менш правдоподібним, оскільки наші розміри вибірки стають великими. Тобто р-значення, як правило, зменшується зі збільшенням розміру вибірки, якщо тільки не відповідає дійсностіH0 .


Дякую :) І як це відповідає тому, щоб отримати однакове p-значення (не менше) з більшим розміром вибірки?

1
У вашому запитанні не вказано, що значення p однакове, воно означає, що ви думали, що це буде те саме. Це нове запитання чи вам просто особливо не зрозуміло, чого ви хотіли? У будь-якому випадку, це може статися - якщо більший зразок просто наблизиться до того, що ви очікуєте під нулем, щоб це зробити так. Уявіть, у вас було 8 голів на 25 кидок (32% голів), але 14 голів у 39 кидок (приблизно 36% голів). Значення р для тесту майже однакове. P(H)=0.5
Glen_b -Встановіть Моніку

1
Ваше відредаговане питання зараз дуже заплутане. Я думав, що розумію, про що ви питаєте, зараз я абсолютно не маю поняття, про що ви говорите. (Мабуть, це виглядало так, що просили, це не те, що просили.)
Glen_b -Встановити Моніку

1
Я не знаю, що передбачається словосполученням "відносна величина р".
Glen_b -Встановіть Моніку

1
Анонімному редактору: 700 голов у 1000 кидках - це набагато більше, ніж потрібно для встановлення сенсу; це вже 12,65 стандартних відхилень від середнього. Воно відповідає p-значенню . Це вже надзвичайний приклад, тому множення всього на 1000 насправді не допомагає покращити цю точку. Навіть 70 із 100 було б більш ніж достатньо. 1.7×1037
Glen_b -Встановіть Моніку

8

Я згоден з @Glen_b, просто хочу пояснити це з іншої точки зору.

Наведемо приклад різниці засобів у двох групах населення. Відхилення рівносильно сказати, що 0 не знаходиться в довірчому інтервалі для різниці засобів. Цей інтервал стає меншим з n (за визначенням), тому стає важче і важче будь-якій точці (у цьому випадку нулю) бути в інтервалі в міру зростання n. Оскільки відхилення за довірчим інтервалом математично еквівалентно відхиленню за р-значенням, р-значення зменшиться з n.H0

Настане той момент, коли ви отримаєте інтервал на зразок який вкаже, що перша популяція справді має більше значення, ніж друга популяція, але ця різниця настільки мала, що ви б не заперечували проти цього. Ви відхилите , але ця відмова не буде означати нічого в реальному житті. Саме тому p-значень недостатньо для опису результату. Завжди потрібно надати певний показник РОЗМІР спостережуваної різниці.[0.0001,0.0010]H0


3

значення для у вигляді , що дане, відмінна від нуля фактично дорівнює нулю в популяції буде зменшуватися зі збільшенням розміру зразка. Це пояснюється тим, що більший зразок, який забезпечує послідовні докази цього ненульового ефекту, надає більше доказів проти нуля, ніж менший зразок. Менший зразок пропонує більше можливостей для випадкової помилки вибірки для оцінювання розміру ефекту зміщення, як показано у відповіді @ Glen_b. Регресія до середнього зменшує помилку вибірки у міру збільшення розміру вибірки; оцінка розміру ефекту, що базується на центральній тенденції вибірки, поліпшується з розміром вибірки за центральною граничною теоремою . Томуpp- тобто, ймовірність отримання більшої кількості зразків одного розміру та розмірів ефектів, щонайменше настільки ж сильних, як у вашого зразка, якщо ви виводите їх випадковим чином з однієї сукупності, припускаючи, що розмір ефекту в цій популяції фактично дорівнює нулю - зменшується як розмір вибірки збільшується, а розмір ефекту вибірки залишається незмінним. Якщо розмір ефекту зменшується або коливання помилок збільшується зі збільшенням розміру вибірки, значущість може залишатися такою ж.

Ось ще один простий приклад: кореляція між і . Тут Pearson's . Якщо я дублюю дані і перевіряю співвідношення і , ще, але . Не потрібно багато копій ( ) для наближення , показаного тут:x={1,2,3,4,5}y={2,1,2,1,3}r=.378,t(3)=.71,p=.53x={1,2,3,4,5,1,2,3,4,5}y={2,1,2,1,3,2,1,2,1,3}r=.378t(3)=1.15,p=.28nlimnp(n)=0


Коли ви посилаєтесь на CLT, я думаю, що ви дійсно маєте на увазі посилання на закон великих чисел. CLT дає нам приблизну нормальність розподілу вибірки - яку ви взагалі не згадуєте.
Дейсон
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.