"Намір слідчого" та порогові значення / р-значення


21

Я читаю слайди Джона Крушке "Аналіз даних байєсівських даних" , але насправді виникає питання щодо його інтерпретації t-тестів та / або всієї системи тестування значущості гіпотез. Він стверджує, що значення p не визначено, оскільки вони залежать від намірів слідчого.

Зокрема, він наводить приклад (сторінки 3-6) двох лабораторій, які збирають однакові набори даних, порівнюючи два способи лікування. Один лабораторій зобов’язується збирати дані від 12 суб'єктів (6 за умову), а інший збирає дані за фіксовану тривалість, що також дає 12 суб'єктів. Відповідно до слайдів, критичне значення для відрізняється між цими двома схемами збору даних: для першої, але для останньої. !tp<0.05tcrit=2.33tcrit=2.45

Повідомлення в блозі - якого я зараз не можу знайти - припускає, що сценарій з фіксованою тривалістю має більшу ступінь свободи, оскільки вони могли збирати дані від 11, 13 або будь-якої іншої кількості предметів, а сценарій з фіксованим N - визначення, має .N=12

Чи не могли б мені хтось пояснити:

  • Чому критичне значення буде відрізнятися між цими умовами?

  • (Якщо припустити, що це питання) Як би ви могли виправити / порівняти ефекти різних критеріїв зупинки?

Я знаю, що встановлення критеріїв зупинки на основі значущості (наприклад, вибірка до ) може збільшити шанси помилки типу I, але це, схоже, не відбувається тут, оскільки жодне правило зупинки не залежить від результату аналіз.p<0.05

Відповіді:


11

Ось ще додаткова інформація: http://doingbayesiandataanalysis.blogspot.com/2012/07/sampling-distributions-of-t-when.html

Більш повна дискусія надана тут: http://www.indiana.edu/~kruschke/BEST/ Ця стаття розглядає значення p для зупинки на порозі N, зупинки на пороговій тривалості та зупинки на пороговому значенні t.


Оце Так! Прямо з вуст коня, як би ... Це, безумовно, цікава ідея, яка мені не прийшла в голову. Дякуємо за додаткову інформацію.
Метт Крауз

Я хотів би додати, що це досить довго обговорюється в книзі доктора Крушке (в главі 11).
Метт Крауз

13

Нарешті я простежив папір, пов’язаний зі слайдами: Kruschke (2010) , також доступний безпосередньо від автора (через CiteSeerX) тут , оскільки журнал не розповсюджується широко. Пояснення трохи прозаїчне, але я все ще не впевнений, що купую.

У випадку фіксованого N критичне значення значення обчислюється наступним чином: зразки беруть випадковим чином із (тієї ж) сукупності та обчислюють -значення. Цей процес повторюється багато разів для створення нульового розподілу. Нарешті, повинен бути 95-м перцентилем цього розподілу.2 N t t c r i tt2Nttcrit

У випадку фіксованої тривалості він припускає, що суб'єкти отримують середню швидкість . Нульовий розподіл будується повторенням двох етапів. На першому кроці кількість об'єктів для кожної умови і виводиться з розподілу можливостей з параметром . Далі, та випадкові розіграші з сукупності використовуються для обчислення -значення. Це повторюється багато разів, і встановлюється як 95-й перцентиль цього розподілу.N 1 N 2 λ N 1 N 2 t t c r i tλN1N2λN1N2ttcrit

Це здається мені трохи зухвалим ... Як я розумію, немає жодного розподілу; натомість це сімейство розподілів, форма яких частково визначається параметром градусу свободи. Для фіксованого умови існує суб'єктів на групу, а відповідне t- значення для непарного t-тесту - це те, що має 2 N - 2 ступеня свободи, імовірно, те, що відтворює його моделювання. N NtNNt2N2

В іншій умові, схоже , розподіл у формі " " насправді є комбінацією зразків з багатьох різних t -розподілів, залежно від конкретних креслень. Встановивши λ = N , можна було б отримати середній ступінь свободи рівним 2 N - N , але цього недостатньо. Наприклад, середнє значення t -розподілів для ν = 1 і ν = 5 не здається t -розподілом з 3 ступенями свободи.ttλ=N2NNtν=1ν=5t

Підсумовуючи:

  • tcrit
  • t
  • Я не переконаний, що це насправді проблема, але з радістю прочитаю / підняв / прийму відповіді, якщо хтось думає інакше.

Чому ви здатні відповісти на власне запитання та дати йому галочку? Не здається, що ви повинні бути в змозі дати собі репрезентацію!
Майкл Р. Черник

5
Немає нічого поганого, щоб відповісти на його власне запитання , Майкл.
chl

@MichaelChernick, я вважаю, що ви не отримаєте жодної представниці, якщо приймете власну відповідь. У той час це здавалося правильним робити, оскільки я більш-менш відстежував відповідь протягом двох тижнів, але я перейшов до своєї відповіді на відповідь Джона К. Крушке, оскільки він явно влада слайди :-)
Метт Крауз

Цікава подяка. Але я не бачу, чому слід перевірити власну відповідь у будь-який час, навіть якщо це здається правильним та найкращим. Ми встановили, що перевірка власної відповіді не дає вам балів реп.
Майкл Р. Черник

3
Оскільки маркування відповіді як прийнятої не має іншої мети, ніж вказати правильне рішення (для майбутніх відвідувачів), особливо там, де не запропоновано жодного іншого, я не бачу з цим проблеми. Особисто я давно підтримав цю відповідь, бо ціную, що ОП дає нам можливість отримати власні дослідження. І мені дуже шкода, що я не зміг дати додатковий голос за простий факт слідування за цією темою та оновлення його рішення. PS "Ми встановили ..." посилається на Чому можна надати собі бали репутації? .
chl
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.