Чи правомірними є висновки розподілу вибірки?


15

Деякі байєзці нападають на часті виводи, заявляючи, що "не існує унікального розподілу вибірки", оскільки це залежить від намірів дослідника (Kruschke, Aguinis, & Joo, 2012, p. 733).

Наприклад, скажімо, дослідник розпочинає збір даних, але його фінансування було несподівано скорочено після 40 учасників. Як би тут було визначено вибіркові розподіли (та наступні CI та p-значення)? Ми просто припустимо, що кожен складовий зразок має N = 40? Або він складатиметься з зразків з різним N, кожен розмір визначається іншим випадковим часом, коли його фінансування може бути скорочене?

Розподіл нулів в підручниках t, F, chi-квадрат (тощо) припускає, що N є фіксованим і постійним для всіх складових зразків, але це може бути неправдою. З кожною різною процедурою зупинки (наприклад, через певний проміжок часу або поки мій асистент не втомлюється), схоже, відбувається різний розподіл вибірки, і використання цих «випробуваних і правдивих» розподілів з фіксованим N є недоцільним.

Наскільки шкідливою є ця критика щодо легітимності частолістських ІС та p-цінностей? Чи є теоретичні спростування? Здається, що, атакуючи концепцію розподілу вибірки, вся споруда частого виведення є незначною.

Будь-які наукові посилання високо оцінені.


1
Цитування наведено для: Kruschke, JK, Aguinis, H., & Joo, H. (2012). Прийшов час: Байєсові методи аналізу даних в організаційних науках. Але Крушке використовував це раніше: (2010) Баєсівський аналіз даних та (2010) Що повірити: Баєсові методи аналізу даних.
ATJ

Відповіді:


21

н

н

хнх¯кмк=0мк0L(0)L(х¯)е-к2/2кКадане (1996), " Обґрунтування простроченого висновку", JASA , 91 , 435

Вказівка ​​на залежність частотистських висновків від намірів дослідника - це корисне копання людей (якщо таких все ще є), які стають на свого високого коня про "суб'єктивність" байєсівського умовиводу. Особисто я можу з цим жити; виконання процедури протягом тривалої серії повторень завжди буде чимось більш-менш усвідомленим, що не погіршує її корисністю для розгляду ("калібрування ймовірності" - це те, як Кокс описав p-значення ). З дат посилань ви могли помітити, що ці питання не дуже нові; спроби їх вирішити за допомогою апріорної аргументації значною мірою стихли (крім Інтернету, завжди за часом, крім тривіальних питань) &

PS: Думаючи додати противагу Berger & Wolpert, я трапився на Cox & Mayo (2010), "Об'єктивність і обумовленість частотних висновків" у помилках і умовиводах . В моєму твердженні, цілком ймовірно, є елемент бажаного мислення, що дебати затихли, але вражає, як мало нового можна сказати з цього приводу через півстоліття. (Все-таки це стислий та красномовний захист частолістських ідей.)


1
+1 (давно). Мені цікаво, чи можна аргументацію Армітажу адаптувати до відомого прикладу вибірки біноміального та негативно-біноміального; наприклад, дотримуючись TTTTTH послідовності викидання монети, виходить p = 0,03 або p = 0,1, залежно від правила зупинки. Таким чином, якщо ми тепер розглянемо ще одну гальмівних правила, наприклад , «Keep метання до біноміального р <0,05 і не було , по крайней мере один Н і принаймні один Т», то вона стає досить інтуїтивна , що потрібно , а НЕ ігнорувати це гальмівне правила виведення (незважаючи на порушення принципу ймовірності). Це має сенс?
Амеба каже, що поверніть Моніку

4

Коротка відповідь на ваше запитання: залежить від того, кого ви запитуєте ;-) Трудні байєси оголосять перемогу або, принаймні, паритетну, частофілістську методологію. Заборонені лікарі за замовчуванням мають значення "На це не можна відповісти". Інші 99% статистиків використовуватимуть будь-які методи, які були виявлені надійними в умовах невмилих експериментів.

Я знаю, що чутливість розподілу вибірки до намірів дослідника може викликати занепокоєння, і справді немає хорошого рішення цієї проблеми. Байєси і часто відвідувачі повинні використовувати певну суб'єктивність і судження, вирішуючи, як формувати умовивід. Однак я вважаю, що ви берете приклад з області, яка є загалом суперечливою і ставить проблеми виключно біля ніг частістських висновків. Послідовні та / або зупинені експерименти є класичними прикладами суб'єктивного характеру висновку ... і на які немає абсолютно об'єктивного та погодженого відповіді.

Як щодо регулярного висновку, де ви фактично збираєте зразок, який ви мали намір отримати? Тут я думаю, що у лікарів-лікарів є перевага, оскільки значення КІ та р добре відкалібровані з їх властивостями повторного відбору проб, тоді як байєсівський висновок зберігає свою особисту та суб'єктивну природу.

Якщо ви хочете більш теоретичного викладу байєсівської відповіді, я б прочитав про "умовне висновок", ключовими дослідниками були Ненсі Рейд і Леман.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.