Чи потрібен аналіз потужності в байєсівській статистиці?


19

Останнім часом я досліджував байєсівську класичну статистику. Прочитавши про фактор Байєса, я не замислювався, чи необхідний аналіз потужності в цьому погляді на статистику. Моя головна причина, що цікаво, що це фактор Байєса, справді, просто виявляється співвідношенням ймовірності. Як тільки це 25: 1, здається, я можу назвати це ніч.

Я далеко? Я можу зробити будь-яке інше читання, щоб дізнатися більше? Зараз читаю цю книгу: Вступ до байєсівської статистики В. М. Болстада (Wiley-Interscience; 2nd ed., 2007).



Відповіді:


10

Потужність становить приблизно довгострокову ймовірність p <0,05 (альфа) у майбутніх дослідженнях. У Байєса докази дослідження A подають у пріори для дослідження B тощо тощо. Тому влади, як визначено в частотистській статистиці, насправді не існує.


12
Менш обмежений погляд на потужність сприймає це як вираження кривої ризику для функції втрат 0-1. Байєсівський аналіз інтегрує цей ризик за попередньою ймовірністю. Однак хороший байєсівський аналіз враховує чутливість їх результатів до вибору попереднього розподілу. Це, здавалося б, поверне нас назад у сферу аналізу потужності. Хоча це може не піти за цією назвою і обчислюватися по-різному, мета була б однаковою, а саме - визначити, наскільки велику вибірку потрібно отримати, щоб бути достатньо впевненим у виконанні цілей дослідження.
whuber

2
Це дуже вдалий момент Вубера. Однак це не єдина причина розрахунків потужності, і багато байесівців стверджують, що це непотрібно, оскільки вам не потрібно заздалегідь визначати N (помилка).
Джон

5
Мене це спантеличить. Як один може піти про планування експерименту, отримання ресурсів і планування його без будь - то ідеї про те , що має бути? N
whuber

2
Я не придумував ідеї, є ряд робіт, де байєси стверджують, що ви можете додати тематику, поки не будете мати достатньо сильних доказів для прийняття рішення на відміну від частого тестування, де такі процедури тестування та додавання не працюють. Я міг би знайти посилання, я думаю. Особливо це стосується того, щоб запропонувати, як аналізувати дані в клінічних випробуваннях.
Іван

8
Зрозуміло, що коли можна продовжувати так послідовно, то для цього можуть бути чудові причини. Але навіть це не означає, що оцінка "непотрібна"! Я навіть можу повірити в існування людей, які могли б зробити такий аргумент, але я був би зобов’язаний вважати їх як чужих істот, які не мають інтересу до власних експериментів чи збору даних! N
whuber

14

Ви можете виконувати тести на гіпотези за допомогою байєсівської статистики. Наприклад, можна зробити висновок, що ефект більший за нуль, якщо більше 95% задньої щільності перевищує нуль. Або альтернативно, ви можете використовувати якусь форму двійкового рішення, засновану на факторах Байєса.

Після встановлення такої системи прийняття рішень, можна оцінити статистичну потужність, припускаючи заданий процес генерації даних та розмір вибірки. Ви можете легко оцінити це в заданому контексті, використовуючи моделювання.

Однак, байєсівський підхід часто зосереджується більше на інтервалі довіри, ніж на бальній оцінці та ступеня переконаності, а не на бінарному рішенні. Використовуючи цей більш постійний підхід до висновку, ви можете замість цього оцінити інші наслідки для висновку вашого дизайну. Зокрема, ви можете оцінити очікуваний розмір вашого інтервалу достовірності для певного процесу генерації даних та розміру вибірки.


3

Це питання призводить до безлічі непорозумінь, оскільки люди використовують байєсівські статистичні дані, щоб задавати питання часто. Наприклад, люди хочуть визначити, чи варіант B кращий, ніж варіант А. Вони можуть відповісти на це запитання за допомогою байєсівської статистики, визначивши, чи є 95% -ний інтервал найвищої щільності різниці між цими двома задніми розподілами (BA) більше 0 або a область практичної значущості близько 0. Якщо ви використовуєте байесівську статистику для відповіді на питання частолістів, ви все одно можете робити помилки частолістів: тип I (помилкові позитиви; opps - B насправді не кращий) та тип II (пропустіть; не зрозумійте що Б по-справжньому краще).

Суть аналізу потужності полягає в зменшенні помилок типу II (наприклад, принаймні 80% шансів знайти ефект, якщо він існує). Аналіз потужності також слід використовувати при використанні статистики Баєса, щоб задавати часті питання, як описано вище.

Якщо ви не використовуєте аналіз потужності, а потім неодноразово заглядаєте на свої дані, збираючи їх, а потім зупиняєтесь лише після того, як виявите значну різницю, тоді ви збираєтеся робити більше помилок типу I (помилкових тривог), ніж ви могли очікувати - так само, як якщо б ви використовували статистику часто.

перевірити:

https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html

http://varianceexplained.org/r/bayesian-ab-testing/

Зверніть увагу: Деякі байєсівські підходи можуть зменшити, але не усунути ймовірність помилки типу I (наприклад, відповідний попередній інформаційний характер).


0

Необхідність, наприклад, аналізу в потужності в клінічному випробуванні, полягає в тому, щоб мати можливість обчислити / оцінити, скільки учасників набирається, щоб мати шанс знайти ефект лікування (заданого мінімального розміру), якщо він існує. Неможливо набрати нескінченну кількість пацієнтів, по-перше, через часові обмеження і вдруге через обмеження витрат.

Отже, уявіть, ми застосовуємо байєсівський підхід до зазначеного клінічного випробування. Незважаючи на те, що плоскі пріори теоретично можливі, чутливість до пріоритетного в будь-якому разі доцільна, оскільки, на жаль, існує більше ніж одна квартира (що дивно, зараз я думаю, оскільки насправді має бути лише один спосіб висловити повну невизначеність).

Отже, уявіть, що, далі, ми робимо аналіз чутливості (модель, а не лише попередня, також буде розглянута тут). Це включає моделювання правдоподібної моделі на "правду". У класичній / частотній статистиці тут є чотири кандидати на "правду": H0, mu = 0; H1, mu! = 0, де або спостерігаються з помилкою (як у нашому реальному світі), або без помилок (як у неспостережуваному реальному світі). У статистиці Байєса тут є два кандидати на «істину»: mu - випадкова величина (як у неспостережуваному реальному світі); mu - випадкова величина (як у нашому спостережуваному реальному світі, з точки зору невизначеної особи).

Тож насправді це залежить від того, кого ви намагаєтеся переконати А) шляхом випробування та В) шляхом аналізу чутливості. Якби це не та сама людина, це було б досить дивно.

Насправді йдеться про консенсус щодо того, що таке істина та про те, що підтверджує відчутні докази. Спільна думка полягає в тому, що розподіл ймовірностей підписів спостерігається в нашому реальному спостережуваному світі, який певним чином має деяку основоположну математичну правду. Я зупинюсь на цьому, оскільки це не сторінка мистецтв, а скоріше наукова сторінка, або це моє розуміння.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.