Параметричний розрахунок розміру вибірки та непараметричний аналіз


12

Мені цікаво дізнатись, чи є у когось конкретна довідка (текст чи стаття в журналі), щоб підтримати загальну практику в медичній літературі щодо обчислення розміру вибірки з використанням параметричних методів (тобто при умові нормального розподілу та певної дисперсії вимірювань) коли аналіз результату первинного випробування буде здійснено за допомогою непараметричних методів.

Приклад: первинний результат - час блювоти після введення певного препарату, який, як відомо, має середнє значення 20 хвилин (СД 6 хвилин), але має помітний косоокий розподіл. Розрахунок розміру вибірки робиться з припущеннями, переліченими вище, за формулою

,n(per-group)=f(α,β)×(2σ2/(μ1μ2)2)

де змінюється на основі бажаних помилок α і β .f(α,β)αβ

Однак через хибність розподілу аналіз первинного результату буде базуватися на рангах (непараметричний метод, такий як тест Манна Уітні U).

Чи підтримують цю схему автори в статистичній літературі, чи слід проводити непараметричні оцінки розмірів вибірки (і як це зробити)?

Мої думки полягають у тому, що для зручності обчислення прийнятно виконувати описану вище практику. Зрештою, оцінки розміру вибірки - це саме те - оцінки, які вже роблять кілька припущень - всі вони, ймовірно, незначні (або дуже!) Неточні. Однак мені цікаво знати, що думають інші, і конкретно знати, чи є якісь посилання на підтримку цієї лінії міркувань.

Дякую за будь-яку допомогу.

Відповіді:


4

Мені це звучить хитро. Непараметричні методи майже завжди передбачають більше ступеня свободи, ніж параметричні методи, і тому потрібно більше даних. У вашому конкретному прикладі тест Манна-Вітні має меншу потужність, ніж t-тест, і тому потрібно більше даних для тієї ж заданої потужності та розміру.

Простий спосіб зробити розрахунок розміру вибірки для будь-якого методу (непараметричного чи іншим способом) - використовувати підхід до завантаження.


5
Я згоден з вами, хоча більшість розрахунків розміру вибірки, які робляться при розробці RCT, базуються на параметричних моделях. Мені подобається підхід до завантаження, але, схоже, дуже мало досліджень покладаються на нього. Я тільки що знайшов ті документи , які можуть бути цікаві: bit.ly/djzzeS , bit.ly/atCWz3 , і це один йде в напрямку , протилежному bit.ly/cwjTHe для вимірювання здоров'я лусочками.
chl

6
Я згоден щодо підходу до завантаження. Але влада не є функцією ступенів свободи. У багатьох випадках, включаючи цей, тест Манна-Вітні часто має більшу потужність, ніж t-тест. Див. Tbf.coe.wayne.edu/jmasm/sawilowsky_misconceptions.pdf . Загалом, потужність параметричного тесту є хорошою, коли параметричні припущення є істинними, але можуть бути нижчими - іноді різко - коли ці припущення порушуються, тоді як хороші непараметричні тести підтримують свою потужність.
whuber

@RobHyndman - вибачте копати стару тему з 6 років тому, але мені цікаво, чи можете ви надати посилання на ваше останнє речення. Як я можу використовувати підхід до завантаження для отримання розрахунку розміру вибірки? Я припускаю, що я ще не зібрав дані (тому що я намагаюся зрозуміти, скільки потрібно зібрати), але я знаю, яку силу я хочу, рівень значущості та розмір ефекту, який я хочу виявити. Дякую!
Девід Уайт

Гаразд, я думаю, що це може спрацювати лише за умови попереднього дослідження для повторного аналізу. Для першого дослідження, що не має попередніх знань, найкраще обчислити розмір ефекту від звичайного розподілу (або з іншого розподілу, якщо теорія пропонує, що дані слід розподіляти таким чином) і додати трохи для врахування можливої ​​ненормативності. Після того, як у вас буде одне дослідження, ви можете використовувати підсилення для обчислення розмірів вибірки для виявлення різних розмірів ефекту в наступних дослідженнях. Ви навіть можете встановити криву розміру ефекту проти n на основі завантаження декількох значень n.
Девід Уайт

4

Деякі люди, здається, використовують концепцію асимптотичної відносної ефективності Пітмена (ARE), щоб надути розмір вибірки, отриманий за допомогою формули розміру вибірки для параметричного тесту. За іронією долі, для того, щоб його обчислити, потрібно знову взяти на себе розподіл ... див. Наприклад розмір вибірки для тесту Манна-Вітні U У кінці статті є кілька посилань, які надають покажчики для подальшого читання.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.