Розрахунок розміру зразка для змішаних моделей


23

Мені цікаво, чи існують якісь методи для розрахунку розміру вибірки в змішаних моделях? Я використовую lmerв R, щоб відповідати моделям (у мене є випадкові нахили та перехоплення).


3
Моделювання завжди є варіантом - тобто моделювати дані за певною альтернативною гіпотезою та розміром вибірки та багато разів повторно підходити до моделі, щоб побачити, як часто ви відкидаєте нульову гіпотезу, яка вас цікавить. З мого досвіду це забирає досить багато часу (комп’ютер), оскільки для підгонки кожної моделі потрібно щонайменше кілька секунд.
Макро

Відповіді:


29

У longpowerпакеті реалізовано обчислення розміру вибірки у Лю та Лян (1997) та Diggle et al (2002). Документація має приклад коду. Ось один, використовуючи lmmpower()функцію:

> require(longpower)
> require(lme4)
> fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy) 
> lmmpower(fm1, pct.change = 0.30, t = seq(0,9,1), power = 0.80)

     Power for longitudinal linear model with random slope (Edland, 2009) 

              n = 68.46972
          delta = 3.140186
         sig2.s = 35.07153
         sig2.e = 654.941
      sig.level = 0.05
              t = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
          power = 0.8
    alternative = two.sided
       delta.CI = 2.231288, 4.049084
           Days = 10.46729
        Days CI = 7.437625, 13.496947
           n.CI = 41.18089, 135.61202

Також перевірте, liu.liang.linear.power()що " виконує розрахунок розміру вибірки для лінійної змішаної моделі"

Лю, Г. та Лян, Кентуккі (1997). Розрахунки розмірів вибірки для досліджень з співвіднесеними спостереженнями. Біометрія, 53 (3), 937-47.

Diggle PJ, Heagerty PJ, Liang K, Zeger SL. Аналіз поздовжніх даних. Друге видання. Оксфорд. Статистичні наукові сервіси. 2002 рік

Редагувати: Ще один спосіб - "виправити" ефект кластеризації. У звичайній лінійній моделі кожне спостереження є незалежним, але за наявності кластеризованих спостережень не є незалежними, які можна вважати меншими незалежними спостереженнями - ефективні розміри вибірки менші. Ця втрата ефективності відома як проектний ефект :

DE=1+(m1)ρ
де - середній розмір кластера, а - коефіцієнт кореляції внутрішньокласових (коефіцієнт дисперсії дисперсії). Отже, розмір вибірки, отриманий за допомогою обчислення, який ігнорує кластеризацію, завищений щоб отримати розмір вибірки, що дозволяє здійснювати кластеризацію.mρDE

3
Цей ефект дизайну актуальний лише для загальної лінійної статистики (засобів, підсумків). Для коефіцієнтів регресії DEFF більше схожий на де - МКК регресора, а - ICC терміна помилки (складна помилка = кластерний випадковий ефект + ефект спостереження). Завдяки добутку кореляцій, які, як правило, невеликі, ця DEFF також невелика.
DЕЖЖ=1+(м-1)ρхρϵ,
ρхρϵ
Стаск

Чи можете ви вказати мені цитування цієї формули?
Джошуа Розенберг

10

Для будь-якого, що перевищує прості 2 вибіркові тести, я вважаю за краще використовувати моделювання для дослідження розміру вибірки або потужності. У попередньо розфасованих підпрограмах іноді можна побачити великі відмінності між результатами програм, виходячи з припущень, які вони роблять (і ви, можливо, не зможете дізнатися, що таке припущення, не кажучи вже про те, якщо вони є обґрунтованими для вашого дослідження). За допомогою моделювання ви контролюєте всі припущення.

Ось посилання на приклад:
https://stat.ethz.ch/pipermail/r-sig-mixed-models/2009q1/001790.html


Цікаво, чи це також працює для моделей GLMER?
Чарлі Гліз

1
@CarlosGlez, так, це працює для будь-якої моделі, де ви можете імітувати дані та аналізувати їх. Я зробив це для моделей GLMER.
Грег Сніг

Добре сказано, і я додам, що крім "контролю припущень", ви також можете задати питання "що робити", порушити ці припущення та визначити певне практичне відчуття стійкості, наприклад, чи дійсно ненормальні випадкові ефекти справді руйнують ефективність.
AdamO
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.