Яка мінімальна рекомендована кількість груп для коефіцієнта випадкових ефектів?


26

Я використовую змішану модель в R( lme4) для аналізу деяких даних повторних заходів. У мене є змінна відповідь (вміст клітковини в калі) і 3 фіксованих ефекту (маса тіла тощо). У моєму дослідженні є лише 6 учасників, з 16 повторних заходів для кожного (хоча два мають лише 12 повторень). Суб'єктами є ящірки, яким в різних "лікувальних засобах" отримували різні комбінації їжі.

Моє запитання: чи можна використовувати ідентифікатор теми як випадковий ефект?

Я знаю, що це звичайний хід дій у моделях поздовжнього змішаного впливу, щоб врахувати випадково вибірену природу випробовуваних та той факт, що спостереження всередині суб'єктів будуть більш тісно корельовані, ніж спостереження між суб'єктами. Але трактування ідентифікатора суб'єкта як випадкового ефекту включає оцінку середньої величини та дисперсії для цієї змінної.

  • Оскільки у мене є лише 6 суб'єктів (6 рівнів цього фактора), чи достатньо цього, щоб отримати точну характеристику середнього рівня та дисперсії?

  • Чи допомагає у цьому плані факт, що у мене є досить багато повторних вимірювань для кожного предмета (я не бачу, як це має значення)?

  • Нарешті, якщо я не можу використовувати ідентифікатор теми як випадковий ефект, чи дозволить включити його як фіксований ефект, я можу контролювати факт повторних заходів?

Редагувати: Я просто хотів би уточнити, що коли я кажу "чи можу я" використовувати ідентифікатор теми як випадковий ефект, я маю на увазі "чи це гарна ідея". Я знаю, що я можу підходити до моделі з коефіцієнтом всього з 2 рівнями, але, безумовно, це було б незахищеним? Я запитую, в який момент стає розумним думати про трактування предметів як до випадкових ефектів? Схоже, література радить, що 5-6 рівнів є нижньою межею. Мені здається, що середні оцінки та дисперсія випадкового ефекту були б не дуже точними, доки не було б факторів 15+.

Відповіді:


21

Коротка відповідь: Так, ви можете використовувати ідентифікатор як випадковий ефект з 6 рівнями.

Трохи довша відповідь: Поширені питання щодо GLMM @ BenBolker вказує (серед іншого) наступне під заголовком " Чи слід ставитись до фактора xxx як до фіксованого або випадкового? ":

Один момент, що має особливе значення при оцінці "сучасної" змішаної моделі (а не "класичної" оцінки методу моментів), полягає в тому, що для практичних цілей повинно бути розумне число рівнів випадкових ефектів (наприклад, блоків) - більше, ніж 5 або 6 як мінімум.

Отже, ви знаходитесь на нижній межі, але з правого боку від неї.


12

Намагаючись визначити мінімальну кількість груп для багаторівневої моделі, я переглянув книгу Аналіз даних за допомогою регресії та мулітилевель / Ієрархічні моделі Гельмана та Хілла (2007).

Вони, як видається, вирішують цю тему в розділі 5 глави 11 (стор. 247), де пишуть, що коли є <5 груп, то багаторівневі моделі зазвичай додають трохи більше класичних моделей. Однак, схоже, вони пишуть, що мало застосовувати багаторівневу модель ризику.

Ці ж автори, схоже, повертаються до цієї теми у розділі 9 глави 12 (сторінки 275-276). Там вони пишуть, що поради щодо мінімальної кількості груп для багаторівневої моделі є помилковими. Там вони знову говорять, що багаторівневі моделі часто додають трохи більше класичних моделей, коли кількість груп невелика. Однак вони також пишуть, що багаторівневі моделі повинні робити не гірше, ніж регресія без об'єднання (де, як видається, відсутність об'єднання означає, що групові показники використовуються в класичній регресії).

На сторінках 275-276 автори мають специфічний підрозділ для випадку однієї або двох груп (наприклад, чоловік проти жінки). Тут вони пишуть, що вони, як правило, виражають модель у класичній формі. Однак вони заявляють, що багаторівневе моделювання може бути корисним навіть для однієї або двох груп. Вони пишуть, що з однією або двома групами багаторівневе моделювання зводиться до класичної регресії.

Моє враження від цього полягає в тому, що класична регресія - це один кінець континууму моделей, тобто особливий випадок багаторівневої моделі.

Виходячи з вищесказаного, моє враження полягає в тому, що класичне регресійне та багаторівневе моделювання поверне майже однакові оцінки, коли є лише дві групи, і що використовувати багаторівневі моделі, що мають лише одну, дві, три, чотири, п'ять або шість груп, це нормально.

Я спробую в майбутньому змінити цю відповідь за допомогою Rкоду та невеликого набору даних, порівнюючи оцінки, отримані з обох підходів при використанні двох груп.


10

Для чого це варто, я зробив трохи імітаційного дослідження, щоб переглянути стабільність оцінки дисперсії порівняно простого LMM (використовуючи sleepstudyдоступний набір даних lme4). Перший спосіб генерує всі можливі комбінації предметів для ngroupsкількості предметів та уточнює модель для кожної можливої ​​комбінації. Другий займає кілька випадкових підмножин предметів.

library(lme4)
library(ggplot2)
library(tidyr)

m0 <- lmer(Reaction ~ Days + (1|Subject), data = sleepstudy,
           control = lmerControl(optimizer = "nloptwrap"))
# set the number of factor levels
ngroups <- 3:18 
# generate all possible combinations
combos <- lapply(X = ngroups, 
                 FUN = function(x) combn(unique(sleepstudy$Subject), x)) 

# allocate output (sorry, this code is entirely un-optimized)
out <- list(matrix(NA, ncol(combos[[1]]), 1), matrix(NA, ncol(combos[[2]]), 1),
            matrix(NA, ncol(combos[[3]]), 1), matrix(NA, ncol(combos[[4]]), 1),
            matrix(NA, ncol(combos[[5]]), 1), matrix(NA, ncol(combos[[6]]), 1),
            matrix(NA, ncol(combos[[7]]), 1), matrix(NA, ncol(combos[[8]]), 1),
            matrix(NA, ncol(combos[[9]]), 1), matrix(NA, ncol(combos[[10]]), 1),
            matrix(NA, ncol(combos[[11]]), 1), matrix(NA, ncol(combos[[12]]), 1),
            matrix(NA, ncol(combos[[13]]), 1), matrix(NA, ncol(combos[[14]]), 1),
            matrix(NA, ncol(combos[[15]]), 1), matrix(NA, ncol(combos[[16]]), 1))
# took ~ 2.5 hrs on my laptop, commented out for safety
#system.time(for(ii in 1:length(combos)) {
#    for(jj in 1:ncol(combos[[ii]])) {
#    sls <- sleepstudy[sleepstudy$Subject %in% combos[[ii]][,jj],]
#    out[[ii]][jj] <- attr(VarCorr(update(m0, data = sls))$Subject, 'stddev')
#        }
#    })

# pad with zeros, not all were equal
# from http://stackoverflow.com/questions/11148429/r-convert-asymmetric-list-to-matrix-number-of-elements-in-each-sub-list-diffe
max.len <- max(sapply(out, length))
corrected.list <- lapply(out, function(x) {c(x, rep(NA, max.len - length(x)))})
mat <- do.call(rbind, corrected.list)
mat <- data.frame(t(mat))
names(mat) <- paste0('s',3:18)
mat <- gather(mat, run, value)

ggplot(mat, aes(x = value, fill = run)) + 
    geom_histogram(bins = 60) +
    geom_vline(xintercept = 37.12, linetype =  'longdash', 
               aes(colour = 'original')) +
    facet_wrap(~run, scales = 'free_y') +
    scale_x_continuous(breaks = seq(0, 100, by = 20)) + 
    theme_bw() + 
    guides(fill = FALSE)

Пунктирна чорна лінія є оригінальною точковою оцінкою дисперсії, а грані представляють різну кількість предметів ( s3це групи з трьох предметів, s4їх чотири тощо). введіть тут опис зображення

І альтернативний спосіб:

ngroups <- 3:18
reps <- 500
out2<- matrix(NA, length(ngroups), reps)

for (ii in 1:length(ngroups)) {
    for(j in 1:reps) {
        sls <- sleepstudy[sleepstudy$Subject %in% sample(unique(sleepstudy$Subject), ngroups[i], replace = FALSE),]
        out2[i,j] <- attr(VarCorr(update(m0, data = sls))$Subject, 'stddev')
    }
}
out2 <- data.frame(t(out2))
names(out2) <- paste0('s',3:18)
out2 <- gather(out2, run, value)

ggplot(out2, aes(x = value, fill = run)) + 
    geom_histogram(bins = 60) +
    geom_vline(xintercept = 37.12, linetype =  'longdash', 
               aes(colour = 'original')) +
    facet_wrap(~run, scales = 'free_y') +
    scale_x_continuous(breaks = seq(0, 100, by = 20)) + 
    theme_bw() + 
    guides(fill = FALSE)

введіть тут опис зображення

Здається (у цьому випадку, як би там не було), дисперсія насправді не стабілізується, поки не буде щонайменше 14 предметів, якщо не пізніше.


1
+1. Звичайно, чим менша кількість предметів, тим більша дисперсія в оцінці дисперсії. Але я не думаю, що це тут важливо. Питання полягає в тому, яка кількість предметів дозволяє отримати якісь розумні результати? Якщо ми визначимо "нечутливий" результат як отримання нульової дисперсії, то у вашому моделюванні це трапляється досить часто з n = 5 або менше. Починаючи з n = 6 або n = 7, ви майже ніколи не отримуєте точну оцінку дисперсії 0, тобто модель конвергується до невідродженого рішення. Я можу зробити висновок, що n = 6 є гранично прийнятним.
амеба каже, що поверніть Моніку


8

"Здебільшого нешкідливі економетрики" Ангріста та Пішке має розділ під назвою "Менше 42 кластерів", в якому вони напівобрішно говорять:

Отже, дотримуючись ... думки про те, що відповідь на життя, Всесвіт та все - 42, ми вважаємо, що питання: скільки кластерів достатньо для надійного висновку, використовуючи стандартне регулювання кластера [подібне до оцінки дисперсії в GEE]?

Як мій інструктор з економетрики відповідав на такі питання, як ваш, це: "Америка - це вільна країна, ви можете робити все, що завгодно. Але якщо ви хочете, щоб ваш документ був опублікований, ви повинні мати можливість захищати те, що ви зробили. " Іншими словами, ви, ймовірно, зможете запустити R або Stata, HLM, Mplus або SAS PROC GLIMMIX з 6 предметами (і перейти на ці альтернативні пакети, якщо обраний вами вибір не працює), але ви, ймовірно, матимете дуже важко захищати цей підхід і обгрунтовувати асимптотичні тести.

Я вважаю, що за замовчуванням включаючи змінну як випадковий нахил, це означає, що це також є фіксованим ефектом, і вам потрібно перестрибнути через безліч синтаксисних обручів, якщо ви хочете мати це як випадковий ефект із середнім значенням нуль. Це розумний вибір, який розробили для вас розробники програмного забезпечення.


1
Я вважаю, що відповідь на це питання є певною мірою "як довгий шматок струни". Але я б не покладав великої впевненості в оцінці середнього або відхилення від вибірки менше 15-20, тому не було б те саме правило, яке стосується рівнів випадкового ефекту. Я ніколи не бачив, щоб хтось включав ідентифікатор предмета як фіксований і випадковий ефект у поздовжніх дослідженнях - це загальна практика?
Кріс

Крім невеликої кількості предметів у змішаній моделі, їх випадкові ефекти не спостерігаються, тому вам доведеться дражнити їх із даних, і, певно, вам потрібно відносно більше даних, щоб зробити це надійніше, ніж у просто оцінці середнього та дисперсія, коли все спостерігається. Таким чином 42 проти 15-20 :). Я думаю, я мав на увазі випадкові нахили, як ви вірні в ідентифікаторах предмета, фігуруючи лише як випадкові ефекти, інакше вони не будуть ідентифіковані. До речі, економісти не вірять у випадкові ефекти, і публікують майже виключно те, що вони називають "фіксованими ефектами", тобто в межах предметних оцінок.
Стаск

2
+1 @StasK за дуже гарну відповідь на питання, з яким дуже важко вирішити питання. Я думаю, що є відтінок непотрібного сарказму, і ви можете розглянути можливість редагування своєї відповіді, щоб бути трохи поважнішим до ОП.
Майкл Р. Черник

@Michael, ти, мабуть, маєш рацію, що це примхлива відповідь, і це, мабуть, зайве. ОП прийняла відповідь, яку хотіла почути, тому він отримав рішення щодо цього. Більш серйозна відповідь вказувала б або на хороші імітаційні докази, або на аналіз асимптотики вищого порядку, але, на жаль, я не знаю таких посилань.
Стаск

3
Зважаючи на те, що це варто, я думаю, що магічне число "42" полягає не в тому, коли випадкові ефекти виправдані, а коли можна піти, не турбуючись про виправлення обмеженого розміру (наприклад, думка про ефективні ступеня свободи знаменника / виправлення Кенворда-Роджера / інші подібні підходи).
Бен Болкер

7

Ви також можете використати баєсівську змішану модель - у цьому випадку невизначеність в оцінці випадкових ефектів повністю береться до уваги при обчисленні достовірних інтервалів прогнозування на 95%. Наприклад, новий пакет R brmsта функція brmдозволяють дуже легко переходити від lme4частофілістської змішаної моделі до байєсівської, оскільки він має майже однаковий синтаксис.


4

Я б не використовував модель випадкових ефектів лише з 6 рівнями. Моделі, що використовують 6-ступінчастий випадковий ефект, можна коли-небудь запустити за допомогою багатьох статистичних програм і іноді давати неупереджені оцінки, але:

  1. Я думаю, що у статистичному співтоваристві є довільна консенсус, що 10-20 - це мінімальна кількість. Якщо ви хочете, щоб ваше дослідження було опубліковане, вам рекомендують шукати журнал без статистичного огляду (або мати можливість обґрунтувати своє рішення, використовуючи досить складну мову).
  2. Із такою кількістю кластерів, різниця між кластерною дисперсією, ймовірно, погано оцінена. Погана оцінка дисперсії між кластером зазвичай перетворюється на погану оцінку стандартної похибки коефіцієнтів, що представляють інтерес. (Моделі випадкових ефектів покладаються на кількість кластерів, теоретично йдуть до нескінченності).
  3. Часто моделі просто не сходяться. Ви спробували запустити свою модель? Я здивувався б лише 12-16 мір на предмет, з якими сходяться моделі. Коли мені вдалося змусити подібну модель до зближення, у мене було сотні вимірювань на кластер.

Це питання розглядається в більшості стандартних підручників у цій галузі, і ви їх начебто вирішили у своєму запитанні. Я не думаю, що я даю вам нову інформацію.


Чи проголосували це за причину, пов’язану з його технічним змістом?
N Brouwer

З яким типом даних ви працюєте? Я не впевнений, чому ви здивовані, почувши, що модель зблизиться з 12-16 мір на кожного. Я не можу коментувати упередження в отриманих моделях, але у мене ніколи не виникало проблем зі зближенням у lme4змішаних моделях, і я часто запускаю їх за аналогічними розмірами вибірки, як ОП (я також працюю з наборами даних з біології).
RTbecard

1

Минуло багато часу з початкового питання, але я подумав, що я можу додати кілька пунктів, що стосуються вибору моделі.

1 - Поки модель ідентифікується (тобто у вас є ступінь свободи в просторі параметрів), ви маєте змогу ВИМОЖИТИ, щоб відповідати моделі. Залежно від методу оптимізації модель може або не може сходитися. У будь-якому випадку я б не намагався включити більше ніж 1 або 2 випадкових ефекту і, безумовно, не більше 1 взаємодії на міжрівневому рівні. У конкретному випадку проблеми, представленої тут, якщо ми підозрюємо взаємодію між специфічними характеристиками ящірки (наприклад, віком, розміром тощо) та типовими розмірами групи лікування 6/6, можливо, буде недостатньо для того, щоб зробити досить точні оцінки.

2 - Як згадується пара відповідей, конвергенція може бути проблемою. Однак мій досвід полягає в тому, що хоча дані суспільних наук мають величезну проблему конвергенції через проблеми вимірювань, наукові дослідження про життя і особливо біохімічні повторні заходи мають набагато менші стандартні помилки. Все залежить від процесу генерації даних. У соціальних та економічних даних ми маємо працювати на різних рівнях абстракції. Біологічна та хімічна, і, безумовно, помилка вимірювання астрономічних даних є меншою проблемою.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.