Я думаю, що можу відповісти на ваші запитання принаймні щодо невідрегульованих оцінок повторюваності, тобто класичних внутрішньокласових кореляцій (МКК). Що стосується "скоригованої" оцінки повторюваності, я проглянув папір, яку ви зв'язали, і не зрозумів, де формула, яку ви застосовуєте, можна знайти в папері? Виходячи з математичного вираження, видається, що це повторюваність середніх балів (а не окремих балів). Але незрозуміло, що це так чи інакше важлива частина вашого питання, тому я його проігнорую.
(1.) Чи мають значення вищезазначені обчислення для отримання точкової оцінки повторюваності ефекту?
Так, вираз, який ви пропонуєте, має сенс, але необхідна незначна зміна запропонованої формули. Нижче я показую, як можна отримати запропонований коефіцієнт повторюваності. Я сподіваюся, що це одночасно роз'яснює концептуальне значення коефіцієнта, а також показує, чому було б бажано його трохи змінити.
Для початку давайте спочатку візьмемо коефіцієнт повторюваності у першому випадку та уточнимо, що це означає і звідки він походить. Розуміння цього допоможе нам зрозуміти складніший другий випадок.
Лише випадкові перехоплення
У цьому випадку змішана модель для ї відповіді в й групі -
де випадкові перехоплення мають дисперсію і залишки мають відмінність .iy i j = β 0 + u 0 j + e i j , u 0 j σ 2 u 0 e i j σ 2 ej
yij=β0+u0j+eij,
u0jσ2u0eijσ2e
Тепер співвідношення між двома випадковими змінними і визначається як
y c o r r = c o v ( x , y )xy
corr=cov(x,y)var(x)var(y)−−−−−−−−−−√.
Вираз для коефіцієнта ICC / коефіцієнта повторюваності походить від дозволу двох випадкових величин і двома спостереженнями, проведеними з тієї ж групи,
і якщо ви спростите це за допомогою наведених вище визначень та властивостей дисперсій / коваріацій (процес, який я тут не показуватиму, якщо ви та інші не віддасте перевагу тому, що я це робив), ви отримаєте
xyj
ICC=cov(β0+u0j+ei1j,β0+u0j+ei2j)var(β0+u0j+ei1j)var(β0+u0j+ei2j)−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√,
ICC=σ2u0σ2u0+σ2e.
Це означає, що ICC або "коефіцієнт повторної коригуваності" в цьому випадку має просту інтерпретацію як очікувану кореляцію між парними спостереженнями з одного кластеру (за винятком фіксованих ефектів, що в даному випадку є просто великим значенням). Те, що МКК також інтерпретується як
частка дисперсії в цьому випадку, є випадковим; що інтерпретація взагалі не відповідає дійсності для більш складних МКК. Інтерпретація як якесь співвідношення є тим, що є первинним.
Випадкові перехоплення та випадкові нахили
Тепер для другого випадку ми повинні спочатку уточнити, що саме мається на увазі під «надійністю ефектів (тобто сумарний контрастний ефект змінної з 2 рівнями)» - ваші слова.
Спочатку викладаємо модель. Змішана модель для ї відповіді в й групі під м рівнем дорівнює
де випадкові перехоплення мають дисперсію , випадкові нахили мають дисперсію , випадкові перехоплення та нахили мають коваріацію , а залишки мають дисперсію .ijkx
yijk=β0+β1xk+u0j+u1jxk+eijk,
σ2u0σ2u1σu01eijσ2e
Отже, яка «повторюваність ефекту» за цією моделлю? Я думаю, що хорошим визначенням кандидата є те, що це очікуване співвідношення між двома парами балів різниць, обчислених у межах одного кластера , але в різних парах спостережень .ji
Таким чином, пара різниць балів, про які йдеться, буде (пам’ятайте, що ми припустили, що контрастується кодуванням, так що ):
і
x|x1|=|x2|=x
yi1jk2−yi1jk1=(β0−β0)+β1(xk2−xk1)+(u0j−u0j)+u1j(xk2−xk1)+(ei1jk2−ei1jk1)=2xβ1+2xu1j+ei1jk2−ei1jk1
yi2jk2−yi2jk1=2xβ1+2xu1j+ei2jk2−ei2jk1.
Підключення їх до формули кореляції дає нам
що спрощує вниз до
Зауважте, що ICC технічно є функцією ! Однак у цьому випадку може приймати лише 2 можливі значення, а ICC однаковий для обох цих значень.
ICC=cov(2xβ1+2xu1j+ei1jk2−ei1jk1,2xβ1+2xu1j+ei2jk2−ei2jk1)var(2xβ1+2xu1j+ei1jk2−ei1jk1)var(2xβ1+2xu1j+ei2jk2−ei2jk1)−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√,
ICC=2x2σ2u12x2σ2u1+σ2e.
xx
Як ви бачите, це дуже схоже на коефіцієнт повторюваності, який ви запропонували у своєму запитанні. Єдина відмінність полягає в тому, що випадкова дисперсія нахилу повинна бути відповідним чином масштабована, якщо вираз слід інтерпретувати як ICC або "невідрегульований коефіцієнт повторюваності". Вираз, який ви написали, працює в спеціальному випадку, коли кодировщик кодується , але не в цілому.x±12√
(2.) Коли у мене є декілька змінних, повторюваність яких я хочу оцінити, додавання їх у однаковій формі (наприклад lmer(dv~(iv1+iv2|unit)+iv1+iv2
), здається, дає більш високі оцінки повторюваності, ніж створення окремої моделі для кожного ефекту. Для мене це має сенс обчислювально, оскільки включення декількох ефектів, як правило, зменшить залишкову дисперсію, але я не впевнений, що отримані оцінки повторюваності є дійсними. Чи вони?
Я вважаю, що робота над аналогічною деривацією, представленою вище для моделі з декількома прогнозами з власними випадковими нахилами, показала б, що вищевказаний коефіцієнт повторюваності все-таки буде дійсним, за винятком додаткового ускладнення, яке б зараз бали різниці, які нас концептуально цікавлять. мають дещо інше визначення: а саме нас цікавить очікуване співвідношення відмінностей між скоригованими засобами після контролю за іншими прогнозами в моделі.
Якщо інші предиктори є ортогональними для прогнозованого, що цікавить (як, наприклад, збалансований експеримент), я думаю, що розроблений вище коефіцієнт ICC / повторюваність повинен працювати без будь-яких змін. Якщо вони не є ортогональними, то вам потрібно буде змінити формулу, щоб врахувати це, що може ускладнитися, але, сподіваюся, моя відповідь дала деякі підказки про те, як це може виглядати.