Нехай позначають вектор відповіді та предиктора (відповідно) учня i в школі jyij,xijij .
(1) Що стосується двійкових даних, я вважаю, що стандартним способом виконання дисперсійних розкладів, аналогічних тим, які робляться для безперервних даних, є те, що автори називають Методом D (я прокоментую інші методи нижче) у вашому посиланні - передбачаючи, що бінарні дані є що виникає з основної безперервної змінної, яка керується лінійною моделлю, і розкладає дисперсію на ту латентну шкалу. Причина полягає в тому, що логістичні моделі (та інші ГЛМ) природно виникають таким чином ...
Щоб побачити це, визначте таким, що керується лінійною змішаною моделлю:y⋆ij
y⋆ij=α+xijβ+ηj+εij
де - коефіцієнти регресії, η j ∼ N ( 0 , σ 2 ) - випадковий ефект шкільного рівня, а ε i j - термін залишкової дисперсії і має стандартнийлогістичний розподіл. Тепер нехайα,βηj∼N(0,σ2)εij
yij=⎧⎩⎨⎪⎪10if y⋆ij≥0if y⋆ij<0
нехай зараз, просто використовуючи логістичний CDF у насpij=P(yij=1|xij,ηj)
pij=1−P(y⋆ij<0|xij,ηj)=exp{−(α+xijβ+ηj)}1+exp{−(α+xijβ+ηj)}
тепер приймаючи logit перетворення обох сторін, у вас є
log(pij1−pij)=α+xijβ+ηj
що саме є логістичною моделлю змішаних ефектів. Отже, логістична модель еквівалентна зазначеній вище моделі прихованої змінної. Одна важлива примітка:
- Шкала не ідентифікується, оскільки, якби ви її масштабували, але константу s , вона просто змінила б вищевикладене наεijs
exp{−(α+xijβ+ηj)/s}1+exp{−(α+xijβ+ηj)/s}
тому коефіцієнти та випадкові ефекти просто масштабуються на відповідну суму. Отже, s = 1
s=1var(εij)=π2/3
Тепер, якщо ви використовуєте цю модель, а потім кількість
σ^2ησ^2η+π2/3
оцінює внутрішньокласову кореляцію основних прихованих змінних . Ще одна важлива примітка:
- εij
σ^2ησ^2η+1
Щодо інших методів, згаданих у роботі, яку ви пов’язали:
xij
(B) Метод моделювання є інтуїтивно привабливим для статистиків, оскільки він дасть тобі оціночну декомпозицію в початковому масштабі даних, але, залежно від аудиторії, це може бути (i) складно описати це у ваших "методах". розділ та (ii) можуть вимкнути рецензента, який шукав щось "більш стандартне"
(C) Попередження даних безперервне - це, мабуть, не чудова ідея, хоча це не буде страшно, якщо більша частина ймовірностей не надто близька до 0 або 1. Але, зробивши це, майже напевно підніме червоний прапор рецензента тож я б тримався подалі.
Тепер нарешті,
(2) Якщо фіксовані ефекти різняться різними роками, то ви вірно вважаєте, що порівняння випадкових ефектів за різні роки може бути важким, оскільки вони потенційно знаходяться на різних масштабах (це пов'язано з неідентифікацією питання масштабування, згаданого вище).
Якщо ви хочете зберегти фіксовані ефекти з часом (однак, якщо ви бачите, що вони з часом сильно змінюються, ви можете не хотіти цього робити), але подивіться на зміну випадкової дисперсії ефекту, ви можете дослідити цей ефект, використовуючи деякі випадкові схили та фіктивні змінні. Наприклад, якщо ви хотіли дізнатись, чи відрізняються МКК в різні роки, ви допустилиIk=1k
α+xijβ+η1jI1+η2jI2+η3jI3+η4jI4+η5jI5+η6jI6
це дасть вам різні МКЦ щороку, але однакові фіксовані ефекти. Можливо, спокусити просто використовувати випадковий нахил у часі, що робить ваш лінійний передбачувач
α+xijβ+η1+η2t
але я не рекомендую цього, оскільки це лише дозволить вашим асоціаціям з часом збільшуватися , а не зменшуватися .