В основному, я вважаю, що найрізноманітніша різниця, якщо моделювати фактор як випадковий, полягає в тому, що вважається, що ефекти будуть виведені із звичайного нормального розподілу.
Наприклад, якщо у вас є якась модель щодо оцінок і ви хочете врахувати дані своїх учнів, що надходять з різних шкіл, і ви моделюєте школу як випадковий фактор, це означає, що ви припускаєте, що середні школі зазвичай розподіляються. Це означає, що моделюють два джерела варіації: мінливість школярів у школі та мінливість між школою.
Це призводить до того, що називається частковим об'єднанням . Розглянемо дві крайності:
- Школа не робить ніякого ефекту (між шкільною мінливістю дорівнює нулю). У цьому випадку лінійна модель, яка не враховує школу, була б оптимальною.
- Змінність у школі більша, ніж мінливість учнів. Тоді вам в основному потрібно працювати на рівні школи замість рівня учнів (менше # зразків). Це в основному модель, коли ви обліковуєте школу за допомогою фіксованих ефектів. Це може бути проблематично, якщо у вас є кілька зразків у школі.
Оцінюючи мінливість на обох рівнях, змішана модель робить розумний компроміс між цими двома підходами. Особливо, якщо у вас не так багато # студентів у школі, це означає, що ви отримаєте зменшення ефектів для окремих шкіл, як оцінюється за моделлю 2, до загального середнього значення моделі 1.
Це тому, що в моделях сказано, що якщо у вас є одна школа з двома учнями, що краще, ніж те, що є «нормальним» для населення шкіл, то, ймовірно, частина цього ефекту пояснюється тим, що школі пощастило у виборі з двох учнів дивилися. Це не робить наосліп, це робить це залежно від оцінки мінливості школи. Це також означає, що рівні ефектів з меншою кількістю вибірок сильніше тягнуться до загальної середньої величини, ніж великі школи.
Важливим є те, що вам потрібна обмінність на рівнях випадкового фактора. Це означає, що в цьому випадку школи (за вашими знаннями) обмінні, і ви нічого не знаєте, що їх відрізняє (крім якогось посвідчення особи). Якщо у вас є додаткова інформація, ви можете включити її як додатковий фактор, достатньо, щоб школи могли обмінюватися умовами іншої інформації, що обліковується.
Наприклад, було б доцільно припустити, що дорослі особини 30 років, які проживають у Нью-Йорку, можуть бути обміненими залежно від статі. Якщо у вас є більше інформації (вік, етнічна приналежність, освіта), було б доцільно включити і цю інформацію.
ІНШЕ якщо у вас є дослідження з однією контрольною групою та трьома дико різними групами захворювань, не має сенсу моделювати групу як випадкову, оскільки конкретні захворювання не підлягають обміну. Однак багатьом людям настільки добре подобається ефект усадки, що вони все одно сперечаються за модель випадкових ефектів, але це вже інша історія.
Я зауважую, що я не надто вникав у математику, але в основному різниця полягає в тому, що модель випадкових ефектів оцінювала нормально розподілену помилку як на рівні шкіл, так і на рівні учнів, тоді як модель з фіксованим ефектом має помилку саме на рівень учнів. Особливо це означає, що кожна школа має свій рівень, який не пов'язаний з іншими рівнями загальним розподілом. Це також означає, що фіксована модель не дозволяє екстраполювати на учня школи, не включеного в вихідні дані, тоді як модель випадкових ефектів це робить, з мінливістю, що є сумою рівня школяра та мінливості шкільного рівня. Якщо вас конкретно зацікавила ймовірність, ми могли б працювати над цим.