У літературі про ієрархічні / багаторівневі моделі я часто читав про "вкладені моделі" та "невкладені моделі", але що це означає? Може хтось може надати мені кілька прикладів чи розповісти про математичні наслідки цього фразування?
У літературі про ієрархічні / багаторівневі моделі я часто читав про "вкладені моделі" та "невкладені моделі", але що це означає? Може хтось може надати мені кілька прикладів чи розповісти про математичні наслідки цього фразування?
Відповіді:
Вкладене проти вкладеного може означати цілу масу речей. Ви вклали конструкції проти схрещених конструкцій (див., Наприклад, це пояснення ). Ви вклали моделі в порівнянні моделей. Вкладене означає, що всі терміни меншої моделі трапляються у більшій моделі. Це необхідна умова для використання більшості моделей порівняльних тестів, таких як тести коефіцієнта ймовірності.
У контексті багаторівневих моделей я думаю, що краще говорити про вкладені та невкладені фактори. Різниця полягає в тому, як різні фактори пов'язані один з одним. У вкладеній конструкції рівні одного фактора мають сенс лише в межах рівня іншого фактора.
Скажіть, ви хочете виміряти вироблення кисню листя. Ви збираєте вибірку декількох порід дерев, і на кожному дереві ви збираєте кілька листочків на дні, посередині та вгорі дерева. Це вкладений дизайн. Різниця для листя в іншому положенні має сенс лише у одного дерева. Тому порівнювати нижнє листя, середнє листя та верхнє листя над усіма деревами безглуздо. Або сказати інакше: положення листів не слід моделювати як основний ефект.
Невкладені фактори - це сукупність двох факторів, які не пов'язані між собою. Скажімо, ви вивчаєте пацієнтів і вас цікавить різниця у віці та статі. Отже, у вас є факторний віковий клас та факторна стать, які не пов'язані між собою. Вам слід моделювати вік і стать як основний ефект, і ви можете поглянути на взаємодію, якщо це необхідно.
Різниця не завжди така очевидна. Якщо в моєму першому прикладі види дерев тісно пов'язані за формою та фізіологією, ви можете розглянути положення листя також як дійсний головний ефект. У багатьох випадках вибір для вкладеного дизайну порівняно з вкладеним дизайном є скоріше рішенням дослідника, ніж справжнім фактом.
Вкладені порівняно з не вкладеними моделями виходять у спільному аналізі та IIA . Розглянемо "проблему синього автобуса з червоним автобусом". У вас населення, де 50% людей беруть машину на роботу, а інші 50% їдуть на автобусі. Що станеться, якщо до рівняння додати синю шину, яка має ті ж характеристики, що і червону шину? Поліноміальної логит модель передбачатиме частку 33% для всіх трьох режимів. Ми інтуїтивно знаємо, що це неправильно, оскільки червоний і синій автобус більше схожі один на одного, ніж на автомобіль, і, таким чином, візьмуть більше частки один від одного, перш ніж брати частку з машини. Саме тут надходить гніздова структура, яка, як правило, визначається як коефіцієнт лямбда для подібних альтернатив.
Бен Аківа зібрав хороший набір слайдів з викладом теорії з цього питання тут . Він починає говорити про вкладений Logit навколо слайду 23.
Основне значення, якщо дві моделі вкладені, полягає в тому, що порівняти їх статистично порівняно легко. Простіше кажучи, за допомогою вкладених моделей ви можете вважати складнішими такі, що будуються, додаючи щось до більш простої "нульової моделі". Отже, щоб вибрати найкращі з цих двох моделей, ви просто повинні з'ясувати, чи додано щось пояснює значну кількість додаткової дисперсії в даних. Цей сценарій насправді еквівалентний спочатку встановленню простої моделі та усуненню її передбачуваної дисперсії з даних, а потім підгонці додаткового компонента більш складної моделі до залишків від першого розміщення (принаймні, з оцінкою найменших квадратів).
Невкладені моделі можуть пояснювати абсолютно різні частини дисперсії даних. Складна модель може навіть пояснити меншу дисперсію, ніж проста, якщо складна не містить "правильних речей", які є у простої. Тож у такому випадку дещо складніше передбачити, що відбудеться під нульовою гіпотезою, що обидві моделі пояснюють дані однаково добре.
Більше того, під нульовою гіпотезою (і з урахуванням певних помірних припущень) різниця в корисності між двома вкладеними моделями має відомий розподіл, форма якого залежить лише від різниці ступенів свободи між двома моделей. Це не вірно для вкладених моделей.
Дві моделі є відмітними або відокремленими, якщо одна модель не може бути отримана як межа другої (або одна модель не є окремим випадком іншої)
Ви запитували про різницю між вкладеними та нестебловими моделями. Побачити:
Там, де тема нестепових або окремих моделей була розглянута вперше, або в моїй наступній книзі: Вибір окремих або непроменених моделей .
Дивіться простішу відповідь у цьому PDF . По суті, вкладена модель - це модель з меншими змінними, ніж повна модель. Один із намірів - шукати більше парсимонічних відповідей.