Яка математична різниця між випадковими та фіксованими ефектами?


26

Я багато чого знайшов в Інтернеті щодо тлумачення випадкових та фіксованих ефектів. Однак я не зміг отримати джерело, яке зафіксувало таке:

Яка математична різниця між випадковими та фіксованими ефектами?

Під цим я маю на увазі математичну постановку моделі та спосіб оцінювання параметрів.


1
Ну, фіксовані ефекти впливають на середнє значення спільного розподілу, а випадкові ефекти впливають на дисперсію та структуру асоціацій. Що саме ви маєте на увазі під "математичною різницею"? Ви питаєте, як змінюється ймовірність? Чи можете ви бути більш конкретними?
Макрос



1
Здається, питання не відрізняє тло, з якого воно складається. Ця термінологія в панельній економіці даних відрізняється від такої в інших соціальних науках, що використовують багаторівневі моделі. Питання потребує подальшого уточнення. Інакше це вводить в оману для тих, хто приїжджає сюди з будь-якого походження, не знаючи, що існує альтернативне визначення у суміжній галузі.
luchonacho

Відповіді:


21

Найпростіша модель з випадковими ефектами - це одностороння модель ANOVA зі випадковими ефектами, задана спостереженнями з припущеннями розподілу: ( y i jμ i ) iid N ( μ i , σ 2 w ) ,уij

(уijмкi)iidN(мкi,σш2),j=1,,J,мкiiidN(мк,σб2),i=1,,Я.

Тут випадковими ефектами є . Вони є випадковими змінними, тоді як вони є фіксованими числами в моделі ANOVA з фіксованими ефектами.мкi

Наприклад, кожен з трьох техніків в лабораторії записує серію вимірювань, а - -й вимір техніка . Назвіть "справжнє середнє значення" серії, породженого техніком ; це трохи штучний параметр, ви можете бачити як середнє значення, яке отримав би технік, якби він / вона записала величезну серію вимірювань.у я J J я μ я я μ я яi=1,2,3уijjiмкiiмкii

Якщо вам цікаво оцінити , , (наприклад, для оцінки упередженості між операторами), тоді вам доведеться використовувати модель ANOVA з фіксованими ефектами.μ 2 μ 3мк1мк2мк3

Ви повинні використовувати модель ANOVA зі випадковими ефектами, коли вас цікавлять дисперсії та визначають модель, та загальна дисперсія (див. Нижче). Дисперсія - це дисперсія записів, згенерованих одним техніком (передбачається, що однакова для всіх техніків), а називається дисперсією між техніками. Можливо, в ідеалі техніків слід вибирати навмання. σ 2 b σ 2 b + σ 2 w σ 2 w σ 2 bσш2σб2 σб2+σш2σш2σб2

Ця модель відображає формулу розкладання дисперсії для вибірки даних: введіть тут опис зображення

Загальна дисперсія = дисперсія засобів засоби внутрішньодисперсії+

що відображається моделлю ANOVA зі випадковими ефектами: введіть тут опис зображення

Дійсно, розподіл визначається його умовним розподілом заданим і розподілом . Якщо обчислити «безумовний» розподіл то знайдемо . ( y i j ) μ i μ i y i j y i jN ( μ , σ 2 b + σ 2 w )уij(уij)мкiмкiуijуijN(мк,σб2+σш2)

Дивіться слайд 24 та слайд 25 тут для кращих зображень (для збереження накладок потрібно зберегти pdf-файл, не дивіться онлайн-версію).


1
(+1) Дуже приємні цифри!
Амеба каже: Відновити Моніку

1
Дякую @amoeba, мій код за інерційні моменти є в моєму блозі: stla.github.io/stlapblog/posts/Variance_inertia.html
Stéphane Laurent

Я не розумію. Якщо у мене є ряд вимірювань, виконаних рядом технічних працівників, навіщо мені потрібно ANOVA? Чи можу я не просто підходити до гаусса до результатів кожного техніка, а отримувати та для кожного з них? Що дозволяє твій спосіб вирішити це, що я не можу зробити? мкσ
TheChimera

@ TheChimera ANOVA - це припущення про звичайну . Ви отримуєте коротший інтервал довіри з цим припущенням. Але ваш коментар стосується причин використання ANOVA із загальною дисперсією проти ANOVA з різними відхиленнями, тут насправді це не тема. σ
Стефан Лоран

@ StéphaneLaurent Який ANOVA є припущенням звичайної ? - також, для чого подібне ? Ви сказали: "Якщо ви зацікавлені в оцінці μ1, μ2, μ3 (наприклад, для оцінки зміщення між операторами), тоді вам доведеться використовувати модель ANOVA з фіксованими ефектами". Яка формула методу ANOVA з фіксованими ефектами, і як він повідомляє вас про не повідомляючи вас про ? Крім того, як він може дати вам оцінку не надаючи всієї необхідної інформації для обчислення ? (і навпаки для моделі випадкових ефектів)σ μ i σ 2 b μ i σ 2 wσσмкiσб2мкiσш2
TheChimera

16

В основному, я вважаю, що найрізноманітніша різниця, якщо моделювати фактор як випадковий, полягає в тому, що вважається, що ефекти будуть виведені із звичайного нормального розподілу.

Наприклад, якщо у вас є якась модель щодо оцінок і ви хочете врахувати дані своїх учнів, що надходять з різних шкіл, і ви моделюєте школу як випадковий фактор, це означає, що ви припускаєте, що середні школі зазвичай розподіляються. Це означає, що моделюють два джерела варіації: мінливість школярів у школі та мінливість між школою.

Це призводить до того, що називається частковим об'єднанням . Розглянемо дві крайності:

  1. Школа не робить ніякого ефекту (між шкільною мінливістю дорівнює нулю). У цьому випадку лінійна модель, яка не враховує школу, була б оптимальною.
  2. Змінність у школі більша, ніж мінливість учнів. Тоді вам в основному потрібно працювати на рівні школи замість рівня учнів (менше # зразків). Це в основному модель, коли ви обліковуєте школу за допомогою фіксованих ефектів. Це може бути проблематично, якщо у вас є кілька зразків у школі.

Оцінюючи мінливість на обох рівнях, змішана модель робить розумний компроміс між цими двома підходами. Особливо, якщо у вас не так багато # студентів у школі, це означає, що ви отримаєте зменшення ефектів для окремих шкіл, як оцінюється за моделлю 2, до загального середнього значення моделі 1.

Це тому, що в моделях сказано, що якщо у вас є одна школа з двома учнями, що краще, ніж те, що є «нормальним» для населення шкіл, то, ймовірно, частина цього ефекту пояснюється тим, що школі пощастило у виборі з двох учнів дивилися. Це не робить наосліп, це робить це залежно від оцінки мінливості школи. Це також означає, що рівні ефектів з меншою кількістю вибірок сильніше тягнуться до загальної середньої величини, ніж великі школи.

Важливим є те, що вам потрібна обмінність на рівнях випадкового фактора. Це означає, що в цьому випадку школи (за вашими знаннями) обмінні, і ви нічого не знаєте, що їх відрізняє (крім якогось посвідчення особи). Якщо у вас є додаткова інформація, ви можете включити її як додатковий фактор, достатньо, щоб школи могли обмінюватися умовами іншої інформації, що обліковується.

Наприклад, було б доцільно припустити, що дорослі особини 30 років, які проживають у Нью-Йорку, можуть бути обміненими залежно від статі. Якщо у вас є більше інформації (вік, етнічна приналежність, освіта), було б доцільно включити і цю інформацію.

ІНШЕ якщо у вас є дослідження з однією контрольною групою та трьома дико різними групами захворювань, не має сенсу моделювати групу як випадкову, оскільки конкретні захворювання не підлягають обміну. Однак багатьом людям настільки добре подобається ефект усадки, що вони все одно сперечаються за модель випадкових ефектів, але це вже інша історія.

Я зауважую, що я не надто вникав у математику, але в основному різниця полягає в тому, що модель випадкових ефектів оцінювала нормально розподілену помилку як на рівні шкіл, так і на рівні учнів, тоді як модель з фіксованим ефектом має помилку саме на рівень учнів. Особливо це означає, що кожна школа має свій рівень, який не пов'язаний з іншими рівнями загальним розподілом. Це також означає, що фіксована модель не дозволяє екстраполювати на учня школи, не включеного в вихідні дані, тоді як модель випадкових ефектів це робить, з мінливістю, що є сумою рівня школяра та мінливості шкільного рівня. Якщо вас конкретно зацікавила ймовірність, ми могли б працювати над цим.


1
(+1) Відмінна відповідь, на диво недооцінена. Я помітив заплутану друкарську помилку: "виключений" слід читати "включено". Крім цього: яка очікувана практична різниця між трактуванням школи як випадковим та постійним ефектом? Я розумію, що трактування як виправлене не дозволить передбачити результативність роботи учня з нової школи, але як бути з відмінностями від наявних даних? Скажімо, іншими фіксованими ефектами є стать, раса та вага учнів (що б не було). Чи впливає на школу як на випадковий / фіксований вплив на силу основних ефектів чи взаємодії, що цікавлять? Будь-які інші відмінності?
Амеба каже: Відновити Моніку

3
@amoeba Залишаючи послідовність убік, MSE за коефіцієнтом рівня студента може бути або більш, або менш ефективним у випадковій та фіксованій ефектах залежно, серед іншого, від рівня кореляції між студентом X та випадковим ефектом, чисельністю кластерів тощо . Кларк і Лінцер 2012 має моделювання результатів.
кон'югатприор

1
@conjugateprior Вау, велике спасибі за цей коментар! Я прочитав зв'язаний папір, і це найяскравіше пояснення проблеми, яке я бачив. Я витратив чималу кількість часу, читаючи тут різні резюме на CV про фіксовані / випадкові ефекти, але не міг зрозуміти, коли слід використовувати один над іншим та чому. Читання C&L зробило для мене багато речей набагато зрозумілішими. Можливо, ви хочете написати відповідь десь на резюме, представляючи резюме цього та / або супутніх робіт? Я провожу виграш на найбільш голосованій [змішаній моделі] темі і буду радий нагородити вас ще одним там.
амеба каже, що повернеться до Моніки

@Erik, я змінив, щоб виправити "часткове навчання" на "часткове об'єднання". Я думаю, що це була помилка, але вибачте, якщо це був призначений каламбур!
амеба каже, що повернеться до Моніки

2

У країні econ такі ефекти - це індивідуальні перехоплення (або константи), які не спостерігаються, але їх можна оцінити, використовуючи дані панелі (повторне спостереження за тими ж одиницями протягом часу). Метод оцінки фіксованих ефектів дозволяє співвідносити між перехопленнями, характерними для одиниці, та незалежними пояснювальними змінними. Випадкові ефекти не мають. Витрати на використання більш гнучких фіксованих ефектів полягають у тому, що ви не можете оцінити коефіцієнт для змінних, які інваріантні за часом (наприклад, стать, релігія чи раса).

Примітка. Інші поля мають свою термінологію, яка може бути досить заплутаною.


(-1) це нічого не говорить про математичну різницю між фіксованими та випадковими ефектами
Макрос

1
@Macro Погодився. Перш ніж це з’явиться, було б корисно дізнатися, чи є термінологія екон те, що шукає ОП. Я повинен був бути більш зрозумілим у цьому.
Мастеров Дмитро Васильович

ДОБРЕ. У цьому випадку це може бути більш доречним як коментар, чи не сказали б ви?
Макрос

Заява "Вартість використання більш гнучких фіксованих ефектів полягає в тому, що ви не можете оцінити коефіцієнт для змінних, які інваріантні за часом", просто не відповідає дійсності. Я щойно робив симуляцію, коли ви повторювали вимірювання на окремих людей та єдиний бінарний предиктор, який не змінюється за часом. Якщо ви включите фіксований ефект для ідентифікатора та один для двійкового предиктора, ви, безумовно, можете оцінити коефіцієнт по двійковому предиктору (хоча, я визнаю, якщо у вас не багато повторних вимірювань, оцінка має велика стандартна помилка).
Макрос

3
Ендрю Гельман (який не є економістом) у своєму документі ANOVA перелічує 5 різних визначень: stat.columbia.edu/~gelman/research/publish/banova7.pdf .
Мастеров Димитрій Вікторович

2

У стандартному програмному пакеті (наприклад, R lmer) основна відмінність:

  • фіксовані ефекти оцінюються за максимальною вірогідністю (найменші квадрати для лінійної моделі)
  • випадкові ефекти оцінюються емпіричним Байесом (найменші квадрати з деякою усадкою для лінійної моделі, де параметр усадки вибирається з максимальною вірогідністю)

Якщо ви є баєсець (напр., WinBUGS), реальної різниці немає.


3
Я категорично не згоден з тим, що різниці немає. Ви можете встановити байєсівську модель фіксованих ефектів з усіма коефіцієнтами, що мають окремі пріори, або баєсову змішану модель, де є гіперпараметри.
Ерік

Якщо ви час байесовский різницеві виглядає як це .
кон'югатприор

@Simon - це точна і чітка відповідь. Я мав би згадати це довгий час назад.
Subhash C. Davar

-3

@Joke Модель з фіксованими ефектами передбачає, що розмір ефекту, що генерується дослідженням (або експериментом), є фіксованим, тобто повторні вимірювання для втручання виявляються однаковими за розміром ефекту. Імовірно, зовнішні та внутрішні умови експерименту не змінюються. Якщо у вас є кілька випробувань та / або досліджень у різних умовах, у вас будуть різні розміри ефектів. Параметричні оцінки середнього та дисперсійного набору для набору розмірів ефектів можуть бути реалізовані, якщо припустити, що це фіксовані ефекти, або це випадкові ефекти (реалізовані від суперпопуляції). Я думаю, що це питання, яке можна вирішити за допомогою математичної статистики.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.