Кластеризовані стандартні помилки проти багаторівневого моделювання?


18

Я проглянув кілька книг (Рауденбуш і Брик, Сніджерс і Боскер, Гельман і Хілл та ін.) Та кілька статей (Гельман, Юсько, Примо та Якобсмієр тощо), і я все ще не дуже обертав голову основні відмінності між використанням кластеризованих стандартних помилок віршів багаторівневого моделювання.

Я розумію частини, які стосуються дослідницького питання; є певні типи відповідей, які можна отримати лише при багаторівневому моделюванні. Однак, наприклад, для дворівневої моделі, де ваші коефіцієнти інтересу знаходяться лише на другому рівні, яка перевага використання одного методу над іншим? У цьому випадку я не переживаю робити прогнози або витягувати окремі коефіцієнти для кластерів.

Основна відмінність, яку я зміг знайти, полягає в тому, що кластерні стандартні помилки страждають, коли кластери мають неоднакові розміри вибірки, і що багаторівневе моделювання є слабким, оскільки воно передбачає специфікацію розподілу випадкових коефіцієнтів (тоді як використання кластеризованих стандартних помилок не моделює) .

Зрештою, чи все це означає, що для моделей, які могли ніби використовувати будь-який метод, ми повинні отримувати подібні результати за коефіцієнтами та стандартними помилками?

Будемо дуже вдячні за будь-які відповіді чи корисні ресурси.


6
Користувач Stask має гарну відповідь саме на це питання .
Andy W

Спасибі. Я це читав раніше, що насправді зробило мене більш скептичним щодо реальних переваг. Однак, мабуть, справжня мотивація мого питання полягає в тому, щоб побачити, чи я взагалі підтверджений, думаючи, що це не надто корисно, якщо я дивлюсь лише на коефіцієнти другого рівня як на цікаві. Крім того, можливо, я пропустив це, але я не думаю, що цей пост вирішував, чи повинні ці два методи давати подібні результати (якщо допущення обох методів виконано).
RickyB

1
Під "коефіцієнтами на другому рівні" ви маєте на увазі рівень, де ви параметри першого етапу як залежні змінні?
sheß

Так, це я маю на увазі.
RickyB

Відповіді:


1

Ця публікація базується на особистому досвіді, який може бути специфічним для моїх даних, тому я не впевнений, що це кваліфікується як відповідь.

Я пропоную використовувати моделювання, якщо можливо, щоб оцінити, який метод найкраще підходить для ваших даних. Я зробив це і з подивом виявив, що тести (щодо параметрів першого рівня), засновані на багаторівневому моделюванні, перевершували будь-який інший метод (потужний), зберігаючи розмір навіть у невеликих зразках з невеликими та нерівномірними розмірами "кластерів". Я ще не повинен знайти документ, який би сказав про це, і, як я бачу, це насправді не є нішевою темою і заслуговує на більшу увагу. Я думаю, що недостатньо досліджено, як різні методи порівнюють відносно кінцевої вибірки або кількох / нерівних кластерів.


Дякую за Ваш коментар Чи буває у вас якийсь документ, де ви записали свої результати? Мені було б дуже цікаво поглянути на це і побачити те, що ви знайшли (і, звичайно, я б не процитував, не ділив і не вдосконалював це, не обговорюючи це з вами).
RickyB
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.