За яких умов слід використовувати багаторівневий / ієрархічний аналіз?


36

За яких умов хтось повинен розглянути можливість використання багаторівневого / ієрархічного аналізу на відміну від більш базових / традиційних аналізів (наприклад, ANOVA, регресія OLS тощо)? Чи існують ситуації, в яких це можна вважати обов'язковим? Чи існують ситуації, коли використання багаторівневого / ієрархічного аналізу недоцільно? Нарешті, які хороші ресурси для початківців для вивчення багаторівневого / ієрархічного аналізу?


3
Дивіться також: stats.stackexchange.com/a/38430/5739
StasK

Відповіді:


22

Коли структура ваших даних є природно ієрархічною або вкладеною, багаторівневе моделювання є хорошим кандидатом. Загалом, це один метод моделювання взаємодій.

Природним прикладом є те, коли ваші дані складаються з такої організованої структури, як країна, штат, райони, де ви хочете вивчити ефекти на цих рівнях. Інший приклад, коли ви можете підходити до такої структури, - це поздовжній аналіз, де ви повторювали вимірювання у багатьох суб'єктів протягом часу (наприклад, деяка біологічна відповідь на дозу препарату). Один рівень вашої моделі передбачає групову середню відповідь для всіх предметів протягом часу. Інший рівень вашої моделі тоді дозволяє збурення (випадкові ефекти) з групового середнього, моделювати індивідуальні відмінності.

Популярною і хорошою книгою для початку є аналіз даних Гельмана за допомогою регресії та багаторівневих / ієрахічних моделей .


3
Я другий на цю відповідь і просто хотів би додати ще одне чудове посилання на цю тему: Текст прикладного поздовжнього аналізу даних Сінгера < gseacademic.harvard.edu/alda >. Хоча він характерний для поздовжнього аналізу, він дає хороший огляд MLM в цілому. Я також вважав багаторівневий аналіз Snidjers та Bosker хорошим і читабельним < stat.gamma.rug.nl/multilevel.htm >. Джон Фокс також пропонує хороший вступ до цих моделей в R тут < cran.r-project.org/doc/contrib/Fox-Companion/… >.
Бретт

Дякую всім за ваші відповіді :) Чи не вдалося б більшість даних сприймати як природні ієрархічні / вкладені? Наприклад, у більшості психологічних досліджень існує ряд залежних змінних (анкети, відповіді на стимули тощо), які вкладаються у людей, які надалі вкладаються у дві або більше груп (випадково або невипадково присвоєні). Чи погоджуєтесь ви, що це є природно ієрархічною та / або вкладеною структурою даних?
Патрік

Якщо хтось із вас з багаторівневих / ієрархічних гуру міг витратити кілька хвилин, я був би вам дуже вдячний, якщо ви могли б зважитись на питання аналізу, поставлені в іншому пості ( stats.stackexchange.com/questions/1799/… ). Зокрема, чи вважаєте ви, що дані про сприйняття болю, викладені на цій посаді, були б краще проаналізовані за допомогою ієрархічного аналізу, ніж неієрархічні? Або це не змінило б і навіть було б недоречно? Спасибі: D
Патрік

18

У Центрі багаторівневого моделювання є кілька хороших безкоштовних онлайн-навчальних посібників для багаторівневого моделювання, і вони мають навчальні програми для встановлення моделей як у своєму програмному забезпеченні MLwiN, так і в STATA.

Прийміть це як єресь, тому що я прочитав не більше ніж розділ у книзі, але лінійні ієрархічні моделі: програми та методи аналізу даних Стівен У. Рауденбуш, Ентоні С. Брик дуже рекомендується. Я також поклявся, що у Springer Use R є книга про багаторівневе моделювання з використанням програмного забезпечення R! серія, але я зараз не можу її знайти (я думав, що її написали ті самі люди, які написали «Посібник для початківців до книги R»).

редагувати: Книга про використання R для багаторівневих моделей - це моделі змішаних ефектів та розширення в екології з R за Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA, Smith, GM

Щасти


9

Ось ще одна перспектива використання моделей багаторівневої та регресійної роботи: У цікавій роботі Афшартоуса та де Ліу вони показують, що якщо мета моделювання є прогностичною (тобто передбачити нові спостереження), вибір моделі відрізняється від того, коли мета - висновок (де ви намагаєтеся співставити модель зі структурою даних). Папір, яку я маю на увазі, є

Afshartous, D., de Leeuw, J. (2005). Прогнозування в багаторівневих моделях. J. Educat. Бехав. Статист. 30 (2): 109–139.

Я щойно знайшов тут ще один відповідний документ цих авторів: http://moya.bus.miami.edu/~dafshartous/Afshartous_CIS.pdf


6

уiс=αс+Хiс'βс+ϵiс,
уiсiсХiсβсαсϵiсαс

Маючи модель в руці, питання стає одним з оцінок. Якщо у вас багато шкіл і багато даних для кожної школи, приємні властивості OLS (див. Angrist and Pischke, Здебільшого нешкідливий ...(для поточного огляду) припускають, що ви хочете використати це за допомогою відповідних коригувань стандартних помилок для обліку залежностей та використання фіктивних змінних та взаємодій для отримання ефектів на шкільному рівні та перехоплення в школі. OLS може бути неефективним, але він настільки прозорий, що, можливо, буде простіше переконати скептичну аудиторію, якщо ви користуєтесь цим. Але якщо ваші дані певними способами є рідкісними, особливо якщо у вас є кілька спостережень для деяких шкіл, - можливо, ви захочете нав'язати проблему більше «структури». Можливо, вам захочеться "запозичити сили" у шкіл з більшим зразком, щоб покращити галасливі оцінки, які ви отримаєте в школах малого зразка, якби оцінка була зроблена без структури. Потім ви можете звернутися до моделі випадкових ефектів, оціненої за допомогою FGLS,

У цьому прикладі використання багаторівневої моделі (однак ми вирішимо її підходити, зрештою) мотивується прямим інтересом до перехоплювачів на рівні школи. Звичайно, в інших ситуаціях ці параметри на рівні групи можуть бути не що інше, як неприємність. Від того, чи потрібно вам підлаштовуватися під них (і, отже, все ще працювати з якоюсь багаторівневою моделлю), залежить від того, чи мають місце певні припущення щодо умовної екзогенності. З цього приводу я рекомендую ознайомитися з економетричною літературою щодо методів даних на панелі; більшість розумінь звідси переносяться на загальні згруповані контексти даних.


1
Це стара нитка, але якщо ви читаєте це: OLS з фіктивними змінними та взаємодіями не запозичує силу, як інші методи, про які ви згадуєте, правда? У мене є деякі дані, де я розбив свій аналіз на дві частини і використав дві lm (лінійна модель R) для моделювання двох частин. Я представив фіктивну змінну для позначення двох частин, потім знову використав lm на цій "уніфікованій" моделі, і відповіді близькі, але не однакові. Моє запитання було б: це відповідь "краща" чи просто інша через алгоритм?
Уейн

@Wayne: якщо ви використовували манекени та повний набір взаємодій у другій, точкові оцінки повинні бути однаковими. Стандартні помилки можуть відрізнятися, оскільки другий метод може передбачати більш високу ступінь свободи, але ви хочете перевірити, чи це правильне припущення моделювання.
Cyrus S

6

Багаторівневе моделювання підходить, як випливає з назви, коли ваші дані впливають на різні рівні (індивідуальні, з часом, над доменами тощо). Однорівневе моделювання передбачає, що все відбувається на найнижчому рівні. Інша річ, що робить багаторівнева модель - це ввести кореляції між вкладеними одиницями. Таким чином, одиниці рівня 1 в межах однієї одиниці рівня 2 будуть співвідноситись.

У певному сенсі можна розглядати багаторівневе моделювання як пошук середини між "індивідуалістичною помилкою" та "екологічною помилкою". Помилковість індивідуалістів - це коли ігноруються "ефекти спільноти", такі як сумісність стилю вчителя зі стилем навчання учня, наприклад (ефект, як вважається, походить від самої людини, тому просто робіть регресію на рівні 1). тоді як "екологічна помилка" - це навпаки, і це було б як припущення, що найкращий вчитель мав учнів з найкращими оцінками (і так, що рівень 1 не потрібен, просто регресуйте повністю на рівні 2). У більшості налаштувань це не підходить (студент-викладач - це "класичний" приклад).

yijj


4

Взагалі, говорячи про ієрархічний байєсівський аналіз (НВ), це призведе до ефективних та стабільних оцінок індивідуального рівня, якщо ваші дані не будуть такими, що ефекти окремих рівнів є абсолютно однорідними (нереальний сценарій). Оцінка ефективності та стабільних параметрів моделей НВ стає дійсно важливою, коли у вас є рідкісні дані (наприклад, менше нічистих даних, ніж відсутність параметрів на індивідуальному рівні) і коли ви хочете оцінити окремі оцінки рівня.

Однак моделі НВ не завжди легко оцінити. Тому, хоча аналіз НВ зазвичай перемагає аналіз, що не стосується НВ, вам доведеться зважувати відносні витрати та вигоди, виходячи з вашого минулого досвіду та ваших поточних пріоритетів за часом та витратами.

Сказавши, що якщо ви не зацікавлені в оцінках окремих рівнів, то ви можете просто оцінити сукупну модель рівня, але навіть у цих контекстах оцінка агрегуючих моделей за допомогою НВ за допомогою індивідуальних оцінок рівня може мати багато сенсу.

Підсумовуючи підсумок, встановлення моделей НВ - це рекомендований підхід, якщо у вас є час і терпіння, щоб їх відповідати. Потім ви можете використовувати сукупні моделі як орієнтир для оцінки продуктивності вашої моделі НВ.


Дякую за детальну відповідь, Срікант :) На даний момент я не знайомий з байєсівськими аналізами, але я одна з тем, яку я мав намір дослідити. Чи відрізняється ієрархічний байєсівський аналіз від інших багаторівневих / ієрархічних аналізів, обговорюваних на цій сторінці? Якщо так, чи є у вас рекомендований ресурс для зацікавлених сторін, щоб дізнатися більше?
Патрік

βiN(β¯,Σ)β¯N(.,.)

4

Я дізнався у Snijders та Bosker, багаторівневий аналіз: вступ до базового та вдосконаленого багаторівневого моделювання. Думаю, це дуже вдало для початківця, це повинно бути, тому що я є тиконом, де це стосується, і це мало сенс для мене.

Я також другий, як Гельман і Хілл, справді геніальна книга.


1

Багаторівневі моделі слід використовувати, коли дані вкладені в ієрархічну структуру, особливо коли є значні відмінності між одиницями вищого рівня в залежній змінній (наприклад, орієнтація на досягнення студентів залежить від студентів, а також між класами, з якими студенти вкладені). У цих умовах спостереження кластеризовані, а не незалежні. Неврахування кластеризації призводить до недооцінки помилок оцінок параметрів, упередженого тестування значущості та тенденції до відхилення нуля при його збереженні. Обґрунтування використання багаторівневих моделей, а також ґрунтовне пояснення способів проведення аналізів надано

Рауденбуш, SW Брайк, AS (2002). Ієрархічні лінійні моделі: програми та методи аналізу даних. 2-е видання. Ньюбері-Парк, Каліфорнія: Сейдж.

Книга науково-дослідних робіт також добре поєднується з програмним пакетом HLM авторів, що дуже допомагає в навчанні цього пакету. Пояснення того, чому необхідні багаторівневі моделі і переважні деякі альтернативи (наприклад, манекена, що кодує одиниці вищого рівня), надається в класичному документі

Гофман, Д.А. (1997). Огляд логіки та обгрунтування лінійних ієрархічних моделей. Журнал управління, 23, 723-744.

Папір Hoffman можна завантажити безкоштовно, якщо ви Google "Hoffman 1997 HLM" та отримаєте доступ до pdf в Інтернеті.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.