Підгонка багаторівневих моделей до складних даних опитування в R


11

Я шукаю поради щодо аналізу складних даних опитування з багаторівневими моделями в Р. Я використовував surveyпакет для зважування для неоднакових ймовірностей вибору в однорівневих моделях, але цей пакет не має функцій для багаторівневого моделювання. lme4Пакет відмінно підходить для багаторівневого моделювання, але це не так , що я знаю , щоб включати ваги на різних рівнях кластеризації. Аспарухов (2006) ставить проблему:

Багаторівневі моделі часто використовуються для аналізу даних конструкцій вибірки кластерів. Однак такі структури вибірки часто використовують неоднакову ймовірність вибору на рівні кластера та на індивідуальному рівні. Вагові вибірки призначаються на одному або обох рівнях для відображення цих ймовірностей. Якщо ваги вибірки ігноруються на будь-якому рівні, оцінки параметрів можуть бути істотно зміщені.

Один із підходів для дворівневих моделей - це багаторівневий псевдооцінка максимальної ймовірності (MPML), реалізований у MPLUS ( Asparouhov et al,? ). Carle (2009) розглядає основні програмні пакети та дає кілька рекомендацій щодо того, як діяти далі:

Щоб правильно проводити MLM зі складними даними опитування та проектними вагами, аналітикам потрібне програмне забезпечення, яке може включати ваги, масштабовані поза програмою, і включати "нові" масштабовані ваги без автоматичної модифікації програми. В даний час три основні програми програм MLM дозволяють це: Mplus (5.2), MLwiN (2.02) та GLLAMM. На жаль, ні HLM, ні SAS не можуть цього зробити.

Вест і Галецькі (2013) дають більш оновлений огляд, і я цитую детально відповідний уривок:

Інколи аналітики бажають підлаштовувати ЛММ для обстеження наборів даних, зібраних із зразків зі складною конструкцією (див. Heeringa et al, 2010, розділ 12). Складні зразкові конструкції, як правило, характеризуються поділом популяції на верстви, багатоступеневим відбором скупчень людей зсередини верств і неоднаковою ймовірністю відбору як для кластерів, так і для кінцевих осіб, що відбираються. Ці неоднакові ймовірності відбору, як правило, призводять до побудови вибіркової ваги для індивідуумів, що забезпечує неупереджену оцінку описових параметрів при їх включенні в аналіз. Ці ваги можуть бути додатково скориговані для невідповідності опитування та відкалібровані до відомих загальних чисел населення. Традиційно, Аналітики можуть розглянути підхід, заснований на дизайні, для включення цих складних характеристик вибірки при оцінці регресійних моделей (Heeringa et al., 2010). Зовсім недавно статистики почали досліджувати на основі моделей підходи до аналізу цих даних, використовуючи ЛММ для включення фіксованих ефектів проб прошарків та випадкових ефектів вибіркових кластерів.

Основною складністю при розробці модельних підходів до аналізу цих даних є вибір відповідних методів включення вибіркових ваг (див. Gelman, 2007 для підсумків питань). Pfeffermann et al. (1998), Аспарухов і Мутен (2006), Рабе-Хескет і Скрондал (2006) розробили теорію для оцінки багаторівневих моделей таким чином, щоб вони включали оглядові ваги, а також Рабе-Хескет і Скрондал (2006), Карл (2009) та Heeringa та ін. (2010, глава 12) представили додатки, використовуючи поточні програмні процедури, але це продовжує залишатися активною сферою статистичних досліджень. Програмні процедури, здатні відповідати ЛММ, знаходяться на різних етапах впровадження підходів, запропонованих у літературі до цих пір, для включення складних конструктивних особливостей, і аналітикам потрібно враховувати це при підключенні ЛММ до складних даних вибіркових опитувань. Аналітики, зацікавлені в пристосуванні ЛММ до даних, зібраних у результаті складних вибіркових опитувань, будуть залучені до процедур, які здатні правильно включити обстежувальні ваги до процедур оцінювання (HLM, MLwiN, Mplus, xtmixed та gllamm), що відповідає сучасній літературі в цій статті область.

Це підштовхує мене до питання: чи хтось має рекомендації щодо найкращої практики щодо пристосування ЛММ до складних даних опитування в R?


1
Привіт, Ерік, посилання на абзац, який починається i've never said it beforeз цієї публікації про адгезію, можуть зацікавити .. :(
Ентоні Даміко

1
@AnthonyDamico, посилання зараз розірвано :-(
Бен Болкер

@BenBolker це! вони змінили назву мікроданих, тому я також зробив :) нове місце: asdfree.com/search/label/…
Ентоні Даміко

Вибачте, якщо я неправильно інтерпретував ваше запитання, але я розумію, що ви зафіксували (відомі) ваги від проекту експерименту, і ви хочете використовувати лінійну змішану модель, що включає ці проектні ваги. lmerФункція в lme4пакеті дозволяє специфікацію weightsаргументу для процесу моделі облягаючих, так що якщо ви виправили конструкцію ваги, ви повинні бути в змозі включити їх з цим аргументом. У мене тут неправильний кінець палички? Чи є якась причина, що це неадекватно вашим потребам?
Бен - Відновити Моніку

Відповіді:


4

Наскільки я знаю, ви зараз не можете цього зробити в R, якщо вам потрібна змішана модель (наприклад, якщо ви дбаєте про компоненти дисперсії)

Аргумент ваг lme4::lmer() не робити те, що ви хочете, тому що lmer()трактує ваги як точність зважування, а не як вибіркове зважування. На відміну від звичайних лінійних та узагальнених лінійних моделей ви навіть не отримуєте правильних точкових оцінок з кодом, який розглядає вибіркові ваги як точність ваги для змішаної моделі.

Якщо вам не потрібно оцінювати компоненти дисперсії, і ви просто хочете, щоб багаторівневі функції моделі отримували правильні стандартні помилки, які ви можете використовувати survey::svyglm().


0

Пакет WeMix тепер є опцією, принаймні для лінійних та логістичних багаторівневих моделей. Здається, це дуже повільно, порівняно із запуском цих моделей у Stata або MPlus.


0

Я також стикаюся з тією ж проблемою. Багато разів шукаючи останні дні, я виявив, що пакет BIFIEsurvey є найбільш близьким до аналізу багаторівневих моделей зі складними даними опитування з вибіркою та копією ваги, а також правдоподібними значеннями: https://cran.r-project.org/web /packages/BIFIEsurvey/index.html Пакет, однак, обмежений дворівневими моделями. Я також читав, що автор пакету "intsvy" планує в довгостроковій перспективі зробити "intsvy" здатним аналізувати багаторівневі моделі, але на сьогоднішній день це все ще не може. Якщо є якийсь прогрес у вирішенні цієї проблеми, який я, можливо, випадково пропустив, я був би радий, якщо хтось може поділитися ним.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.