Коли включити випадковий ефект у модель


9

Я новачок у змішаному моделюванні, і я розгублений, чи доцільно використовувати випадковий ефект у аналізі, який я роблю. Будь-яка порада буде вдячна.

моє дослідження перевіряє, наскільки добре розроблений індекс кількості ссавців може передбачити значення встановленого, але більш трудомісткого показника. я вимірював ці показники в декількох лісових ділянках, з кількома ділянками в кожному лісовому патчі.

тому що мене безпосередньо не цікавить ефект лісових патчів, і тому, що мої вибіркові ділянки вкладені в лісові патчі, ive використовував лісовий патч як випадковий ефект. Однак у мене є кілька запитань з цього приводу:

по-перше, я знаю, що випадкові ефекти дозволяють узагальнити результати на всіх можливих рівнях випадкового фактора, а не лише на ті, які ви взяли на вибірку. але мені здається, що для здійснення такого роду висновків ваші рівні повинні бути вибірковими? Мої лісові ділянки не були вибірені випадковим чином, тож я все ще можу їх використовувати як випадковий ефект?

по-друге, я читав, що ви можете перевірити, чи потрібно мати випадковий ефект, зробивши, наприклад, тест на коефіцієнт ймовірності, щоб порівняти моделі з ефектом і без нього. Я це зробив, і це говорить про те, що модель випадкових ефектів не пояснює дані, а також лише модель з фіксованими ефектами. моя проблема з цим полягає в тому, що мої ділянки все ще вкладені в лісові ділянки, і, мабуть, не є незалежними. тож чи можу я використовувати цей підхід LRT для виправдання виключення випадкового ефекту, чи мені все ж потрібно включити його для врахування гніздовості? і якщо я все-таки видаляю випадковий ефект, чи є спосіб перевірити, що ділянки в межах лісових ділянок можна вважати незалежними?

Спасибі за вашу допомогу!

Джей


Я думаю, що головна концептуальна річ із випадковими ефектами полягає в тому, що всі вони повинні бути приблизно однакової величини та бути обмінними - саме це робить можливим висновок про невибірені випадкові ефекти. Крім того, вам слід бути обережними, використовуючи тести LR для випадкових ефектів, оскільки може виникнути значна невизначеність щодо компонента дисперсії, навіть якщо оцінка ML / REML дорівнює нулю або близька до нуля.
ймовірністьлогічний

Велике спасибі за те
сойка

З того, що я розумію, найкраще не робити порівняння LR з моделями, підходящими REML. Наприклад, у літрі R слід встановити REML = FALSE під час виконання LRT. (Значення за замовчуванням відповідає TRUE, що інакше краще.)
Wayne

Відповіді:


6

Як я розумію, у вас є проста вкладена конструкція спостереження (графіки в межах виправлень), і ваш інтерес полягає в кореляції / регресії між двома безперервними змінними (двома індексами). Ваш розмір вибірки становить m патчів xn plot = N N пар спостережень (або відповідних запальних, якщо їх не збалансовано). Жодної належної рандомізації не було, але, можливо, ви можете / хочете / хочете врахувати, що (1) патчі були "випадковим чином" вибрані з усіх патчів такого типу або в якійсь області, а потім (2) сюжети були "випадковим чином" вибрано в межах кожного виправлення.

Якщо ви ігноруєте випадковий фактор Patch, ви можете псевдорепликувати, вважаючи, що ви вибрали випадковим чином N ділянок «вільно», не обмежуючи їх (за кількістю чи типом) у цих (раніше) обраних патчах.

Отже, ваше перше запитання: так, саме це дозволяє випадковий фактор. Обгрунтованість такого висновку залежить від обґрунтованості припущення, що випадковий вибір є еквівалентним випадковому вибору патчів (наприклад, що ваші результати не були б різними, якби був обраний інший набір лісових патчів). Це також обмежує ваш простір висновку: вид лісу чи географічна зона, на яку поширюються ваші результати, залежить від максимальної (уявної) популяції патчів, звідки ваш зразок є надійною "випадковою" вибіркою. Можливо, ваші спостереження є "розумним випадковим" зразком ссавців лісових ділянок у вашому регіоні, але це було б підозріло зведеним зразком ссавців всього континенту.

Другий: тест залежатиме від "ступеня псевдорепликації" або від доказів у вашій вибірці про те, що ділянки "належать" до патчів. Це, скільки варіацій існує між патчами та серед сюжетів у межах патчів (пошук внутрішньокласової кореляції). В крайньому випадку, лише виправлення між патчами є (ділянки всередині патча однакові), і у вас є "чиста псевдорепликація": ваш N повинен бути кількістю патчів, а вибірка одного або багатьох ділянок з кожного з них не забезпечує нова інформація. З іншого боку, всі варіації трапляються між ділянками, і немає зайвих варіацій, пояснених знанням, до якого лісового патча належить кожна ділянка (і тоді модель без випадкового фактора виявиться більш парсимонічною); у вас є "незалежні" сюжети. НІКОЛІ крайніх випадків, швидше за все, не станеться ... особливо для біологічних змінних, що спостерігаються на місцях, хоча б через просторову автокореляцію та географічний розподіл ссавців. Я особисто вважаю за краще зберігати фактори за допомогою дизайну (наприклад, навіть коли патчі не є відповідним джерелом зміни В ЦЬОМУ ЗРАЗКІ), щоб підтримувати "експериментально-спостережувальну" аналогію, пояснену вище; пам’ятайте: відсутність у вашому зразку доказів для відхилення нульової гіпотези про те, що варіація між виправленнями дорівнює нулю, не означає, що варіація в нульовій сукупності. навіть коли патчі не є важливим джерелом зміни В ЦЬОМУ ЗРАЗІ) для підтримання "експериментально-спостережної" аналогії, поясненої вище; пам’ятайте: відсутність у вашому зразку доказів для відхилення нульової гіпотези про те, що варіація між виправленнями дорівнює нулю, не означає, що варіація в нульовій сукупності. навіть коли патчі не є важливим джерелом зміни В ЦЬОМУ ЗРАЗІ) для підтримання "експериментально-спостережної" аналогії, поясненої вище; пам’ятайте: відсутність у вашому зразку доказів для відхилення нульової гіпотези про те, що варіація між виправленнями дорівнює нулю, не означає, що варіація в нульовій сукупності.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.