У чому полягає перевага розгляду фактора як випадкового в змішаній моделі?


24

У мене є проблема з перевагами позначення фактора моделі як випадкового з кількох причин. Мені здається, що майже у всіх випадках оптимальним рішенням є трактування всіх факторів як фіксованих.

По-перше, відмінність фіксованого проти випадкового є досить довільною. Стандартне пояснення полягає в тому, що якщо хтось зацікавлений у конкретних експериментальних одиницях сам по собі, то слід використовувати фіксовані ефекти, і, якщо хтось зацікавлений у сукупності, представленій експериментальними одиницями, слід використовувати випадкові ефекти. Це не дуже допомагає, оскільки це означає, що можна чергувати між фіксованими та випадковими видами, навіть якщо дані та експериментальний дизайн залишаються однаковими. Також це визначення сприяє ілюзії, що якщо фактор позначений як випадковий, то висновок, виведений з моделі, якимось чином більше застосовується для населення, ніж у випадку, коли фактор позначений як фіксований. Нарешті, Гельман показує, що фіксований випадковий відмінність є заплутаним навіть на рівні визначення, оскільки є ще чотири визначення того, що таке фіксовані та випадкові ефекти.

По-друге, оцінка змішаних моделей досить складна. На відміну від "чисто фіксованої" моделі, існує більше ніж декілька способів отримання p-значень. Проф. Бейтс, який реалізував оцінку REML в пакеті lme4 в R, пішов настільки далеко, що відмовився взагалі повідомляти р-значення. .

По-третє, виникає мутне питання про те, скільки неявних параметрів вводиться випадковим фактором. Наступний приклад - це моя адаптація цього в Burnham & Anderson, вибір моделі та мультимодельний висновок: практичний інформаційно-теоретичний підхід . З точки зору компромісного відхилення, роль випадкових ефектів можна проілюструвати наступним чином. Розглянемо одну сторону ANOVA з лікування і ефектів основний фактор, з яких є поважний. Термін помилки має розподіл. Якщо кількість спостережень буде фіксованою, компроміс з відхиленням зміститься погіршується, коли зростатиме. Припустимо, ми скажемо, щоK K - 1 N ( 0 , σ 2 ) K K N ( 0 , σ K )ККК-1N(0,σ2)ККосновні ефекти отримуються з розподілу . Відповідна модель матиме складність, яка знаходиться десь між фіксованою (надмірно встановленою) версією та недоопрацьованою моделлю, яка містить лише перехоплення. Кількість ефективних параметрів у нерухомій моделі становитьN(0,σК)

1iнтеrcеpт+(К-1)маiнеffеcтс+1σ=К+1.

Кількість ефективних параметрів у випадковій моделі становить щонайменше три: . Крім того, випадкова модель має ряд «прихованих» параметрів, що мають на увазі розподільне (нормальне в даному випадку) обмеження, накладене на основні ефекти.iнтеrcеpт,σ,σК

Зокрема, якщо є фактор з двома рівнями, не має сенсу називати це випадковим, навіть якщо ми точно знаємо, що його рівні були взяті вибірково у деякої сукупності. Це тому, що версія з фіксованим ефектом має три параметри, а версія з випадковим ефектом має понад три параметри. У цьому випадку випадкова модель виявляється більш складною, ніж фіксована версія. Мабуть, перехід від фіксованої до випадкової версії є більш обґрунтованим для більшогоК. Однак кількість “прихованих” параметрів у випадковій моделі невідома, тому неможливо порівняти фіксовану та випадкову версії на основі інформаційних критеріїв, таких як AIC. Тому, хоча цей приклад висвітлює внесок випадкових ефектів (можливість кращого відхилення відхилення відхилення), він також показує, що важко сказати, коли виправдано відновити коефіцієнт від фіксованого до випадкового.

Жодна з перерахованих вище проблем не існує в «чисто фіксованій» моделі. Тому я готовий запитати:

  1. Чи може хтось навести приклад, коли трапилось щось дуже погане, коли використовувався випадковий коефіцієнт, як ніби він був зафіксований? Я вважаю, що повинні бути деякі імітаційні дослідження, які чітко вирішують це питання.

  2. Чи є перевірений кількісний метод, який вирішує, коли має сенс перейти від фіксованої до випадкової мітки?


Добре написане запитання, і я дізнався кілька речей, прочитавши його. Мені цікаво, чи аналіз випадкових ефектів зрештою приречений, зрештою, може бути вибитий більш простими методами вирівнювання. Якщо я все-таки спробую відповісти №1, я піду для ситуації з великою мінливістю, багатьма предметами та невеликими розмірами вибірки всередині теми. Тоді фіксовані оцінки за темою будуть повсюдно.
Бен Огорек

Відповіді:


20

1. Відомий приклад психології та лінгвістики описує Герб Кларк (1973; наступний за Колманом, 1964): "Помилковість мови як фіксованого ефекту: критика мовної статистики в психологічних дослідженнях".

Кларк - психолінгвіст, який обговорює психологічні експерименти, в яких вибірки суб'єктів дослідження дають відповіді на набір стимулюючих матеріалів, звичайно різних слів, витягнутих з якогось корпусу. Він вказує, що стандартна статистична процедура, що застосовується в цих випадках, заснована на повторних заходах ANOVA і названа Кларком як , розглядає учасників як випадковий фактор, але (можливо, неявно) розглядає матеріали стимулу (або "мову") як зафіксовано Це призводить до проблем з інтерпретацією результатів тестів гіпотез про фактор експериментального стану: природно, ми хочемо припустити, що позитивний результат говорить щось про населення, з якого ми взяли вибірку учасника, а також про теоретичну сукупність, з якої ми черпали мовні матеріали. Але FЖ1 , трактуючи учасників як випадкові та стимули як фіксовані, лише нам розповідає про вплив фактору стану на інших подібних учасників, що реагують наті самі стимули. Проведенняаналізу F 1, коли і учасників, і подразників більш доцільно розглядати як випадкові, може призвести до частоти помилок типу 1, які істотно перевищують номінальнийрівень α - зазвичай 0,05 - залежно від таких факторів, як кількість та мінливість стимули та конструкція експерименту. У цих випадках більш відповідним аналізом, принаймні в класичній рамці ANOVA, є використання того, що називається квазі- F статистикою на основі співвідношеньлінійних комбінаційЖ1Ж1αЖ середні квадрати.

Робота Кларка зробила сплеск у психолінгвістиці в той час, але не змогла зробити великий пробіл у більш широкій психологічній літературі. (І навіть у межах психолінгвістики поради Кларка з роками дещо спотворилися, як це підтверджено документами Raaijmakers, Schrijnemakers, & Gremmen, 1999.) Але в останні останні роки питання спостерігається щось пожвавлення, що значною мірою пояснюється статистичним прогресом. у моделях зі змішаними ефектами, з яких класичну змішану модель ANOVA можна розглядати як окремий випадок. Деякі з цих останніх робіт включають Baayen, Davidson, & Bates (2008), Murayama, Sakaki, Yan, & Smith (2014) та ( ahem ) Judd, Westfall, & Kenny (2012). Я впевнений, що я забуваю деякі.

2. Не зовсім. Там є методи отримання на чи фактор краще включений як випадковий ефект чи ні в моделі взагалі (дивітьсянаприклад, Пінєйро & Bates, 2000., стор 83-87 ;. Однак см Барр, Левіті, Шіперс, & Tily, 2013). І звичайно, є класичні методи порівняння моделей для визначення того, чи є фактор краще включеним як фіксований ефект чи взагалі немає (тобто -тести). Але я вважаю, що на визначення того, чи є той чи інший фактор краще розглядати як фіксований або випадковий, як правило, краще залишити концептуальне питання, на яке слід відповісти, розглядаючи дизайн дослідження та характер висновків, які слід зробити з нього.Ж

Один з моїх випускників викладачів статистики, Гері МакКлелленд, любив говорити, що, можливо, основним питанням статистичного умовиводу є: "У порівнянні з чим?" Слідом за Гері, я думаю, що ми можемо поставити концептуальне питання, про яке я згадував вище: « Що таке референтний клас гіпотетичних експериментальних результатів, з якими я хочу порівнювати свої фактичні спостережувані результати? Залишаючись у контексті психолінгвістики та розглядаючи експериментальний дизайн, у якому ми маємо зразок Суб'єктів, що відповідають зразку Слова, класифікованого в одній із двох Умов (конкретний дизайн, який довго обговорював Кларк, 1973), я зупинюсь на дві можливості:

  1. Сукупність експериментів, в яких для кожного експерименту ми малюємо нову вибірку Предметів, новий зразок Слова та новий зразок помилок із генеративної моделі. За цією моделлю Тематика та Слова є випадковими ефектами.
  2. Сукупність експериментів, в яких для кожного експерименту ми малюємо новий зразок Предметів та новий зразок помилок, але ми завжди використовуємо той самий набір Слова . За цією моделлю Предмети - це випадкові ефекти, але слова - це фіксовані ефекти.

Щоб зробити це повністю конкретним, нижче наведено деякі сюжети (зверху) 4 набори гіпотетичних результатів із 4 модельованих експериментів за Моделею 1; (нижче) 4 набори гіпотетичних результатів із 4-х модельованих експериментів у Моделі 2. Кожен експеримент розглядає результати двома способами: (ліві панелі), згруповані за Суб'єктами, при цьому засоби Subject-by-Condition накреслюються та зв'язані разом для кожного предмета; (праві панелі), згруповані за словами, з графіками поля, що підсумовують розподіл відповідей на кожне слово. Всі експерименти включають 10 суб'єктів, що відповідають на 10 слів, і в усіх експериментах "нульова гіпотеза" про відсутність різниці в стані є вірною у відповідній сукупності.

Тематика та слова обидва випадкові: 4 модельовані експерименти

both_random

Зауважте тут, що в кожному експерименті профілі відповідей для Тематики та Слова абсолютно різні. Для Суб'єктів ми іноді отримуємо низькі загальні відгуки, іноді високі відгуки, іноді Суб'єкти, які мають тенденцію проявляти великі відмінності в стані, а іноді Суб'єкти, які мають тенденцію показувати невелику різницю Умов. Точно так само і для Слова ми іноді отримуємо слова, які прагнуть викликати низьку відповідь, а іноді отримують слова, які схильні викликати високу відповідь.

Суб'єкти випадкові, виправлені слова: 4 імітовані експерименти

subs_random

Зауважте тут, що у чотирьох модельованих експериментах Суб'єкти кожен раз виглядають по-різному, але профілі відповідей для Слова виглядають в основному однаково, що відповідає припущенню, що ми використовуємо один і той же набір Слова для кожного експерименту за цією моделлю.

Наш вибір, чи ми вважаємо, що модель 1 (суб'єкти та слова як випадкові), чи модель 2 (суб'єкти випадкові, виправлені слова) забезпечує відповідний опорний клас для експериментальних результатів, які ми насправді спостерігали, може мати велике значення для нашої оцінки того, чи маніпулювання умовою "працював". Ми очікуємо, що більше шансів зміни даних у моделі 1, ніж у моделі 2, оскільки є більше "рухомих деталей". Отже, якщо висновки, які ми хочемо зробити, більш узгоджуються з припущеннями Моделі 1, де мінливість шансів порівняно більша, але ми аналізуємо наші дані під припущеннями моделі 2, де мінливість шансів порівняно нижча, то наша помилка типу 1 коефіцієнт для тестування різниці станів буде певною (можливо, досить великою) завищеною. Для отримання додаткової інформації дивіться Посилання нижче.

Список літератури

Baayen, RH, Davidson, DJ, & Bates, DM (2008). Моделювання змішаних ефектів із схрещеними випадковими ефектами для предметів та предметів. Журнал пам’яті та мови, 59 (4), 390-412. PDF

Barr, DJ, Levy, R., Scheepers, C., & Tily, HJ (2013). Структура випадкових ефектів для перевірки підтверджувальної гіпотези: Тримайте її максимально. Журнал пам’яті та мови, 68 (3), 255-278. PDF

Кларк, HH (1973). Помилковість мови як фіксованого ефекту: критика мовної статистики в психологічних дослідженнях. Журнал словесного навчання та вербальної поведінки, 12 (4), 335-359. PDF

Коулман, Е.Б. (1964). Узагальнення до мовної сукупності. Психологічні доповіді, 14 (1), 219-226.

Judd, CM, Westfall, J., & Kenny, DA (2012). Трактування стимулів як випадкового чинника соціальної психології: нове і всебічне рішення всеосяжної, але багато в чому ігнорованої проблеми. Журнал особистості та соціальної психології, 103 (1), 54. PDF

Мураяма, К., Сакакі, М., Ян, VX та Сміт, GM (2014). Інфляція помилок типу I в традиційному аналізі учасників до метамеморійної точності: узагальнена перспектива моделі змішаних ефектів. Журнал експериментальної психології: навчання, пам’ять та пізнання. PDF

Pinheiro, JC, & Bates, DM (2000). Моделі зі змішаними ефектами в S і S-PLUS. Спрингер.

Raaijmakers, JG, Schrijnemakers, J., & Gremmen, F. (1999). Як поводитися з "помилкою, що визначається мовою", загальні помилки та альтернативні рішення. Журнал пам’яті та мови, 41 (3), 416-426. PDF


1
+1 Це чудова відповідь, і ваш документ про 2012 рік дуже приємно прочитаний.
амеба каже, що повернеться до Моніки

оскільки початкове запитання вже пов'язане з чудовою дискусією, яка потрапляє в це питання - на що саме ви маєте на увазі?
Джеймс

1
Посилання Gelman
Джейк Вестпад

@James Я пішов вперед і додав ще декілька концептуальних речей, включаючи фотографії. Дайте мені знати, що ви думаєте.
Джейк Вестфалл

Дякую за фотографії. Відповідно до останнього абзацу, чим більше ефектів у моделі позначено випадковими, тим вище значення р для решти фіксованих ефектів. Однак для адитивної моделі це виглядає так, коли метод PROC MIXED використовується за замовчуванням, то значення p для фіксованого ефекту буде однаковим. Один конкретний приклад - це питання: stats.stackexchange.com/q/112640/54099 Як ви можете це пояснити?
Джеймс

1

Припустимо, у мене є виробничий процес, який передбачає виготовлення матеріалу на декількох різних верстатах. Вони єдині у мене машини, так що "машина" - це фіксований ефект. Але я роблю багато партій матеріалу на кожній машині і мені цікаво передбачити речі про майбутні партії. Я зроблю "Номер партії" випадковим фактором, тому що мене цікавлять результати, які я отримаю для майбутніх лотів.


1
Шановний Еміль: Боюся, ти не зрозумів питань, які я задав. Ваш приклад ілюструє найбільш поширене визначення "фіксований проти випадкового", яке я сам подав у своєму запитанні. У будь-якому випадку, використовуючи ваш приклад, чи можете ви сказати мені, чому це погана ідея робити висновок про майбутню відповідь з моделі, де число партії є фіксованим фактором?
Джеймс

Якщо ви розглядаєте "номер партії" як фіксований, ваші умовиводи застосовуватимуться лише до партій, які ви вже перевірили. В інших ситуаціях відбувається те саме. Якщо ви хочете зробити висновки про випадкові ефекти, то трактування їх як фіксованих ефектів, як правило, дасть неправильні відповіді. У багатьох змішаних модельних ситуаціях трактування випадкових ефектів як фіксованих ефектів навіть дасть неправильні відповіді щодо ефектів, які фактично є фіксованими.
Еміль Фрідман

Це не справа в бік проти, а вниз. Якщо робити невідповідний аналіз, результати, як правило, невірні.
Еміль Фрідман

Не могли б ви надати посилання на симуляційне дослідження, яке продемонструвало, як результат стає неправильним залежно від фіксованої / випадкової мітки?
Джеймс

Зауважте також, що MLE не приходить безкоштовно, особливо коли є компоненти дисперсії. Спробуйте створити схрещений факторний дизайн з 3 факторами і парою продовжуючих коваріатів. Потім спробуйте оцінити чисту фіксовану модель та кілька змішаних характеристик. Поки існує випадковий компонент, який спричиняє перехід від OLS до MLE / REML, більш імовірними є проблеми з конвергенцією, отриманням нульових або негативних дисперсійних компонентів або іншими безглуздими результатами.
Джеймс

1

Таким чином, ви ставитесь до них як до випадкових, так що між загальною середньою та середньою величиною для цього конкретного фактора виникає усереднюючий ефект на основі розміру вибірки фактора та загальної кількості спостережень. Це дозволяє сказати, що ваші результати стосуються загальної сукупності, оскільки у вас є тип середньозваженої середньої величини та оцінка варіації внаслідок цього коефіцієнта, якщо ні, то ви дійсно можете сказати, що ваші результати стосуються рівнів факторів Ви використовувались з моменту регресії, вони розглядають їх як дискретні фактори, а не випадкові, які отримують середньозважене усереднення.

Вони також корисні, коли ви повторювали заходи з тієї ж теми, оскільки ви можете використовувати їх для обліку співвідношення між заходами з тієї ж теми.


Що стосується RM, то це одна з причин, чому я задав питання в першу чергу. Як я вже згадував тут: stats.stackexchange.com/q/112640/54099 трактування суб'єкта як фіксованого або випадкового не змінює р-значення лікування, тому чому турбувати.
Джеймс

Якщо у вас є проста перекреслена конструкція з одним фіксованим фактором і одним випадковим випадком, і ви використовуєте Очікувані середні квадрати, значення p для фіксованого коефіцієнта буде відрізнятися від того, що ви отримали, якби ви ставились як до фіксованого.
Еміль Фрідман

1

Yij=β1Хij+β2Zi+еi+мкijХijZiβ2ZiiZi

Yij=β1Хij+еi+мкijZi

β1β1


(Оригінальна відповідь)

Одне місце, де вам по суті потрібно використовувати випадкові ефекти, це коли ви хочете включити параметри, які є інваріантними на рівні групування фіксованого ефекту.

Наприклад, скажіть, що ви хочете дослідити вплив особливостей лікаря (наприклад, / освіти) на результати пацієнтів. Набір даних на рівні пацієнта з спостережуваними результатами пацієнта та характеристиками пацієнта / лікаря. Оскільки, ймовірно, пацієнти, які отримують лікування одного лікаря, корелюють, ви хочете контролювати це. Тут ви можете вставити фіксований ефект лікаря, але, роблячи це, ви забороняєте включати будь-які характеристики лікаря у модель. Що проблематично, якщо інтерес до характеристик рівня лікаря.


Не могли б ви надати деякі моделі заяв?
Джеймс

0

Я думаю, що це пов'язано з узгодженістю оцінок.

хij=аi+бj+еаi

бj

Нейман і Скотт (1948) вказують на проблему послідовності

аiбj

аiбj

послідовний. Принаймні, так я зрозумів ...

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.