1. Відомий приклад психології та лінгвістики описує Герб Кларк (1973; наступний за Колманом, 1964): "Помилковість мови як фіксованого ефекту: критика мовної статистики в психологічних дослідженнях".
Кларк - психолінгвіст, який обговорює психологічні експерименти, в яких вибірки суб'єктів дослідження дають відповіді на набір стимулюючих матеріалів, звичайно різних слів, витягнутих з якогось корпусу. Він вказує, що стандартна статистична процедура, що застосовується в цих випадках, заснована на повторних заходах ANOVA і названа Кларком як , розглядає учасників як випадковий фактор, але (можливо, неявно) розглядає матеріали стимулу (або "мову") як зафіксовано Це призводить до проблем з інтерпретацією результатів тестів гіпотез про фактор експериментального стану: природно, ми хочемо припустити, що позитивний результат говорить щось про населення, з якого ми взяли вибірку учасника, а також про теоретичну сукупність, з якої ми черпали мовні матеріали. Але FЖ1 , трактуючи учасників як випадкові та стимули як фіксовані, лише нам розповідає про вплив фактору стану на інших подібних учасників, що реагують наті самі стимули. Проведенняаналізу F 1, коли і учасників, і подразників більш доцільно розглядати як випадкові, може призвести до частоти помилок типу 1, які істотно перевищують номінальнийрівень α - зазвичай 0,05 - залежно від таких факторів, як кількість та мінливість стимули та конструкція експерименту. У цих випадках більш відповідним аналізом, принаймні в класичній рамці ANOVA, є використання того, що називається квазі- F статистикою на основі співвідношеньлінійних комбінаційЖ1Ж1αЖ середні квадрати.
Робота Кларка зробила сплеск у психолінгвістиці в той час, але не змогла зробити великий пробіл у більш широкій психологічній літературі. (І навіть у межах психолінгвістики поради Кларка з роками дещо спотворилися, як це підтверджено документами Raaijmakers, Schrijnemakers, & Gremmen, 1999.) Але в останні останні роки питання спостерігається щось пожвавлення, що значною мірою пояснюється статистичним прогресом. у моделях зі змішаними ефектами, з яких класичну змішану модель ANOVA можна розглядати як окремий випадок. Деякі з цих останніх робіт включають Baayen, Davidson, & Bates (2008), Murayama, Sakaki, Yan, & Smith (2014) та ( ahem ) Judd, Westfall, & Kenny (2012). Я впевнений, що я забуваю деякі.
2. Не зовсім. Там є методи отримання на чи фактор краще включений як випадковий ефект чи ні в моделі взагалі (дивітьсянаприклад, Пінєйро & Bates, 2000., стор 83-87 ;. Однак см Барр, Левіті, Шіперс, & Tily, 2013). І звичайно, є класичні методи порівняння моделей для визначення того, чи є фактор краще включеним як фіксований ефект чи взагалі немає (тобто -тести). Але я вважаю, що на визначення того, чи є той чи інший фактор краще розглядати як фіксований або випадковий, як правило, краще залишити концептуальне питання, на яке слід відповісти, розглядаючи дизайн дослідження та характер висновків, які слід зробити з нього.Ж
Один з моїх випускників викладачів статистики, Гері МакКлелленд, любив говорити, що, можливо, основним питанням статистичного умовиводу є: "У порівнянні з чим?" Слідом за Гері, я думаю, що ми можемо поставити концептуальне питання, про яке я згадував вище: « Що таке референтний клас гіпотетичних експериментальних результатів, з якими я хочу порівнювати свої фактичні спостережувані результати? Залишаючись у контексті психолінгвістики та розглядаючи експериментальний дизайн, у якому ми маємо зразок Суб'єктів, що відповідають зразку Слова, класифікованого в одній із двох Умов (конкретний дизайн, який довго обговорював Кларк, 1973), я зупинюсь на дві можливості:
- Сукупність експериментів, в яких для кожного експерименту ми малюємо нову вибірку Предметів, новий зразок Слова та новий зразок помилок із генеративної моделі. За цією моделлю Тематика та Слова є випадковими ефектами.
- Сукупність експериментів, в яких для кожного експерименту ми малюємо новий зразок Предметів та новий зразок помилок, але ми завжди використовуємо той самий набір Слова . За цією моделлю Предмети - це випадкові ефекти, але слова - це фіксовані ефекти.
Щоб зробити це повністю конкретним, нижче наведено деякі сюжети (зверху) 4 набори гіпотетичних результатів із 4 модельованих експериментів за Моделею 1; (нижче) 4 набори гіпотетичних результатів із 4-х модельованих експериментів у Моделі 2. Кожен експеримент розглядає результати двома способами: (ліві панелі), згруповані за Суб'єктами, при цьому засоби Subject-by-Condition накреслюються та зв'язані разом для кожного предмета; (праві панелі), згруповані за словами, з графіками поля, що підсумовують розподіл відповідей на кожне слово. Всі експерименти включають 10 суб'єктів, що відповідають на 10 слів, і в усіх експериментах "нульова гіпотеза" про відсутність різниці в стані є вірною у відповідній сукупності.
Тематика та слова обидва випадкові: 4 модельовані експерименти
Зауважте тут, що в кожному експерименті профілі відповідей для Тематики та Слова абсолютно різні. Для Суб'єктів ми іноді отримуємо низькі загальні відгуки, іноді високі відгуки, іноді Суб'єкти, які мають тенденцію проявляти великі відмінності в стані, а іноді Суб'єкти, які мають тенденцію показувати невелику різницю Умов. Точно так само і для Слова ми іноді отримуємо слова, які прагнуть викликати низьку відповідь, а іноді отримують слова, які схильні викликати високу відповідь.
Суб'єкти випадкові, виправлені слова: 4 імітовані експерименти
Зауважте тут, що у чотирьох модельованих експериментах Суб'єкти кожен раз виглядають по-різному, але профілі відповідей для Слова виглядають в основному однаково, що відповідає припущенню, що ми використовуємо один і той же набір Слова для кожного експерименту за цією моделлю.
Наш вибір, чи ми вважаємо, що модель 1 (суб'єкти та слова як випадкові), чи модель 2 (суб'єкти випадкові, виправлені слова) забезпечує відповідний опорний клас для експериментальних результатів, які ми насправді спостерігали, може мати велике значення для нашої оцінки того, чи маніпулювання умовою "працював". Ми очікуємо, що більше шансів зміни даних у моделі 1, ніж у моделі 2, оскільки є більше "рухомих деталей". Отже, якщо висновки, які ми хочемо зробити, більш узгоджуються з припущеннями Моделі 1, де мінливість шансів порівняно більша, але ми аналізуємо наші дані під припущеннями моделі 2, де мінливість шансів порівняно нижча, то наша помилка типу 1 коефіцієнт для тестування різниці станів буде певною (можливо, досить великою) завищеною. Для отримання додаткової інформації дивіться Посилання нижче.
Список літератури
Baayen, RH, Davidson, DJ, & Bates, DM (2008). Моделювання змішаних ефектів із схрещеними випадковими ефектами для предметів та предметів. Журнал пам’яті та мови, 59 (4), 390-412. PDF
Barr, DJ, Levy, R., Scheepers, C., & Tily, HJ (2013). Структура випадкових ефектів для перевірки підтверджувальної гіпотези: Тримайте її максимально. Журнал пам’яті та мови, 68 (3), 255-278. PDF
Кларк, HH (1973). Помилковість мови як фіксованого ефекту: критика мовної статистики в психологічних дослідженнях. Журнал словесного навчання та вербальної поведінки, 12 (4), 335-359. PDF
Коулман, Е.Б. (1964). Узагальнення до мовної сукупності. Психологічні доповіді, 14 (1), 219-226.
Judd, CM, Westfall, J., & Kenny, DA (2012). Трактування стимулів як випадкового чинника соціальної психології: нове і всебічне рішення всеосяжної, але багато в чому ігнорованої проблеми. Журнал особистості та соціальної психології, 103 (1), 54. PDF
Мураяма, К., Сакакі, М., Ян, VX та Сміт, GM (2014). Інфляція помилок типу I в традиційному аналізі учасників до метамеморійної точності: узагальнена перспектива моделі змішаних ефектів. Журнал експериментальної психології: навчання, пам’ять та пізнання. PDF
Pinheiro, JC, & Bates, DM (2000). Моделі зі змішаними ефектами в S і S-PLUS. Спрингер.
Raaijmakers, JG, Schrijnemakers, J., & Gremmen, F. (1999). Як поводитися з "помилкою, що визначається мовою", загальні помилки та альтернативні рішення. Журнал пам’яті та мови, 41 (3), 416-426. PDF