Чи використовувати моделювання структурних рівнянь для аналізу спостережних досліджень у психології

Я помітив, що ця проблема часто виникає в налаштуваннях статистичного консалтингу, і я хотів отримати ваші думки.

Контекст

Я часто розмовляю зі студентами-дослідниками, які провели дослідження приблизно так:

Спостережне дослідження
Розмір вибірки може становити 100, 200, 300 тощо.
Було виміряно кілька психологічних шкал (наприклад, тривожність, депресія, особистість, ставлення, інші клінічні шкали, можливо інтелект тощо)

Дослідники прочитали відповідну літературу та мають деякі думки щодо можливих причинно-наслідкових процесів. Часто буде якась загальна концептуалізація змінних в попередні, змінні процесу та змінні результатів. Вони також часто чули, що моделювання структурних рівнянь є більш підходящим для тестування загальних моделей взаємозв'язків між набором змінних, які вони вивчають.

Питання

За яких умов, на вашу думку, моделювання структурних рівнянь є відповідною методикою аналізу таких досліджень?
Якщо ви б не рекомендували моделювати структурне рівняння, які альтернативні методи ви б рекомендували?
Яку б пораду ви дали дослідникам, що розглядають можливість моделювання структурних рівнянь у таких випадках?

— Джеромі Англім
джерело

Моя відмова : Я розумію, що це питання лежало в спокої протягом певного часу, але воно, здається, є важливим і таким, яке ви мали намір отримати кілька відповідей. Я соціальний психолог, і, мабуть, звучить це, мабуть, трохи зручніше з такими конструкціями, ніж Генрік (хоча його занепокоєння щодо причинно-наслідкових тлумачень цілком правомірно).

За яких умов є SEM - відповідна методика аналізу даних?

Для мене це питання насправді виникає у двох різних підпитаннях:

Навіщо використовувати SEM в першу чергу?
Якщо дослідник вирішив використовувати SEM, то які вимоги щодо використання SEM стосуються даних?

Навіщо використовувати SEM в першу чергу?

SEM - більш нюансований і складний - і, отже, менш доступний - підхід до аналізу даних, ніж інші, більш типові, загальнолінійні підходи лінійного моделювання (наприклад, ANOVA, кореляції, регресія та їх розширення тощо). Все, що ви думаєте зробити з цими підходами, ви можете зробити з SEM.

Я вважаю, що таким чином потенційні користувачі повинні в першу чергу оцінити, чому вони змушені використовувати SEM. Безумовно, SEM пропонує деякі вагомі переваги для своїх користувачів, але я переглянув статті, в яких жодна з цих переваг не використовується, а кінцевий продукт - це розділ аналізу даних у документі, який типово читачам важко зрозуміти . Це просто не варте клопоту - для дослідника чи читача - якщо переваги SEM порівняно з іншими підходами до аналізу даних не використовуються.

Тож, що я бачу в якості основної переваги підходу SEM? На мою думку, великі:

(1) Моделювання прихованих змінних : SEM дозволяє користувачам досліджувати структурні відносини (дисперсії, коваріації / кореляції, регресії, середні групові відмінності) між неспостережуваними прихованими змінними, які по суті є спільною коваріацією між групою змінних (наприклад, елементи тривоги міряйте, що ваші студенти можуть використовувати).

Найбільшим показником продажу прихованих змінних (наприклад, прихованої тривоги) та спостережуваної оцінки конструкції (наприклад, середнє значення тривожних елементів) є те, що латентні змінні є безвідповідними - латентні змінні формуються із спільної коваріації, і помилка теоретизується для коваріума ні з чим. Це означає збільшення статистичної потужності, оскільки користувачам більше не доводиться турбуватися про ненадійність вимірювань, зменшуючи ефекти, які вони намагаються моделювати.

Іншою, більш заниженою, причиною розгляду використання SEM є, в деяких випадках, це більш коректний спосіб тестування наших теорій про конструкції. Якби ваші студенти, наприклад, застосовували три різні заходи тривоги, чи не було б краще зрозуміти причини / наслідки спільного цих трьох заходів - імовірно, тривоги - в рамках SEM, а не привілейовувати будь-які зокрема , одна міра , як в міру занепокоєння?

(2) Моделювання декількох залежних змінних: Навіть якщо хтось не збирається використовувати SEM для моделювання прихованих змінних, він все одно може бути корисним як рамка для одночасного аналізу кількох змінних результатів в одній моделі. Наприклад, можливо, ваші студенти зацікавлені вивчити, як одні й ті ж провідники пов'язані з низкою різних клінічно релевантних результатів (наприклад, тривожність, депресія, самотність, самооцінка тощо). Навіщо запускати чотири окремі моделі (збільшуючи рівень помилок типу I), коли ви можете просто запустити одну модель для всіх чотирьох результатів, які вас цікавлять? Це також є причиною використання SEM при роботі з певними типами залежних даних, де кілька залежних респондентів можуть давати прогнози і відповіді на результат (наприклад, діадичні дані; див. Kenny, Kashy та Cook, 2006,

(3) Моделювання припущень, замість того, щоб робити їх : Завдяки багатьом іншим підходам до аналізу даних (наприклад, ANOVA, кореляція, регресія) ми робимо безліч припущень щодо властивостей даних, з якими ми маємо справу - таких як однорідність дисперсія / гомоскедастичність. SEM (зазвичай поєднується з латентним змінним підходом) дозволяє користувачам фактично моделювати параметри дисперсії одночасно поряд із засобами та / або кореляціями / регресивними шляхами. Це означає, що користувачі можуть почати теоретизувати і перевіряти гіпотезу про мінливість, крім середніх відмінностей / коефіцієнтності, замість того, щоб просто розглядати мінливість як дратівливу думку, пов'язану з припущенням.

Іншим тестовим припущенням при порівнянні середніх рівнів групи на деякій змінній є те, чи змінна насправді означає те ж саме для кожної групи - в літературі SEM називається інваріантністю вимірювань (див. Vandenberg & Lance, 2000, для огляду цього процесу ). Якщо так, то порівняння середніх рівнів цієї змінної є дійсними, але якщо групи значно відрізняються від розуміння того, що таке, порівняння середніх рівнів між групами викликає сумніви. Ми робимо це особливе припущення неявно весь час у дослідженні, використовуючи групові порівняння.

І тоді існує припущення, що при середньому або підсумовуванні балів (наприклад, за мірою тривоги) для створення сукупного індексу, що кожен предмет є однаково хорошою мірою базової конструкції (оскільки кожен предмет оцінюється однаково в усереднення / підсумовування). SEM усуває це припущення, коли використовуються латентні змінні, оцінюючи різні значення завантаження фактора (зв'язок між елементом та латентною змінною) для кожного елемента.

Нарешті, іншими припущеннями щодо даних (наприклад, про нормальність), хоча вони все ще важливі для SEM, можна керувати (наприклад, за допомогою використання "надійних" оцінок, див. Finney & DiStefano, 2008), коли дані не відповідають певні критерії (низький рівень косості та куртозу).

(4) Вказання обмежень моделі: Остання велика причина, на мою думку, розглянути можливість використання SEM, полягає в тому, що це дуже легко перевірити конкретні гіпотези щодо вашої моделі даних, вимушуючи («обмежуючи» в термінах SEM) певні шляхи у вашій моделі прийняти конкретні значення та вивчити, як це впливає на відповідність вашої моделі вашим даним. Деякі приклади включають: (A) обмеження шляху регресії до нуля, щоб перевірити, чи потрібно це в моделі; (В), що містить декілька шляхів регресії, щоб бути рівними за величиною (наприклад, чи асоціативна сила для деякого прогноктора приблизно однакова для тривоги та депресії?); (C) обмеження параметрів вимірювання, необхідних для оцінки інваріантності вимірювань (описано вище); (D) обмеження шляху регресії, щоб бути рівним за силою між двома різними групами,

Які вимоги щодо даних стосуються SEM?

Вимоги, пов'язані з даними щодо SEM, досить скромні; вам потрібен адекватний розмір вибірки, і щоб ваші дані відповідали припущенням обраного вами оцінювача моделі (типовий "Максимальний рівень життєздатності").

Важко дати рекомендацію, що відповідає одному розміру, щодо розміру вибірки. На основі декількох прямолінійних моделювань, Little (2013) припускає, що для дуже простих моделей може бути достатньо 100-150 спостережень, але потреби в розмірі вибірки зростатимуть, коли моделі стануть складнішими, та / або як надійність / обґрунтованість змінних, що використовуються в модель зменшується. Якщо складність моделі викликає занепокоєння, ви можете розглянути питання про розбір показників ваших прихованих змінних, але далеко не всі мають такий підхід (Little, Cunningham, Shahar, & Widaman, 2002). Але загалом кажучи, всі інші рівні, більші зразки (я прагну до 200 мінімумів у власних дослідженнях) краще.

Що стосується задоволення припущень вибраного оцінювача, зазвичай це досить легко оцінити (наприклад, подивіться на значення косості та куртозу для максимальної оцінки ймовірності). І навіть якщо дані відходять від припущених властивостей, дослідження може розглянути можливість використання "надійного" оцінювача (Finney & DiStefano, 2008) або оцінника, який передбачає різні дані (наприклад, категоричний оцінювач, як найменш діагонально зважений квадрати).

Альтернативи SEM для аналізу даних?

Якщо дослідник не збирається скористатися перевагами, наданими підходом SEM, який я виділив вище, я рекомендую дотримуватися більш прямої та доступної версії конкретного аналізу (наприклад, т -тести, ANOVA, кореляційний аналіз, регресійні моделі [включаючи моделі посередництва, модерації та умовні процеси]). Читачі з ними більш знайомі, а тому легше їх зрозуміють. Просто не варто плутати читачів з деталізацією SEM, якщо ви по суті використовуєте SEM для того ж ефекту, що і простіший аналітичний підхід.

Порада дослідникам, що стосуються використання SEM?

Для тих новеньких у SEM:

Отримайте вичерпний, доступний для написання основний текст SEM. Мені подобаються Beaujean (2014), Brown (2015; попереднє видання також є солідним) і Little (2013; хороший загальний вступ, хоча згодом він зосереджується спеціально на поздовжніх моделях).
Дізнайтеся, як користуватися lavaanпакетом для R(Rosseel, 2012). Цей синтаксис настільки простий, як і синтаксис SEM, його функціональність достатньо широка для потреб SEM для багатьох людей (безумовно, для початківців), і це безкоштовно. Книга Beaujean дає чудове одночасне ознайомлення з SEM та lavaanпакетом.
Проконсультуйтеся / використовуйте CrossValidated та StacksOverflow регулярно. Несподівані речі можуть трапитися при встановленні моделей SEM, і, швидше за все, багато дивних речей, які ви можете відчути, вже були описані та усунення неполадок у стеках.
Як зазначає Герик, зауважте, що саме тому, що ви вказуєте модель, яка передбачає причинно-наслідкові асоціації, це не означає, що SEM допомагає встановити причинно-наслідкову ситуацію в поперечному / неекспериментальному дослідженні. Крім того, цілком варто розглянути використання SEM для аналізу даних з поздовжніх та / або експериментальних конструкцій.

А для тих, хто починає насправді використовувати SEM:

У якийсь момент ви будете спокушені вказувати співвіднесені залишки мимоволі, намагаючись покращити пристосованість вашої моделі. Не варто. Принаймні, не без поважної апріорної причини. Найчастіше більший зразок чи простіша модель - це ліки.
Уникайте використання методу ідентифікації змінної маркера для прихованих змінних (тобто фіксація завантаження першого фактора до 1). Це привілейований цей показник як "золотий стандарт" показника вашої прихованої змінної, коли в більшості випадків немає підстав вважати, що це так. Майте на увазі, що це налаштування ідентифікації за замовчуванням у більшості програм.

Список літератури

Beaujean, AA (2014). Латентне змінне моделювання з використанням R: Покрокове керівництво . Нью-Йорк, Нью-Йорк: Routledge.

Браун, Техас (2015). Підтверджуючий факторний аналіз для прикладних дослідників (2-е видання). Нью-Йорк, Нью-Йорк: Гілфорд Прес.

Finney, SJ та DiStefano, C. (2008). Ненормальні та категоричні дані при моделюванні структурних рівнянь. У GR Hancock & RD Mueller (ред.), Моделювання структурних рівнянь: Другий курс (с. 269-314). Інформаційне вікове видання.

Kenny, DA, Kashy, DA, & Cook, WL (2006). Діадичний аналіз даних . Нью-Йорк, Нью-Йорк: Гілфорд Прес.

Малий, ТД (2013). Моделювання поздовжнього структурного рівняння . Нью-Йорк, Нью-Йорк: Гілфорд Прес.

Little, TD, Cunningham, WA, Shahar, G., & Widaman, KF (2002). Розділяти чи не розсилати: Вивчення питання, зважування суті. Моделювання структурних рівнянь , 9 , 151-173.

Rosseel, Y. (2012). lavaan: пакет R для моделювання структурних рівнянь. Журнал статистичного програмного забезпечення , 48 (2), 1-36.

Ванденберг, RJ, і Ланс, CE (2000). Огляд та узагальнення літератури про інваріантність вимірювань: пропозиції, практики та рекомендації для організаційних дослідників. Методи організаційних досліджень , 3 , 4-70.

— jsakaluk
джерело

+1 хороша відповідь. Я з нетерпінням чекаю ваших інших внесків!

— Момо

+1 Відмінна відповідь. Я згоден з більшістю сказаного. Один наступний момент: Я не думаю, що SEM має більшу статистичну силу, оскільки вона оцінює взаємозв'язок між прихованими змінними. Взагалі, я думаю, що якщо що-небудь SEM вводить додаткове джерело помилок. Таким чином, існує звичайна помилка в оцінці спостережуваної змінної та додаткова помилка в оцінці дисперсії помилок або інших елементів латентної структури.

— Джеромі Англім

Я б, відповідно, стверджував, що SEM, моделюючи помилки в унікальних факторах, насправді збільшує потужність. Я думаю, що це найлегше продемонструвати, порівнявши модель SEM групових відмінностей у прихованих засобах із моделлю спостережуваних середніх відмінностей ті самі дані. Якщо ви запускаєте SEM, використовуючи підхід до кодування ефектів (див. Little, Slegers, & Card, 2006), ваші приховані засоби для кожної групи прийматимуть те саме значення, що і спостережувані засоби. Але відхилення для кожної групи в SEM-моделі будуть меншими, ніж у спостережуваних, що робить більший розмір ефекту, який легше виявити.

— jsakaluk

Я розумію, що вищезазначений коментар може бути не найкращим способом відповісти на вашу стурбованість; якщо ви задасте окреме запитання про SEM та потужність резюме, я би радий опублікувати більш детальну відповідь із прикладом результатів, який може бути корисним.

— jsakaluk

Відмова: Я вважаю себе психологом-експериментатором з акцентом на експериментальне. Отже, у мене природне занепокоєння з подібними конструкціями.

Щоб відповісти на ваше перше і друге запитання: я вважаю, що для такого дизайну є SEM або, залежно від кількості змінних аналізів, посередницький або модераційний аналіз - це природний спосіб поводження з даними. Я не маю жодної ідеї, що ще рекомендувати.

Для вашого третього запитання: Я думаю, що головна перевага при такому дизайні - це головний недолік. А саме , що ви (з огляду на достатню кількість змінних) буде знайти істотні результати. Питання в тому, як ви інтерпретуєте ці результати.

Тобто, ви можете подивитися на стільки гіпотез (ще дещо менш натхненних відповідною літературою), що, ймовірно, ви знайдете щось істотне (не в прямому сенсі відкидання SEM), яке буде інтерпретаційним у психологічному сенсі. Тому моя порада тому, хто це робить, буде двоякою:

Підкресліть проблему причинного тлумачення цих конструкцій. Я не фахівець у цьому, але знаю, що конструкція повністю поперечного перерізу навряд чи може бути інтерпретована причиною, незалежно від того, наскільки інтуїтивно правдоподібно це може звучати. Більш досконалі конструкції, такі як зшиті конструкції pnael або подібні речі, потрібні для причинних інтерпретацій. Я вважаю, що роботи Шадіша, Кука та Кемпбелла (або, принаймні, деякі з них) є хорошим джерелом для подальшого обговорення цих тем.
Підкресліть індивідуальну відповідальність та наукову етику. Якщо ви бачите, що ваша початкова ідея не підтримується даними, це природний наступний крок для подальшої перевірки даних. Однак ви ніколи не покладаєтесь на HARKing (Гіпотезування після того, як результати відомі; Керр, 1998 , див. Також Maxwell, 2004 ). Тобто, ви повинні підкреслити, що між розумною адаптацією ваших гіпотез на основі даних та вишневим підбором значних результатів існує тонка межа.

— Генрік
джерело

та Бернд: Дітто! Чудова абревіатура, і я сподіваюся, що це наздожене.

— rolando2