Моя відмова : Я розумію, що це питання лежало в спокої протягом певного часу, але воно, здається, є важливим і таким, яке ви мали намір отримати кілька відповідей. Я соціальний психолог, і, мабуть, звучить це, мабуть, трохи зручніше з такими конструкціями, ніж Генрік (хоча його занепокоєння щодо причинно-наслідкових тлумачень цілком правомірно).
За яких умов є SEM - відповідна методика аналізу даних?
Для мене це питання насправді виникає у двох різних підпитаннях:
- Навіщо використовувати SEM в першу чергу?
- Якщо дослідник вирішив використовувати SEM, то які вимоги щодо використання SEM стосуються даних?
Навіщо використовувати SEM в першу чергу?
SEM - більш нюансований і складний - і, отже, менш доступний - підхід до аналізу даних, ніж інші, більш типові, загальнолінійні підходи лінійного моделювання (наприклад, ANOVA, кореляції, регресія та їх розширення тощо). Все, що ви думаєте зробити з цими підходами, ви можете зробити з SEM.
Я вважаю, що таким чином потенційні користувачі повинні в першу чергу оцінити, чому вони змушені використовувати SEM. Безумовно, SEM пропонує деякі вагомі переваги для своїх користувачів, але я переглянув статті, в яких жодна з цих переваг не використовується, а кінцевий продукт - це розділ аналізу даних у документі, який типово читачам важко зрозуміти . Це просто не варте клопоту - для дослідника чи читача - якщо переваги SEM порівняно з іншими підходами до аналізу даних не використовуються.
Тож, що я бачу в якості основної переваги підходу SEM? На мою думку, великі:
(1) Моделювання прихованих змінних : SEM дозволяє користувачам досліджувати структурні відносини (дисперсії, коваріації / кореляції, регресії, середні групові відмінності) між неспостережуваними прихованими змінними, які по суті є спільною коваріацією між групою змінних (наприклад, елементи тривоги міряйте, що ваші студенти можуть використовувати).
Найбільшим показником продажу прихованих змінних (наприклад, прихованої тривоги) та спостережуваної оцінки конструкції (наприклад, середнє значення тривожних елементів) є те, що латентні змінні є безвідповідними - латентні змінні формуються із спільної коваріації, і помилка теоретизується для коваріума ні з чим. Це означає збільшення статистичної потужності, оскільки користувачам більше не доводиться турбуватися про ненадійність вимірювань, зменшуючи ефекти, які вони намагаються моделювати.
Іншою, більш заниженою, причиною розгляду використання SEM є, в деяких випадках, це більш коректний спосіб тестування наших теорій про конструкції. Якби ваші студенти, наприклад, застосовували три різні заходи тривоги, чи не було б краще зрозуміти причини / наслідки спільного цих трьох заходів - імовірно, тривоги - в рамках SEM, а не привілейовувати будь-які зокрема , одна міра , як в міру занепокоєння?
(2) Моделювання декількох залежних змінних: Навіть якщо хтось не збирається використовувати SEM для моделювання прихованих змінних, він все одно може бути корисним як рамка для одночасного аналізу кількох змінних результатів в одній моделі. Наприклад, можливо, ваші студенти зацікавлені вивчити, як одні й ті ж провідники пов'язані з низкою різних клінічно релевантних результатів (наприклад, тривожність, депресія, самотність, самооцінка тощо). Навіщо запускати чотири окремі моделі (збільшуючи рівень помилок типу I), коли ви можете просто запустити одну модель для всіх чотирьох результатів, які вас цікавлять? Це також є причиною використання SEM при роботі з певними типами залежних даних, де кілька залежних респондентів можуть давати прогнози і відповіді на результат (наприклад, діадичні дані; див. Kenny, Kashy та Cook, 2006,
(3) Моделювання припущень, замість того, щоб робити їх : Завдяки багатьом іншим підходам до аналізу даних (наприклад, ANOVA, кореляція, регресія) ми робимо безліч припущень щодо властивостей даних, з якими ми маємо справу - таких як однорідність дисперсія / гомоскедастичність. SEM (зазвичай поєднується з латентним змінним підходом) дозволяє користувачам фактично моделювати параметри дисперсії одночасно поряд із засобами та / або кореляціями / регресивними шляхами. Це означає, що користувачі можуть почати теоретизувати і перевіряти гіпотезу про мінливість, крім середніх відмінностей / коефіцієнтності, замість того, щоб просто розглядати мінливість як дратівливу думку, пов'язану з припущенням.
Іншим тестовим припущенням при порівнянні середніх рівнів групи на деякій змінній є те, чи змінна насправді означає те ж саме для кожної групи - в літературі SEM називається інваріантністю вимірювань (див. Vandenberg & Lance, 2000, для огляду цього процесу ). Якщо так, то порівняння середніх рівнів цієї змінної є дійсними, але якщо групи значно відрізняються від розуміння того, що таке, порівняння середніх рівнів між групами викликає сумніви. Ми робимо це особливе припущення неявно весь час у дослідженні, використовуючи групові порівняння.
І тоді існує припущення, що при середньому або підсумовуванні балів (наприклад, за мірою тривоги) для створення сукупного індексу, що кожен предмет є однаково хорошою мірою базової конструкції (оскільки кожен предмет оцінюється однаково в усереднення / підсумовування). SEM усуває це припущення, коли використовуються латентні змінні, оцінюючи різні значення завантаження фактора (зв'язок між елементом та латентною змінною) для кожного елемента.
Нарешті, іншими припущеннями щодо даних (наприклад, про нормальність), хоча вони все ще важливі для SEM, можна керувати (наприклад, за допомогою використання "надійних" оцінок, див. Finney & DiStefano, 2008), коли дані не відповідають певні критерії (низький рівень косості та куртозу).
(4) Вказання обмежень моделі: Остання велика причина, на мою думку, розглянути можливість використання SEM, полягає в тому, що це дуже легко перевірити конкретні гіпотези щодо вашої моделі даних, вимушуючи («обмежуючи» в термінах SEM) певні шляхи у вашій моделі прийняти конкретні значення та вивчити, як це впливає на відповідність вашої моделі вашим даним. Деякі приклади включають: (A) обмеження шляху регресії до нуля, щоб перевірити, чи потрібно це в моделі; (В), що містить декілька шляхів регресії, щоб бути рівними за величиною (наприклад, чи асоціативна сила для деякого прогноктора приблизно однакова для тривоги та депресії?); (C) обмеження параметрів вимірювання, необхідних для оцінки інваріантності вимірювань (описано вище); (D) обмеження шляху регресії, щоб бути рівним за силою між двома різними групами,
Які вимоги щодо даних стосуються SEM?
Вимоги, пов'язані з даними щодо SEM, досить скромні; вам потрібен адекватний розмір вибірки, і щоб ваші дані відповідали припущенням обраного вами оцінювача моделі (типовий "Максимальний рівень життєздатності").
Важко дати рекомендацію, що відповідає одному розміру, щодо розміру вибірки. На основі декількох прямолінійних моделювань, Little (2013) припускає, що для дуже простих моделей може бути достатньо 100-150 спостережень, але потреби в розмірі вибірки зростатимуть, коли моделі стануть складнішими, та / або як надійність / обґрунтованість змінних, що використовуються в модель зменшується. Якщо складність моделі викликає занепокоєння, ви можете розглянути питання про розбір показників ваших прихованих змінних, але далеко не всі мають такий підхід (Little, Cunningham, Shahar, & Widaman, 2002). Але загалом кажучи, всі інші рівні, більші зразки (я прагну до 200 мінімумів у власних дослідженнях) краще.
Що стосується задоволення припущень вибраного оцінювача, зазвичай це досить легко оцінити (наприклад, подивіться на значення косості та куртозу для максимальної оцінки ймовірності). І навіть якщо дані відходять від припущених властивостей, дослідження може розглянути можливість використання "надійного" оцінювача (Finney & DiStefano, 2008) або оцінника, який передбачає різні дані (наприклад, категоричний оцінювач, як найменш діагонально зважений квадрати).
Альтернативи SEM для аналізу даних?
Якщо дослідник не збирається скористатися перевагами, наданими підходом SEM, який я виділив вище, я рекомендую дотримуватися більш прямої та доступної версії конкретного аналізу (наприклад, т -тести, ANOVA, кореляційний аналіз, регресійні моделі [включаючи моделі посередництва, модерації та умовні процеси]). Читачі з ними більш знайомі, а тому легше їх зрозуміють. Просто не варто плутати читачів з деталізацією SEM, якщо ви по суті використовуєте SEM для того ж ефекту, що і простіший аналітичний підхід.
Порада дослідникам, що стосуються використання SEM?
Для тих новеньких у SEM:
- Отримайте вичерпний, доступний для написання основний текст SEM. Мені подобаються Beaujean (2014), Brown (2015; попереднє видання також є солідним) і Little (2013; хороший загальний вступ, хоча згодом він зосереджується спеціально на поздовжніх моделях).
- Дізнайтеся, як користуватися
lavaan
пакетом для R
(Rosseel, 2012). Цей синтаксис настільки простий, як і синтаксис SEM, його функціональність достатньо широка для потреб SEM для багатьох людей (безумовно, для початківців), і це безкоштовно. Книга Beaujean дає чудове одночасне ознайомлення з SEM та lavaan
пакетом.
- Проконсультуйтеся / використовуйте CrossValidated та StacksOverflow регулярно. Несподівані речі можуть трапитися при встановленні моделей SEM, і, швидше за все, багато дивних речей, які ви можете відчути, вже були описані та усунення неполадок у стеках.
- Як зазначає Герик, зауважте, що саме тому, що ви вказуєте модель, яка передбачає причинно-наслідкові асоціації, це не означає, що SEM допомагає встановити причинно-наслідкову ситуацію в поперечному / неекспериментальному дослідженні. Крім того, цілком варто розглянути використання SEM для аналізу даних з поздовжніх та / або експериментальних конструкцій.
А для тих, хто починає насправді використовувати SEM:
- У якийсь момент ви будете спокушені вказувати співвіднесені залишки мимоволі, намагаючись покращити пристосованість вашої моделі. Не варто. Принаймні, не без поважної апріорної причини. Найчастіше більший зразок чи простіша модель - це ліки.
- Уникайте використання методу ідентифікації змінної маркера для прихованих змінних (тобто фіксація завантаження першого фактора до 1). Це привілейований цей показник як "золотий стандарт" показника вашої прихованої змінної, коли в більшості випадків немає підстав вважати, що це так. Майте на увазі, що це налаштування ідентифікації за замовчуванням у більшості програм.
Список літератури
Beaujean, AA (2014). Латентне змінне моделювання з використанням R: Покрокове керівництво . Нью-Йорк, Нью-Йорк: Routledge.
Браун, Техас (2015). Підтверджуючий факторний аналіз для прикладних дослідників (2-е видання). Нью-Йорк, Нью-Йорк: Гілфорд Прес.
Finney, SJ та DiStefano, C. (2008). Ненормальні та категоричні дані при моделюванні структурних рівнянь. У GR Hancock & RD Mueller (ред.), Моделювання структурних рівнянь: Другий курс (с. 269-314). Інформаційне вікове видання.
Kenny, DA, Kashy, DA, & Cook, WL (2006). Діадичний аналіз даних . Нью-Йорк, Нью-Йорк: Гілфорд Прес.
Малий, ТД (2013). Моделювання поздовжнього структурного рівняння . Нью-Йорк, Нью-Йорк: Гілфорд Прес.
Little, TD, Cunningham, WA, Shahar, G., & Widaman, KF (2002). Розділяти чи не розсилати: Вивчення питання, зважування суті. Моделювання структурних рівнянь , 9 , 151-173.
Rosseel, Y. (2012). lavaan: пакет R для моделювання структурних рівнянь. Журнал статистичного програмного забезпечення , 48 (2), 1-36.
Ванденберг, RJ, і Ланс, CE (2000). Огляд та узагальнення літератури про інваріантність вимірювань: пропозиції, практики та рекомендації для організаційних дослідників. Методи організаційних досліджень , 3 , 4-70.