Найкраща практика при аналізі конструкцій, які проводяться після лікування


53

Уявіть наступний загальний дизайн:

  • 100 учасників випадковим чином розподіляються або на лікування, або на контрольну групу
  • залежна змінна є числовою та вимірюється до та після обробки

Три очевидних варіанти аналізу таких даних:

  • Випробування групи за часом взаємодії в змішаній ANOVA
  • Зробіть ANCOVA з умовою як IV, а попередній захід - як коваріат та після вимірювання як DV
  • Зробіть t-тест із умовою як IV та попередньо після зміни балів як DV

Питання:

  • Який найкращий спосіб аналізу таких даних?
  • Чи є причини віддати перевагу одному підходу над іншим?

1
Коли ви говорите "умова", ви маєте на увазі групове призначення?
pmgjones

1
@propofol: так. вибачте, якщо моя мова не зрозуміла.
Джеромі Англім

1
Існують також параметричні методи "N-of-1" для статистичної оцінки тимчасових даних для одиночних спостережень. Приклад застосування: ncbi.nlm.nih.gov/pubmed/2039432 Порівняльні методи: europepmc.org/ab Abstract
MED/

Відповіді:


34

Навколо цієї теми є величезна література (зміни / отримання балів), і я думаю, що найкращі посилання походять з біомедичної галузі, наприклад

Senn, S (2007). Статистичні питання розвитку наркотиків . Вілі (гл. 7, с. 96-112)

У біомедичних дослідженнях також була проведена цікава робота з вивчення перехресних випробувань (особливо стосовно ефектів перенесення , хоча я не знаю, наскільки це застосовано до вашого дослідження).

З коефіцієнта підсилення t до ANCOVA F (і навпаки) , від Knapp & Schaffer, дає цікавий огляд ANCOVA vs. t підходу (так званий Господній парадокс). Простий аналіз балів змін не є рекомендованим способом до / після проектування згідно зі Сенном у його статті Зміни від базової лінії та аналіз коваріації, що переглянувся (Stat. Med. 2006 25 (24)). Більше того, використання моделі змішаних ефектів (наприклад, для обліку кореляції між двома часовими точками) не є кращим, оскільки вам дійсно потрібно використовувати вимірювання "до" як коваріат для підвищення точності (за допомогою регулювання). Дуже коротко:

  • Використання балів змін (після або до результату базового рівня) не вирішує проблему дисбалансу; співвідношення між вимірюванням до та після вимірювання становить <1, а співвідношення між до та (після перед) загалом є негативним - звідси випливає, що якщо обробка (розподіл вашої групи), виміряна за необробленими балами, буде несправедливим недоліком порівняно для контролю, це матиме несправедливу перевагу при зміні балів.
  • Дисперсія оцінювача, що використовується в ANCOVA, як правило, нижча, ніж для бальних чи змінних балів (крім випадків, коли кореляція між до та після дорівнює 1).
  • Якщо відносини до / після різниться між двома групами (нахилом), це не стільки проблема, скільки для будь-яких інших методів (підхід до оцінки балів також передбачає, що відносини однакові між двома групами - гіпотеза про паралельний нахил ).
  • Згідно з нульовою гіпотезою рівності лікування (щодо результату), не очікується ніякого лікування взаємодії x вихідного рівня; підходити до такої моделі небезпечно, але в цьому випадку потрібно використовувати централізовані базові лінії (інакше ефект лікування оцінюється за коваріатним походженням).

Мені також подобаються десять міфів про оцінку різниці від Едвардса, хоча вона зосереджена на балах різниці в іншому контексті; але ось анотована бібліографія щодо аналізу змін, що відбулися перед публікацією (на жаль, вона не охоплює зовсім недавню роботу). Ван Брюкелен також порівнював ANOVA проти ANCOVA у рандомізованих та не рандомизованих умовах, і його висновки підтримують ідею, що ANCOVA слід віддавати перевагу, принаймні, у рандомізованих дослідженнях (які заважають регресувати до середнього ефекту).


Просто для уточнення: ви маєте на увазі, що ANCOVA з результатами попереднього тесту як коваріати - найкращий варіант?
mkt - Відновіть Моніку

17

Даніель Б. Райт обговорює це в розділі 5 своєї статті " Створення друзів з вашими даними" . Він пропонує (с.130):

Єдина правильна процедура в цій ситуації - це розсіювач, який порівнює бали за час 2 та показники часу 1 для різних груп. У більшості випадків слід аналізувати дані декількома способами. Якщо підходи дають різні результати ... подумай більш ретельно про модель, яку має на увазі кожен.

Він рекомендує для подальшого читання такі статті:

  • Рука, DJ (1994). Деконструкція статистичних питань. Журнал Королівського статистичного товариства: A, 157, 317–356.
  • Лорд, FM (1967). Парадокс у трактуванні групових порівнянь. Психологічний вісник, 72, 304–305. Безкоштовний PDF
  • Вайнер, Х. (1991). Регулювання диференціальних базових ставок: знову парадокс Лорда. Психологічний вісник, 109, 147–151. Безкоштовний PDF

9

Найпоширенішими стратегіями будуть:

  1. Повторні заходи ANOVA з одним фактором, що перебуває в межах суб'єкта (до та після тесту) та одним фактором між суб'єктом (лікування проти контролю).
  2. ANCOVA за показниками після лікування, з оцінкою попереднього лікування як коваріатом та лікуванням як незалежною змінною. Інтуїтивно зрозуміла ідея, що тест на відмінності між обома групами - це справді те, про що ти йдеш, і включаючи оцінки попереднього тесту як коваріату, може збільшити потужність порівняно з простим t-тестом або ANOVA.

Існує багато дискусій щодо тлумачення, припущень та, мабуть, парадоксальних відмінностей між цими двома підходами та щодо більш досконалих альтернатив (особливо, коли учасників не можна випадково призначити на лікування), але я думаю, що вони залишаються досить стандартними.

Одним з важливих джерел плутанини є те, що для ANOVA ефект, що представляє інтерес, є, швидше за все, взаємодією між часом та лікуванням, а не основним ефектом лікування. Між іншим, F-тест для цього терміну взаємодії дасть абсолютно такий же результат, як незалежний зразок t-тесту на бали посилення (тобто бали, отримані відняттям попереднього тесту від оцінки після тесту для кожного учасника), щоб ви могли також піти на це.

Якщо все це занадто багато, ви не маєте часу розібратися в цьому і не можете отримати допомогу від статистики, швидко і брудно, але аж ніяк не зовсім абсурдним підходом було б просто порівнювати показники після тесту з результатами незалежний зразок t-тесту, ігноруючи значення попереднього тесту. Це має сенс лише в тому випадку, якщо учасників насправді випадковим чином призначили до групи лікування або контролю .

Нарешті, це саме по собі не дуже вагомий привід обрати його, але я підозрюю, що підхід 2 вище (ANCOVA) - це те, що зараз є правильним підходом у психології, тому якщо ви виберете щось інше, вам, можливо, доведеться детально пояснити техніку або обґрунтувати себе тому, хто переконаний, наприклад, що "результати балів, як відомо, є поганими".


1
Я б сказав, що перша рекомендація, повторні заходи ANOVA, не підходить для аналізу даних перед публікацією. Чи лікування за кодованою схемою до 0 в групі втручання? Так чи інакше, це знову вводить ефект Готорна. Систематичні відмінності в режимі перед / після публікації між елементами управління зменшуються до випадкових змін. OVA RM AN C OVA виправданий, коли протягом періоду є кілька вимірювань, а базові значення все ще коригуються як коваріат або використовуються як показник коефіцієнта посилення.
AdamO

2

ANCOVA та повторні заходи / змішана модель терміну взаємодії тестують дві різні гіпотези. Дивіться цю статтю: стаття 1 і ця стаття: стаття 2


-2

Оскільки у вас є два способи (або конкретного товару, або суми інвентарю), немає ніяких причин вважати ANOVA. Можливо, підходить парний t-тест; це може допомогти вам вибрати тест-тест, який вам потрібен.

Ви хочете переглянути конкретні результати або загальні результати? Якщо ви хочете зробити аналіз предмета, це може бути корисним початковим місцем.


4
А як щодо контрольної групи? Парний тест на всі дані здається поганою ідеєю і, безумовно, не стосується головного питання (чи ефективне лікування?). Парний t-тест, обмежений лікувальною групою, є правдоподібною стратегією, але ігнорування контрольної групи викидає багато даних і дає набагато слабкіші докази того, що втручання насправді є діючою речовиною. Насправді ANOVA - це поширений - якщо його часто критикують - спосіб аналізу цього дизайну.
Гала
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.