Лінійні моделі змішаних ефектів часто не використовуються в моєму куточку біології, і мені потрібно подати статистичний тест, який я використовував у роботі, яку я намагаюся написати. Я знаю, що усвідомлення багаторівневого моделювання починає з'являтися в деяких областях біологічних наук ( Рішення залежності: використання багаторівневого аналізу для розміщення вкладених даних ), але я все ще намагаюся навчитися повідомляти про свої результати!
Моє експериментальне проектування, коротко:
* Суб'єкти були віднесені до однієї з чотирьох груп лікування
* Вимірювання залежної змінної проводилися в різні дні після початку лікування
* Конструкція незбалансована (неоднакова кількість суб'єктів у групах лікування та відсутня вимірювання для деяких суб'єктів у деякі дні)
* Лікування А - це контрольна категорія
* Я зосереджував дані в останній день лікування
Хочу знати, чи дає лікування А (референтна категорія) значно кращі результати, ніж інші методи лікування (наприкінці лікування).
Я робив аналіз в R, використовуючи nlme:
mymodel <- lme(dv ~ Treatment*Day, random = ~1|Subject, data = mydf, na.action = na.omit,
+ correlation = corAR1(form = ~1 |Subject), method = "REML")
А вихід (частково; скорочений для стислості):
>anova(mymodel)
numDF denDF F-value p-value
(Intercept) 1 222 36173.09 <.0001
Treat 3 35 16.61 <.0001
Day 7 222 3.43 0.0016
Treat:Day 21 222 3.62 <.0001
>summary(mymodel)
Fixed effects: dv ~ Treatment * Day
Value Std.Error DF t-value p-value
(Intercept) 7.038028 0.1245901 222 56.48945 0.0000
TreatmentB 0.440560 0.1608452 35 2.73903 0.0096
TreatmentC 0.510214 0.1761970 35 2.89570 0.0065
TreatmentD 0.106202 0.1637436 35 0.64859 0.5208
Отже, я знаю, що ефект від дня відрізняється від лікування, і що в останній день лікування (де дані зосереджені), ДВ значно відрізняється в лікуванні А, ніж лікування B або C.
Що я хочу сказати: «Як було передбачено, ми виявили, що залежна змінна була значно нижчою у суб'єктів, які отримували лікування А (середнє +/- SE), ніж у суб'єктів, які отримували лікування B (середнє +/- SE, p = 0,0096) або лікування C (середнє +/- SE, p = 0,0065), виміряне в останній день лікування ".
Але я маю зазначити, який статистичний тест робився. Чи було б це прийнятним способом описати аналіз? "[Метод вимірювання] проводили в зазначені дні і визначали залежну змінну (одиниці); ми аналізували дані, трансформовані журналом, використовуючи лінійну модель змішаних ефектів, орієнтовану на [останній день лікування]. Символи представляють середнє значення dv; смуги помилок стандартна помилка. В останній день лікування ДВ було значно нижчим у лікуванні A (середнє +/- SE), ніж у лікуванні B (середнє +/- SE, p = 0,0096) ... "
Зокрема,
* Чи достатньо це говорить про використаний статистичний тест? (Читачі звикли бачити щось більше на кшталт "середній +/- SE, p = 0,0096, t-тест Стьюдента", але дивно писати "p = 0,0096, коефіцієнт для лікування B проти лікування A від лінійних змішаних ефектів модель в [останній день лікування]. ")
* Чи є кращий спосіб це зробити?
(Розділ методів буде містити додаткову інформацію про статистику: "Дані [Метод вимірювання] були проаналізовані за допомогою пакетів R та R ... Ми проаналізували дані, перетворені журналом залежної змінної змінної, використовуючи лінійні моделі змішаних ефектів, використовуючи Суб'єкти як випадкові ефекти та структуру автокореляції порядку 1 (AR1). В якості фіксованих ефектів ми включили «Лікування» та «День» та взаємодію «Лікування та день». Ми перевірили нормальність та однорідність шляхом візуального огляду ділянок залишків на відповідні значення. Аналіз змішаних ефектів ми провели тести на коефіцієнт ймовірності, порівнюючи моделі з фіксованими ефектами з нульовими моделями лише з випадковими ефектами. ")
Будь-яка порада щодо того, як повідомити результати лінійної моделі змішаних ефектів для аудиторії, що часто відхиляється від статистики (і написана початківцем початківцем статистикою), буде дуже вдячна!