Мені було надано дані для аналізу для дослідження впливу на рівень заліза в чотирьох різних часових моментах (до початку лікування закінчувався день, через 4 тижні після лікування та через 2-4 місяці після лікування). Контрольної групи немає. Вони шукають, чи є значне підвищення рівня заліза в кожному з 3 періодів часу після лікування до рівня до початку лікування. Одинадцять пацієнтів мали вихідний рівень, але лише 8 пацієнтів мали повні дані за всі 4 часові точки ( = 11, 10, 9 та 8 для кожного моменту часу). Вимірювались не лише рівні заліза, але й у кожний момент часу проводилися два інші лабораторні заходи для порівняння з базовими.
У мене є кілька питань, як це проаналізувати. Спочатку я подумав, що RM ANOVA буде доречним для аналізу цих даних, але мене турбує невеликий розмір вибірки, втрата даних та ненормальний розподіл даних. Тоді я розглядав можливість порівняння кожного заходу після лікування з базовим рівнем, використовуючи тести, підписані Вілкоксоном, але потім я стикаюся з проблемою численних порівнянь. Однак я прочитав деяку літературу, яка занижує потреби, щоб провести кілька порівнянь. Таким чином, я маю справу з невеликими розмірами вибірки, неповними даними та численними порівняннями (і чи потрібно це чи ні).
Я сподіваюся, що це все мало сенс. Я новачок у CrossValided, і колега була направлена сюди як місце для навчання у досвідчених статистиків, тому я буду вдячний за будь-яку пораду! Спасибі!
Відредаговано, щоб додати необроблені дані до коментаря:
Існує чотири загальні моменти часу, а змінна результат - безперервна. Наприклад, результати в кожний момент часу виглядають подібними до таких:
Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]
1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
2nd Post (n=9): [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
3rd Post (n=8): [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]