Повторні заходи з часом з малим


14

Мені було надано дані для аналізу для дослідження впливу на рівень заліза в чотирьох різних часових моментах (до початку лікування закінчувався день, через 4 тижні після лікування та через 2-4 місяці після лікування). Контрольної групи немає. Вони шукають, чи є значне підвищення рівня заліза в кожному з 3 періодів часу після лікування до рівня до початку лікування. Одинадцять пацієнтів мали вихідний рівень, але лише 8 пацієнтів мали повні дані за всі 4 часові точки ( = 11, 10, 9 та 8 для кожного моменту часу). Вимірювались не лише рівні заліза, але й у кожний момент часу проводилися два інші лабораторні заходи для порівняння з базовими.н

У мене є кілька питань, як це проаналізувати. Спочатку я подумав, що RM ANOVA буде доречним для аналізу цих даних, але мене турбує невеликий розмір вибірки, втрата даних та ненормальний розподіл даних. Тоді я розглядав можливість порівняння кожного заходу після лікування з базовим рівнем, використовуючи тести, підписані Вілкоксоном, але потім я стикаюся з проблемою численних порівнянь. Однак я прочитав деяку літературу, яка занижує потреби, щоб провести кілька порівнянь. Таким чином, я маю справу з невеликими розмірами вибірки, неповними даними та численними порівняннями (і чи потрібно це чи ні).

Я сподіваюся, що це все мало сенс. Я новачок у CrossValided, і колега була направлена ​​сюди як місце для навчання у досвідчених статистиків, тому я буду вдячний за будь-яку пораду! Спасибі!


Відредаговано, щоб додати необроблені дані до коментаря:

Існує чотири загальні моменти часу, а змінна результат - безперервна. Наприклад, результати в кожний момент часу виглядають подібними до таких:

 Baseline (n=11): [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14] 
 1st Post (n=10): [167, 200, 45, 132, ., 245, 199, 177, 134, 298, 111]
 2nd Post (n=9):  [75, 43, 23, 98, 87, ., 300, ., 118, 202, 156]
 3rd Post (n=8):  [23, 34, 98, 112, ., 200, ., 156, 54, 18, .]

1
Якщо ви додасте відтворюваний приклад (або необроблені дані), це буде корисним.
Ladislav Naďo

Змінна результат є безперервним. Наприклад, результати в кожній часовій точці виглядають подібними до таких: Базові рівні n = 11: [2, 7, 7, 3, 6, 3, 2, 4, 4, 3, 14]. 1-й пост n = 10 [167, 200, 45, 132,., 245, 199, 177, 134, 298, 111]. 2-й пост n = 9 [75, 43, 23, 98, 87,., 300,., 118, 202, 156]. 3-й рівень рівня n = 8 [23, 34, 98, 112,., 200,., 156, 54, 18,.]. Є чотири загальні моменти часу.
msturm17

Відповіді:


5

Я переосмислив вашу проблему і виявив тест Фрідмана, який є непараметричною версією однобічного ANOVA з повторними заходами .

Я сподіваюся, що у вас є деякі основні навички R.

# Creating a source data.frame
my.data<-data.frame(value=c(2,7,7,3,6,3,2,4,4,3,14,167,200,45,132,NA,
245,199,177,134,298,111,75,43,23,98,87,NA,300,NA,118,202,156,23,34,98,
112,NA,200,NA,156,54,18,NA),
post.no=rep(c("baseline","post1","post2","post3"), each=11),
ID=rep(c(1:11), times=4))

# you must install this library
library(pgirmess)

Виконайте тест Фрідмана ...

friedman.test(my.data$value,my.data$post.no,my.data$ID)

    Friedman rank sum test

data:  my.data$value, my.data$post.no and my.data$ID
Friedman chi-squared = 14.6, df = 3, p-value = 0.002192

а потім знайти між якими групами різниця існує за допомогою непараметричного пост-спеціального тесту . Тут у вас є всі можливі порівняння.

friedmanmc(my.data$value,my.data$post.no,my.data$ID)
Multiple comparisons between groups after Friedman test 
p.value: 0.05 
Comparisons
               obs.dif critical.dif difference
baseline-post1      25     15.97544       TRUE
baseline-post2      21     15.97544       TRUE
baseline-post3      20     15.97544       TRUE
post1-post2          4     15.97544      FALSE
post1-post3          5     15.97544      FALSE
post2-post3          1     15.97544      FALSE

Як видно, лише базовий рівень (перший момент часу) статистично відрізняється від інших.

Я сподіваюся, що це вам допоможе.


1
Ладислав, це відмінна відповідь на це питання. Це надзвичайно ретельно і повно. Єдине питання, яке я бачу, - це те, що Крускал-Уолліс ANOVA також має припущення про незалежність спостережень, таким чином, що на кожному рівні незалежної змінної є різні суб'єкти, яких у цьому випадку у нас немає, оскільки ми слідуємо за тим самим 11 пацієнти протягом 4-х часових моментів. Чи є у вас думка з цього приводу чи є на увазі якісь інші методи для вирішення цього питання? Дуже дякую!
Метт Райхенбах

Я видалив свій коментар вище. Нарешті я знайшов кращий тест. Насолоджуйтесь!
Ladislav Naďo

Це не моє первісне запитання @ msturm17, тобі доведеться прийняти вашу відповідь, але я дав тобі щедрість!
Метт Райхенбах

Дякую, Ладислав, що знайшли час, щоб ретельно відповісти на моє запитання!
msturm17

2

Якщо ви не знаєте розподілу окремих змін у часі, ви не можете наблизити їх до розподілу між пацієнтами. Наприклад, якщо у вас є 10 пацієнтів з відповідними рівнями заліза (510,520, ..., 600) до лікування та (520,530, ..., 610) після лікування, Kruskal-Wallis ANOVA (або будь-який інший аналогічний алгоритм) вимагає що не відбувається суттєвої зміни рівня заліза.

ІМХО, без контрольної групи, найкраще зробити, це підрахувати, скільки пацієнтів підвищили рівень заліза і скільки знизили його, і перевірити значення цього.

Це означає, що якщо KW ANOVA каже вам, що рівень заліза є значним, він є (відсутні помилкові позитиви).


1
Так, без помилкових позитивів! Ха-ха, дякую за вашу відповідь. Як ви пропонуєте нам "перевірити значення цього" щодо підрахунку кількості пацієнтів, які підвищили рівень заліза, а скільки знизили його? Спасибі!
Метт Рейхенбах

2
мнp=2-(м+н)к=0м(м+нк)

Дякую! Це був ще один цікавий спосіб переглянути моє запитання та побачити, як воно стосується моїх даних.
msturm17
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.