Статистичний тест для порівняння точності двох пристроїв


10

Я порівнюю два пристрої контролю температури, обидва призначені для підтримки температури тіла рівно 37 градусів у хворих на наркоз. Прилади були встановлені для 500 пацієнтів, що утворюють дві групи. Група А (400 пацієнтів) - Пристрій 1, група В (100 пацієнтів) - Пристрій 2. Кожен пацієнт вимірював свою температуру один раз на годину протягом 36 годин, що дало мені 18000 точок даних для двох груп. Мені потрібно визначити, який пристрій контролює температуру тіла пацієнтів більш точно протягом 36 годин. Я створив лінійні графіки, що поєднують медіанні значення в кожний момент часу з квадратними брусками, і візуально, схоже, є різниця. Як я повинен аналізувати свої дані, щоб довести статистичну різницю?


Чи ділилися ви пацієнтами між пристроями? Якщо ви цього не зробили, має бути додаткове припущення, що пацієнти двох груп схожі в широкому розумінні.
Аксакал

Як щодо моделі змішаних ефектів? Стандартні помилки для кожного рівня (група A / B) в певному сенсі означають, наскільки точні вимірювання. Ви можете враховувати часовий ряд та пацієнтів.
Роман Луштрик

Відповіді:


2

o

Коли ви формулюєте цей вид метрики, ви неявно приймаєте "штрафну функцію", яка карає температури, що відхиляються від бажаної температури. Одним із варіантів може бути вимірювання "точності" за меншою дисперсією навколо бажаної температури (трактуючи це як фіксовану середню для розрахунку дисперсії). Дисперсія карається похибкою у квадраті, так що дає розумні штрафи за високі відхилення. Іншим варіантом може бути більш жорстоке покарання (наприклад, кубічна помилка). Іншим варіантом було б просто виміряти кількість часу, яким кожний пристрій має пацієнта за межами діапазону температури, який є медично безпечним. У будь-якому випадку, що б ви не вибрали, повинно відображатись сприйнята небезпека відхилення від бажаної температури.

Після того, як ви визначили, що являє собою метрику "хорошої точності", ви збираєтеся сформулювати якийсь "тест на гетероседастичність", сформульований у більш широкому розумінні, що дозволяє будь-яку міру точності, яку ви використовуєте. Я не впевнений, що я згоден з коментарем Ваубера про коригування автокореляції. Це дійсно залежить від вашої формулювання втрат - адже перебування у високотемпературному діапазоні протягом тривалого періоду часу може бути саме найнебезпечнішою справою, тому, якщо ви пристосуєтеся до обліку автоматичної кореляції, ви можете закінчитися до недостатнього покарання високо небезпечних результатів.


0

Це тест на гомоскедастичність. А оскільки це часовий ряд, відповідним вибором є тест Бреуша — Язичника , а не F-тест. Цей тест відповідає ТІЛЬКИ на питання рівності точності між двома пристроями. Рівень точності - це ще один спосіб мислення дисперсії.

[Редагувати: змінив тест на правильний, враховуючи залежність від часу]


3
Такий підхід є розумним. Але чому б не досягти обох цілей безпосередньо, порівнявши дисперсії навколо цільової температури, а не дисперсії (які вимірюють лише дисперсії навколо середніх температур)? Одне важливе питання, яке слід перевірити, стосується спорідненої кореляції: якщо вона висока, то необхідно здійснити певну корекцію (наприклад, зниження ступеня свободи в тестах). Інше питання стосується втрат : функція втрат, ймовірно, не є квадратичною. Можливо, люди з легкістю переносять невеликі коливання, але виникнення великого коливання може зашкодити. Це слід вивчити.
whuber

@whuber Що стосується порівняння навколо цільової температури, якби я був, це саме те, що я б робив. ОП спеціально просто задало питання про дисперсію, тож незалежно від наших схильностей, ми повинні це вирішувати безпосередньо, так? :)
Gary Chung

2
Проблема для тесту на F не буде нормальністю, швидше за все, це буде незалежність. Це часові ряди.
Glen_b -Встановіть Моніку

@Glen_b Не можу повірити, що я пропустив цю точку. Дякую, що ви це зробили. Відредаговано.
Гері Чунг

9
Що стосується, ні: відмінність цього веб-сайту та, скажімо, від сайту Math полягає в тому, що значна частина відповідей на статистичні запитання передбачає допомогу ОП в його структурі за призначенням. Досить часто правильні відповіді на запитання, які тут задавали спочатку, є менш корисними або навіть оманливими. Отже, наше перше завдання як активних читачів та потенційних респондентів - це переконатись, що ми інтерпретуємо це питання корисно та доцільно, та надати відповіді, які найкраще відповідають цілям ОП. Використовуйте коментарі до питання, щоб задати уточнюючі питання та перевірити своє тлумачення.
whuber

0

Якщо вас цікавить, наскільки добре пристрої підтримують температуру 37С, ви можете:

  1. Використовуйте всі наявні дані від кожної людини, як є
  2. Оцініть середнє відхилення на людину від 37С за допомогою 36 випробувань кожної людини.

Ці дані, природно, піддаються повторному лікуванню. Розглядаючи випробування всередині людини як кластери, ви зменшите ймовірність помилково оціненого інтервалу довіри навколо ефекту пристрою. Крім того, ви можете перевірити вплив часу між обома пристроями або як взаємодія з пристроєм, щоб з’ясувати, чи було добре підтримувати температуру протягом часу. Пошук способу візуалізації всього цього має ключове значення і може запропонувати один підхід над іншим. Щось у напрямку:

library(dplyr)
library(lme4)

set.seed(42)
id <- rep(1:500, each=36)
time <- rep(1:36,500)
temp <- c(rnorm(36*400, 38,0.5), rnorm(36*100,37.25,0.5))
temp <- temp + 1/time

prox_37 <- temp - 37
group <- c(rep("A",36*400), rep("B",36*100))
graph_t <- ifelse(group=="A", time-0.25, time+0.25)
df <- data.frame(id,time,temp,prox_37,group, graph_t)

id_means <- group_by(df, id) %>% summarize(mean_37 = mean(prox_37))
id_means$group <- c(rep("A",400), rep("B",100))

boxplot(id_means$mean_37 ~ id_means$group)

plot(graph_t, prox_37, col=as.factor(group))
loess_fit <- loess(prox_37 ~ time, data = df)
lines(c(1:36), predict(loess_fit, newdata= c(1:36)) , col = "blue")

summary(t.test(mean_37 ~group, data=id_means))

model1 <- glm(prox_37 ~ as.factor(group), family = "gaussian", data=df)
model2 <- lmer(prox_37 ~ as.factor(group) + (1 | id), data=df)
model3 <- lmer(prox_37 ~ as.factor(group) + time + (1 | id), data=df)
model4 <- lmer(prox_37 ~ as.factor(group) + time + time*as.factor(group) + (1 | id), data=df)

AIC(model1)
summary(model2)
summary(model3)
summary(model4)

введіть тут опис зображення

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.