Обчислення надійності між рейтингами в R із змінною кількістю оцінок?


9

Вікіпедія припускає, що одним із способів розглянути надійність між рейтингами є використання моделі випадкових ефектів для обчислення кореляції внутрішньокласового рівня . Приклад внутрішньокласової кореляції говорить про перегляд

σα2σα2+σϵ2

від моделі

Yij=μ+αi+ϵij

"де Y ij - j- е спостереження в i- й групі, μ - загальне незабезпечене середнє значення, α i - непомічений випадковий ефект, що ділиться на всі значення групи i, а ε ij - невиразний шум".

Це приваблива модель, тим більше, що за моїми даними жоден рейтинг не оцінював усі речі (хоча більшість оцінювали 20+), а речі оцінюються різною кількістю разів (зазвичай 3-4).

Питання № 0: Чи "група i" у цьому прикладі ("група i") є групуванням речей?

Питання №1: Якщо я шукаю надійність між рейтингами, чи не потрібна мені модель випадкових ефектів з двома термінами: один для рейтинга та один для рейтингу? Адже обидва мають можливі варіації.

Запитання №2: Як мені найкраще виразити цю модель в R?

Схоже, це питання має гарну пропозицію:

lmer(measurement ~ 1 + (1 | subject) + (1 | site), mydata)

Я переглянув пару питань , і синтаксис "випадкового" параметра для lme непрозорий для мене. Я читаю сторінку довідки для lme , але опис "випадкового" мені незрозумілий без прикладів.

Це питання дещо схожий на довгий список з питань , з цим самим близьким. Однак більшість не звертається до R детально.


Модель змішаного ефекту та випадковий ефект кодуються однаково в Р. Дивіться ncbi.nlm.nih.gov/pmc/articles/PMC3402032 для отримання додаткової інформації про tuto!
noé

Відповіді:


6

Модель, про яку ви посилалися у своєму запитанні, називається "одностороння модель". Він передбачає, що випадкові ефекти рядків є єдиним систематичним джерелом дисперсії. У випадку міжрейтингової надійності рядки відповідають об'єктам вимірювання (наприклад, предметам).

Одностороння модель : де - середнє значення для всіх об'єктів, - ефект рядка, а - залишковий ефект.

xij=μ+ri+wij
μriwij

Однак існують і "двосторонні моделі". Вони припускають, що існує дисперсія, пов'язана з випадковими ефектами рядків, а також випадковими або фіксованими ефектами стовпців. У випадку міжрейтингової надійності стовпці відповідають джерелам вимірювання (наприклад, рейтинги).

Двосторонні моделі : де є середнім для всіх об'єктів, - ефект рядка, - ефект стовпця, - ефект взаємодії, а - залишковий ефект. Різниця між цими двома моделями полягає у включенні чи виключенні ефекту взаємодії.

xij=μ+ri+cj+rcij+eij
xij=μ+ri+cj+eij
μricjrcijeij

Враховуючи двосторонню модель, ви можете обчислити один з чотирьох коефіцієнтів ICC: єдину оцінку узгодженості ICC (C, 1), середню оцінку узгодженості балів ICC (C, k), єдину бальну угоду ICC (A, 1) або середня оцінка угоди ICC (A, k). ІКС з одиничним балом застосовуються до одиничних вимірювань (наприклад, окремих рейтингів), тоді як середні бали ICC застосовуються до середніх вимірів (наприклад, середнє значення всіх рейтингів). ICC-консистенція виключає відмінність стовпця від дисперсії в знаменнику (наприклад, дозволяючи рейтингам змінюватися залежно від власних засобів), тоді як ICC угоди включає дисперсію стовпця у відмінність знаменника (наприклад, вимагаючи, щоб рейтинги змінювались приблизно в одній і тій же середній величині).xijx¯i

Ось визначення, якщо ви припускаєте ефект випадкового стовпця:

Двосторонні визначення випадкових ефектів ICC (з ефектом взаємодії або без нього) :

ICC(C,1)=σr2σr2+(σrc2+σe2) or σr2σr2+σe2
ICC(C,k)=σr2σr2+(σrc2+σe2)/k or σr2σr2+σe2/k
ICC(A,1)=σr2σr2+(σc2+σrc2+σe2) or σr2σr2+(σc2+σe2)
ICC(A,k)=σr2σr2+(σc2+σrc2+σe2)/k or σr2σr2+(σc2+σe2)/k

Ви також можете оцінити ці значення, використовуючи середні квадрати ANOVA:

Двосторонні оцінки ICC :

ICC(C,1)=MSRMSEMSR+(k1)MSE
ICC(C,k)=MSRMSEMSR
ICC(A,1)=MSRMSEMSR+(k1)MSE+k/n(MSCMSE)
ICC(A,k)=MSRMSEMSR+(MSCMSE)/n

Ви можете обчислити ці коефіцієнти в R, використовуючи пакет irr :

icc(ratings, model = c("oneway", "twoway"),
type = c("consistency", "agreement"),
unit = c("single", "average"), r0 = 0, conf.level = 0.95)

Список літератури

McGraw, KO, & Wong, SP (1996). Формування умовиводів про деякі коефіцієнти кореляції внутрішньокласового рівня. Психологічні методи, 1 (1), 30–46.

Shrout, PE, & Fleiss, JL (1979). Внутрішньокласні кореляції: Використання для оцінки надійності рейтингу. Психологічний вісник, 86 (2), 420–428.


Дякую за чудову відповідь! У двосторонній моделі в icc в R, як ми представляємо випадковий вибір рейтингів на рядок? Я маю на увазі, уявіть, у нас є пул з 100 рейтингів, і кожен предмет оцінюється приблизно 5-10 з них. Чи можна обробляти такий сценарій пакетом icc?
michal

Кожен рейтинг повинен мати свій стовпчик у матриці, яку ви подаєте на функцію icc. В іншому випадку обчислення однакові для моделей випадкових та змішаних ефектів - головна відмінність полягає в інтерпретації (наскільки узагальнюючі результати можна вважати).
Джефрі Жирар

Дякую за відповідь! Я намагаюся це зробити, маючи в основному NA в клітинках (і лише кілька значень із фактичними числами на стовпчик, де конкретний рейтинг оцінював предмет, відповідний рядку). Однак у виході я отримую текст, в якому говориться, що ніяких тем не записували (наприклад, Subjects = 0 Raters = 9). Можливо, це означає, що де б не було знайдено хоча б одного НС, весь ряд фільтрується? Але тоді як я можу позначити відсутні рейтинги від рейтингу?
michal

Хм, це може бути обмеженням цієї конкретної функції icc. У мене є сценарій MATLAB, який може впоратися з цією ситуацією. Чи трапляється у вас доступ до MATLAB?
Джеффрі Жирар

1
Так, перегляньте мій веб-сайт: mreliability.jmgirard.com
Джеффрі
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.