12 викладачів навчають 600 учнів. 12 когорт, яких викладали ці викладачі, становлять від 40 до 90 учнів, і ми очікуємо систематичних відмінностей між когортами, оскільки аспіранти були непропорційно розподілені до певних груп, а попередній досвід показав, що аспіранти в середньому на бал значно вищі, ніж студенти магістратури.
Викладачі оцінили всі документи у своїй когорті та присвоїли їм оцінку із 100.
Кожен учитель також розглядав один випадково вибраний папір від трьох інших вчителів, і давав йому оцінку з 100. Кожен вчитель мав три свої документи, позначені іншим учителем. 36 різних паперів таким чином було перекреслено таким чином, і я називаю це моїми даними калібрування.
Я також бачу, скільки аспірантів було в кожній когорті.
Мої запитання:
A) Як я можу використовувати ці дані калібрування для коригування початкових знаків, щоб зробити їх справедливішими? Зокрема, я хотів би максимально вимити наслідки надмірно щедрих / недоброзичливих виробників.
Б) Наскільки відповідні мої дані калібрування? У мене не було вибору щодо досить обмежених 36 точок даних даних калібрування, які я отримав у цьому курсі, і не маю жодної можливості збирати більше протягом поточного семестру. Однак якщо ця ситуація повториться, можливо, я зможу зібрати більше даних про калібрування або зібрати різні типи даних калібрування.
Це питання є відносним до популярного питання, яке я задав у: Як я можу найкраще боротися з ефектами маркерів з різним рівнем щедрості при оцінюванні студентських робіт? . Однак це інший курс, і я не впевнений, наскільки корисне читання цього питання буде основою для цього поточного, оскільки головна проблема полягала в тому, що я не мав даних про калібрування.
lm(score ~ gradStudent + ... + teacherID
повинно це робити.