Запитання з тегом «agreement-statistics»

2
Чи дійсно "Полювання на снарка" Джоела Спольського є статистичним аналізом змісту?
Якщо ви останнім часом читали бюлетені спільноти, ви, ймовірно, бачили The Hunting of Snark, публікацію в офіційному блозі StackExchange Джоела Спольського, генерального директора мережі StackExchange. Він обговорює статистичний аналіз, проведений на вибірці коментарів SE для оцінки їх "дружелюбності" з точки зору стороннього користувача. Зауваження були відібрані випадковим чином із StackOverflow, …

2
Міжрейтингова надійність для порядкових або інтервальних даних
Які методи надійності між рейтингами найбільш підходять для порядкових або інтервальних даних? Я вважаю, що "Спільна ймовірність угоди" або "Каппа" розроблені для номінальних даних. У той час як "Пірсон" та "Спірмен" можуть використовуватися, вони в основному використовуються для двох рейтингів (хоча їх можна використовувати більше двох рейтингів). Які ще заходи …

5
Як я можу найкраще боротися з ефектами маркерів з різним рівнем щедрості в оцінюванні студентських робіт?
Близько 600 студентів мають оцінку за обширною оцінкою, яку можна припустити, що вона має хорошу надійність / достовірність. Оцінка оцінюється з 100, і це тест з множинним вибором, позначений комп'ютером. Ці 600 студентів також мають бали за другою, другорядною оцінкою. У цій другій частині оцінювання вони розділені на 11 когорт …

2
Міжбірна надійність подій у часовій серії із невизначеністю часу події
У мене є кілька незалежних кодерів, які намагаються ідентифікувати події у часовій серії - в цьому випадку дивляться відео бесіди віч-на-віч і шукають особливості невербальної поведінки (наприклад, головні кивки) та кодують час і категорію кожного. подія. Ці дані можна обґрунтувати як дискретний часовий ряд із високою швидкістю вибірки (30 кадрів …

2
Як я можу використовувати ці дані для калібрування маркерів з різним рівнем щедрості при оцінці студентських робіт?
12 викладачів навчають 600 учнів. 12 когорт, яких викладали ці викладачі, становлять від 40 до 90 учнів, і ми очікуємо систематичних відмінностей між когортами, оскільки аспіранти були непропорційно розподілені до певних груп, а попередній досвід показав, що аспіранти в середньому на бал значно вищі, ніж студенти магістратури. Викладачі оцінили всі …

1
Обчислення надійності між рейтингами в R із змінною кількістю оцінок?
Вікіпедія припускає, що одним із способів розглянути надійність між рейтингами є використання моделі випадкових ефектів для обчислення кореляції внутрішньокласового рівня . Приклад внутрішньокласової кореляції говорить про перегляд σ2ασ2α+σ2ϵσα2σα2+σϵ2\frac{\sigma_\alpha^2}{\sigma_\alpha^2+\sigma_\epsilon^2} від моделі Yij=μ+αi+ϵijYij=μ+αi+ϵijY_{ij} = \mu + \alpha_i + \epsilon_{ij} "де Y ij - j- е спостереження в i- й групі, μ - …
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.