Статистика та великі дані agreement-statistics

2

Чи дійсно "Полювання на снарка" Джоела Спольського є статистичним аналізом змісту?

Якщо ви останнім часом читали бюлетені спільноти, ви, ймовірно, бачили The Hunting of Snark, публікацію в офіційному блозі StackExchange Джоела Спольського, генерального директора мережі StackExchange. Він обговорює статистичний аналіз, проведений на вибірці коментарів SE для оцінки їх "дружелюбності" з точки зору стороннього користувача. Зауваження були відібрані випадковим чином із StackOverflow, …

25 reliability agreement-statistics methodology

2

Міжрейтингова надійність для порядкових або інтервальних даних

Які методи надійності між рейтингами найбільш підходять для порядкових або інтервальних даних? Я вважаю, що "Спільна ймовірність угоди" або "Каппа" розроблені для номінальних даних. У той час як "Пірсон" та "Спірмен" можуть використовуватися, вони в основному використовуються для двох рейтингів (хоча їх можна використовувати більше двох рейтингів). Які ще заходи …

25 reliability psychometrics agreement-statistics cohens-kappa

5

Як я можу найкраще боротися з ефектами маркерів з різним рівнем щедрості в оцінюванні студентських робіт?

Близько 600 студентів мають оцінку за обширною оцінкою, яку можна припустити, що вона має хорошу надійність / достовірність. Оцінка оцінюється з 100, і це тест з множинним вибором, позначений комп'ютером. Ці 600 студентів також мають бали за другою, другорядною оцінкою. У цій другій частині оцінювання вони розділені на 11 когорт …

13 agreement-statistics

2

Міжбірна надійність подій у часовій серії із невизначеністю часу події

У мене є кілька незалежних кодерів, які намагаються ідентифікувати події у часовій серії - в цьому випадку дивляться відео бесіди віч-на-віч і шукають особливості невербальної поведінки (наприклад, головні кивки) та кодують час і категорію кожного. подія. Ці дані можна обґрунтувати як дискретний часовий ряд із високою швидкістю вибірки (30 кадрів …

13 time-series reliability agreement-statistics

2

Як я можу використовувати ці дані для калібрування маркерів з різним рівнем щедрості при оцінці студентських робіт?

12 викладачів навчають 600 учнів. 12 когорт, яких викладали ці викладачі, становлять від 40 до 90 учнів, і ми очікуємо систематичних відмінностей між когортами, оскільки аспіранти були непропорційно розподілені до певних груп, а попередній досвід показав, що аспіранти в середньому на бал значно вищі, ніж студенти магістратури. Викладачі оцінили всі …

9 teaching agreement-statistics

1

Обчислення надійності між рейтингами в R із змінною кількістю оцінок?

Вікіпедія припускає, що одним із способів розглянути надійність між рейтингами є використання моделі випадкових ефектів для обчислення кореляції внутрішньокласового рівня . Приклад внутрішньокласової кореляції говорить про перегляд σ2ασ2α+σ2ϵσα2σα2+σϵ2\frac{\sigma_\alpha^2}{\sigma_\alpha^2+\sigma_\epsilon^2} від моделі Yij=μ+αi+ϵijYij=μ+αi+ϵijY_{ij} = \mu + \alpha_i + \epsilon_{ij} "де Y ij - j- е спостереження в i- й групі, μ - …

9 r reliability random-effects-model agreement-statistics

Запитання з тегом «agreement-statistics»