Статистика Kappa ( ) була введена в 1960 році Коеном [1] для вимірювання згоди між двома рейтинговими. Однак його розбіжність була джерелом суперечностей досить довгий час.
Моє запитання про те, який найкращий дисперсійний розрахунок використовувати для великих зразків. Я схильний вважати, що тестований та перевірений Фліссом [2] був би правильним вибором, але, здається, це не єдиний опублікований, який видається правильним (і використовується в досить недавній літературі).
Зараз у мене є два конкретні способи обчислити його велику асимптотичну дисперсію вибірки:
- Виправлений метод, опублікований Фліссом, Коеном та Еверіттом [2];
- Дельта-метод, який можна знайти в книзі Колґтона, 2009 р. [4] (стор. 106).
Щоб проілюструвати деяку частину цієї плутанини, ось цитата Флісса, Коена та Еверітта [2], наголос на моєму:
Багато людських зусиль прокляли неодноразовими невдачами до досягнення остаточного успіху. Масштабування гори Еверест - один із прикладів. Відкриття Північно-Західного проходу - секунда. Виведення правильної стандартної помилки для kappa - третя частина .
Отже, ось короткий підсумок того, що сталося:
- 1960: Коен публікує свою працю «Коефіцієнт узгодження номінальних шкал» [1], вводячи свою коригувану випадковою мірою погодження двох рейтингів під назвою . Однак він публікує неправильні формули для дисперсійних обчислень.
- 1968: Еверіт намагається їх виправити, але його формули також були невірними.
- 1969: Фліс, Коен та Еверіт публікують правильні формули у статті "Великі зразки стандартних помилок каппи та зваженої каппи" [2].
- 1971: Флісс публікує іншу статистику (але іншу) під тим же найменуванням, з неправильними формулами для варіацій.
- 1979 рік: Флісс Ні і Ландіс публікують виправлені формули для Флісса .
Спочатку розглянемо наступні позначення. Це позначення передбачає, що оператор підсумовування повинен застосовуватися до всіх елементів у вимірі, над яким розміщується крапка:
Тепер Kappa можна обчислити так:
В якій
- це дотримана згода, і
- це випадкова угода.
Поки що правильний розрахунок дисперсії для Коена задається:
і під нульовою гіпотезою це задано:
Метод Конгалтона, здається, заснований на дельта-методі отримання варіацій (Agresti, 1990; Agresti, 2002); однак я не впевнений, що таке метод дельти або чому його потрібно використовувати. Варіант за цим методом задається:
в якій
(Конгалтон використовує індекс, а не а , Але це, мабуть, означає те саме. Крім того, я припускаю, що має бути матрицею підрахунку, тобто матриці плутанини, перш ніж ділитися на кількість зразків як пов'язані формулою )
Інша дивна частина полягає в тому, що книга Колгатона, здається, посилається на оригінальний документ Коена, але, схоже, не цитує виправлень до дисперсії Каппи, опублікованої Флісс та ін., Поки він не продовжує обговорювати зважений Каппа. Можливо, його перша публікація була написана тоді, коли справжня формула каппа все ще втрачала в замішанні?
Хтось може пояснити, чому ці відмінності? Або чому хтось використовуватиме дисперсію методу дельта замість виправленої версії Флеїс?
[1]: Фліс, Джозеф Л.; Коен, Яків; Everitt, BS; Великі вибіркові стандартні похибки kappa та зваженої kappa. Психологічний вісник, т. 72 (5), листопад 1969, 323-327. doi: 10.1037 / h0028106
[2]: Коен, Джейкоб (1960). Коефіцієнт узгодження номінальних шкал. Навчально-психологічний вимір 20 (1): 37–46. DOI: 10.1177 / 001316446002000104.
[3]: Алан Агресті, категоричний аналіз даних, 2-е видання. Джон Вілей і сини, 2002.
[4]: Рассел Г. Конгалтон і Грін, К .; Оцінка точності даних дистанційно: принципи та практики, 2-е видання. 2009 рік.