У мене є набір даних із наступним форматом.
Рак бінарного результату / рак немає. Кожен лікар у наборі даних бачив кожного пацієнта і давав незалежне рішення щодо того, хворий на рак чи ні. Потім лікарі дають рівень впевненості з 5, що їх діагноз правильний, а рівень довіри відображається в дужках.
Я спробував різні способи отримати хороші прогнози з цього набору даних.
Мені непогано працює лише серед лікарів, ігноруючи їх рівень довіри. У таблиці вище, яка мала б поставити правильні діагнози для пацієнта 1 та пацієнта 2, хоча було б неправильно сказано, що у пацієнта 3 є рак, оскільки більшістю 2-1 лікарі вважають, що у пацієнта 3 є рак.
Я також спробував метод, в якому ми випадково відбираємо вибірки двох лікарів, і якщо вони не погоджуються один з одним, то вирішальний голос іде до того, хто лікар буде впевненішим. Цей метод економічний тим, що нам не потрібно консультуватися з великою кількістю лікарів, але він також значно збільшує рівень помилок.
Я спробував пов'язаний метод, в якому ми випадково вибираємо двох лікарів, і якщо вони не згодні один з одним, ми випадковим чином вибираємо ще двох. Якщо один діагноз попереду, принаймні, двома «голосами», то ми вирішуємо справи на користь цього діагнозу. Якщо ні, ми продовжуємо брати вибірку більше лікарів. Цей метод досить економічний і не робить занадто багато помилок.
Я не можу не відчути, що мені не вистачає якогось більш досконалого способу робити речі. Наприклад, мені цікаво, чи є якийсь спосіб я розділити набір даних на навчальні та тестові набори, а також розробити якийсь оптимальний спосіб поєднання діагнозів, а потім побачити, як виконуються ці ваги на тестовому наборі. Однією з можливостей є якийсь метод, який дозволяє мені лікарів з обмеженою вагою, які постійно робили помилки в пробному наборі, і, можливо, діагнози з надмірною вагою, які ставляться з високою впевненістю (впевненість корелює з точністю у цьому наборі даних).
У мене є різні набори даних, що відповідають цьому загальному опису, тому розміри вибірки змінюються, і не всі набори даних стосуються лікарів / пацієнтів. Однак у цьому конкретному наборі даних є 40 лікарів, які бачили 108 пацієнтів.
EDIT: Ось посилання на деякі підрахунки, які є результатом мого читання відповіді @ jeremy-miles.
Невзважені результати - у першій колонці. Насправді в цьому наборі даних максимальне значення довіри становило 4, а не 5, як я помилково сказав раніше. Таким чином, після наближення @ jeremy-miles найвищий невагомий бал, який може отримати будь-який пацієнт, буде 7. Це означає, що буквально кожен лікар стверджував, що у цього пацієнта рак 4 довіри. Найнижчий невагомий бал, який може отримати будь-який пацієнт, - це 0, а це означає, що кожен лікар стверджував, що рівень впевненості становить 4, що у цього пацієнта не було раку.
Зважування Альфа Кронбаха. У SPSS я виявив, що загальна Альфа Кронбаха склала 0,9807. Я спробував переконатися, що це значення було правильним, обчисливши Альфу Кронбаха більш ручним способом. Я створив коваріаційну матрицю з усіх 40 лікарів, яку я тут вставлю . Тоді виходячи з мого розуміння альфа-формули Кронбаха де - кількість елементів (тут лікарі - це "предмети") я обчислив шляхом підсумовування всіх діагональних елементів у матриці коваріації, а шляхом підсумовування всіх елементів у коваріаційна матриця. Потім я отримав Потім я підрахував 40 різних результатів Alpha, які коли кожного лікаря віддалили від набір даних. Я зважив будь-якого лікаря, який негативно вплинув на Альфу Кронбаха в нуль. Я придумав ваги для інших лікарів, пропорційні їх позитивному внеску в Альфу Кронбаха.
Зважування за загальними співвідношеннями предметів. Я обчислюю всі співвідношення загальних предметів, а потім зважую кожного лікаря пропорційно величині їх співвідношення.
Зважування коефіцієнтів регресії.
Я все ще не впевнений у тому, як сказати, який метод працює «краще», ніж інший. Раніше я обчислював такі речі, як оцінка рівня майстерності Періса, що підходить для випадків, коли є бінарне передбачення та бінарний результат. Однак зараз у мене прогнози коливаються від 0 до 7 замість 0 до 1. Чи слід перетворювати всі зважені бали> 3,50 до 1, а всі зважені бали <3,50 до 0?
Cancer (4)
до прогнозу відсутності раку з максимальною впевненістю No Cancer (4)
. Ми не можемо сказати, що це No Cancer (3)
і Cancer (2)
те саме, але можна сказати, що континуум є, і середні моменти в цьому континуумі є Cancer (1)
і є No Cancer (1)
.
No Cancer (3)
цеCancer (2)
? Це трохи спростить вашу проблему.