Як замовити чи оцінити набір експертів?


11

У мене є база даних, яка містить велику кількість експертів у цій галузі. Для кожного з цих експертів у мене є різноманітні атрибути / точки даних, такі як:

  • кількість років досвіду.
  • ліцензії
  • кількість відгуків
  • текстовий зміст цих рецензій
  • 5-зірковий рейтинг кожного з цих відгуків, для ряду факторів, таких як швидкість, якість тощо.
  • нагороди, асоціації, конференції тощо.

Я хочу дати оцінку цим експертам з 10 з урахуванням їх важливості. Для деяких експертів деякі пункти даних можуть бути відсутніми. Тепер моє запитання - як мені придумати такий алгоритм? Хтось може вказати мені на якусь релевантну літературу?

Також я стурбований тим, що, як і у всіх рейтингах / оглядах, цифри можуть накопичуватися поблизу деяких значень. Наприклад, більшість з них може отримати 8 або 5. Чи існує спосіб виділити різницю різниці в більшій різниці в оцінці лише для деяких атрибутів.

Деякі інші дискусії, які я вважав, можуть бути актуальними:


Це неможливо зробити, якщо ви не досягнете якогось об'єктивного критерію; ймовірно, більшість можливих оцінок може бути побудовано за допомогою комбінації ваших параметрів.

Відповіді:


12

Люди винайшли численні системи для оцінювання речей (на зразок експертів) за кількома критеріями: відвідайте сторінку Вікіпедії, присвячену аналізу багатокритеріальних рішень . Хоча там недостатньо добре представлений один із найбільш захищених методів: Теорія оцінки множинних атрибутів. Сюди входить набір методів оцінки компромісів серед наборів критеріїв з метою: (a) визначення відповідного способу повторного вираження значень окремих змінних та (b) зважування повторно виражених значень для отримання оцінки за ранжуванням . Принципи прості та виправдані, математика неможлива, і в теорії немає нічого фантазійного. Більше людей повинні знати та застосовувати ці методи, а не вигадувати довільні системи балів.


Чи знаєте ви пакет R для цього?
користувач333

3
@user Ні, і я сумніваюся, що є. Тут, до речі, немає жодної магічної програми програмного забезпечення: майже вся робота полягає у продуманні питань та контрольованому дослідженні конкретних компромісів.
whuber

3

Зрештою, це може бути не виключно статистичним вправою. PCA - це дуже потужний кількісний метод, який дозволить сформувати оцінку або зважити на перших кількох основних компонентах, які ви можете використовувати для ранжування. Однак пояснити, які основні компоненти є дуже складним завданням. Вони є кількісними конструкціями. Вони не діалектичні. Таким чином, пояснити, що вони справді мають на увазі, іноді неможливо. Це особливо вірно, якщо у вас є аудиторія, яка не є кількісною. Вони не матимуть уявлення про те, про що ви говорите. І, подумає про ваш PCA, як про якусь криптовану чорну скриньку.

Натомість я б просто вирівняти всі відповідні змінні та застосував би систему зважування на основі того, що вважає, що слід зважування.

Я думаю, якщо ви розробите це для сторонніх, клієнтів, користувачів, було б чудово, якби ви могли вкласти гнучкість у прийнятті рішення щодо ваги для користувачів.
Деякі користувачі можуть цінувати багаторічний досвід набагато більше, ніж сертифікація та віра. Якщо ви можете залишити це рішення на них. Таким чином, ваш алгоритм не є чорною скринькою, яку вони не розуміють, і їм це не комфортно. Ви тримаєте це повністю прозоро і до них, виходячи з їх власної відносної оцінки того, що має значення.


@Gaetan Ну, для PCA ви повинні знайти відповідне числове кодування для змінної, наприклад "текстовий вміст" ...
chl

Це не питання, яке я піднімаю. PCA може обробляти фіктивні змінні, як ви пропонуєте. PCA неймовірно потужний і гнучкий таким чином. Але, саме тлумачення основних компонентів стає справді складним. Скажімо, перший головний компонент починається так: 0,02-річний досвід - 0,4 текстового змісту оглядів + 0,01 асоціації ... Можливо, ви можете це пояснити. Виконання експертів пропорційно багаторічному досвіду, але обернено пропорційне текстовому змісту рецензій? Це здається абсурдним. Але PCA часто генерує контрінтуїтивні результати.
Sympa

@Gaetan Тим не менш, я повторюю свою думку, що проблема полягає в тому, як ви вирішили представити свої змінні (або як ви знайдете корисну метрику). Я погоджуюся з вами щодо складності інтерпретації лінійної комбінації змінних при роботі з неперервними вимірюваннями або змішанням типів даних. Ось чому я запропонував в іншому коментарі шукати альтернативні методичні методи. У будь-якому випадку, розробка правил балів на основі переваг користувачів або експертного огляду (як це робиться в клінічній оцінці) також вимагає певної статистичної валідації (принаймні для забезпечення надійності балів).
chl

@Gaetan, Так, деякі ваші коментарі мають багато сенсу, і ви праві, говорячи, що це не просто статистичні вправи, а включають елементи, які є більш суб'єктивними. Причина полягає в тому, що наміри з точки зору користувача / клієнтів можуть відрізнятися. Якщо припустити, що він шукає експерта, то я просто додаю фільтри, щоб він міг вибрати експертів> X кількість років досвіду тощо, але скажімо, що він звузився до 2 експертів і хоче незалежного порівняння. Тому я просто шукаю загальний метод для порівняння будь-яких двох експертів.
Сідмітра

2
+1, щоб вказати, що це не є статистичною вправою. У кращому випадку PCA може описати взаємозв'язки в межах певного набору даних і, можливо, спростити дані шляхом ідентифікації близької колінеарності. Не очевидно, як це може повідомити нас про те, як оцінити експертів.
whuber

0

Як ви вважаєте, ви могли б кількісно оцінити всі ці ознаки?

Якщо так, я б запропонував провести аналіз основних компонентів. У загальному випадку, коли всі кореляції є позитивними (а якщо їх немає, ви можете легко потрапити туди за допомогою деякої трансформації), перший головний компонент може розглядатися як міра загальної важливості експерта, оскільки це зважений середнє значення всіх атрибутів (і ваги були б відповідними внесками змінних. Згідно з цією перспективою, сам метод розкриє важливість кожного атрибута). Оцінка, яку кожен експерт досягає в першій головній складовій, - це те, що вам потрібно для їх ранжирування.


1
Це виглядає приємно, але чи не буде він просто вибирати атрибути найвищої дисперсії та найбільші кластери перехресних кореляцій?

1
Крім того, можна виконати багаторазовий аналіз кореспонденції або багатофакторний аналіз для змішаних даних (якщо числове перекодування виявляється нереальним для деяких змінних), а решта вашої ідеї (обчислювальний коефіцієнт обчислення та перегляд змінних навантажень на 1-му вимірі) застосовується так само.
chl

3
Мені здається, перший компонент буде лише вказувати на сильний напрямок спільності серед експертів. Як це могло сказати нам, хто кращий, а хто гірший? Для цього потрібна додаткова інформація щодо взаємозв'язку між цими змінними та якості "експерта" хорошого або "поганого". Якщо ми вважаємо, що всі змінні монотонно асоціюються з добротою чи поганістю, то, можливо, PCA може допомогти нам дослідити межу крайніх (а може бути, просто відсторонених!) Експертів. Але будьте уважні - навіть припущення про монотонність є підозрюваним.
whuber

1
@whuber Я бачу сенс, дякую. Можливо, ви могли б додати це у власній відповіді (що дуже вітається)?
chl
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.