AUC в порядковій логістичній регресії


10

Я використовую 2 різновиди логістичної регресії - один - простий тип, для двійкової класифікації, а другий - порядковий логістичний регрес. Для обчислення точності першого я використовував перехресну перевірку, де я обчислював AUC для кожної складки і ніж обчислював середнє AUC. Як я можу це зробити для звичайної логістичної регресії? Я чув про узагальнену ROC для багатокласних прогнозів, але не знаю, як її обчислити.

Дякую!


1
не AUC, але пов’язано з ними: на кривих мікро-макро-точності відкликання на stats.stackexchange.com/questions/21551/…
Євген

Відповіді:


4

Мені подобається лише область під кривою ROC ( -index), тому що це, можливо, є конкордантною ймовірністю. - будівельний блок коефіцієнтів кореляції рангів. Наприклад, . Для порядкового , є відмінним показником прогнозуючої дискримінації, а R пакет надає зручні способи отримати самозавантаження перенавчання скоригованих оцінок . Ви можете повернути рішення для узагальненого -index (генералізованого AUROC). Є причини , щоб не розглядати кожен рівень окремо , тому що це не використовує порядковий характер .ccDxy=2×(c12)YDxyrmsDxycYY

В rmsє дві функцій для порядкової регресії: lrmі orm, другий обробки безперервної і забезпечуючи більше розподілу сімей (посилання функції) , ніж пропорційні шанси.Y


Основним питанням буде те, як rms обчислює використаний у ? cindexDxy
Чемберлен Фонша

1
Це написано Сомером . Узагальнений -index просто обчислюється зворотним рішенням рівняння, яке я перераховував вище. Внутрішні, всі можливі комбінації спостережень, що мають різні значення , досліджуються, і частка таких пар, для яких прогнози є в одному порядку, є оцінкою ймовірності узгодження. Я неправильно зазначив одне: функція використовує Spearman замість . cYormρDxy
Френк Харрелл

Дякуємо за виправлення орфографії. У порядковій регресії буде набагато цікавіше не тільки подивитися на впорядкування в парному порядку, як це робиться у згаданій вами функції orm, але й подивитися на послідовне упорядкування (з потрійними або вищими операторами) залежно від кількості класів у вас. Підсумовуючи те, що я говорю: із накопиченою логістичною регресією, наприклад, впорядковано заняття в класі. захід також повинен мати можливість не проводити попарне порівняння а порівняння форми $ P (pred_1 <pred_2 <pred_3 | obs_1 <obs_2 <oP(pred1<pred2|obs1<obs2)
Чемберлен Фонша

Не знаючи про такі заходи, моя перша реакція полягає в тому, що вони встановлюють високу планку для перешкод.
Френк Харрелл

1

AUC для порядкової регресії - щось складне. Ви можете обчислити AUC для кожного класу, створивши манекени, щоб взяти значення 1 для класу, для якого ви обчислюєте AUC, і 0 для решти інших класів. Якщо у вас є 4 класи, то ви створите 4 AUC і побудувати їх на одному графіку. Основна проблема цього методу полягає в тому, що він однаково карає промахування. Набагато інтуїтивніше пропустити класифікацію класу 1 до класу 3 слід гірше, ніж пропустити класифікацію класу 1 у 2 клас.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.