Для того, щоб відкалібрувати рівень довіри до ймовірності в контрольованому навчанні (скажімо, зіставити довіру з SVM або дерева рішень за допомогою проб даних), одним із методів є використання масштабування Платта (наприклад, отримання каліброваних ймовірностей з підвищення рівня ).
В основному використовується логістична регресія для відображення на . Залежна змінна є справжньою міткою, а провісник - впевненістю від некаліброваної моделі. Що я не розумію, це використання цільової змінної, відмінної від 1 або 0. Метод вимагає створення нової "мітки":
Щоб уникнути переналагодження сигмоподібного набору поїздів, використовується позамодельна модель. Якщо в наборі поїздів є позитивні приклади та негативні приклади, для кожного прикладу тренування Платт Калібрування використовуються цільові значення та (замість 1 та 0 відповідно), де
Я не розумію, наскільки ця нова ціль корисна. Чи не буде логістична регресія просто розглядати залежну змінну як бінарну мітку (незалежно від того, яка мітка задана)?
ОНОВЛЕННЯ:
Я виявив, що в SAS зміна залежного від на щось інше повертається назад до тієї ж моделі (за допомогою ). Можливо, моя помилка чи, можливо, відсутність універсальності SAS. Я зміг змінити модель в Р. Як приклад:PROC GENMOD
data(ToothGrowth)
attach(ToothGrowth)
# 1/0 coding
dep <- ifelse(supp == "VC", 1, 0)
OneZeroModel <- glm(dep~len, family=binomial)
OneZeroModel
predict(OneZeroModel)
# Platt coding
dep2 <- ifelse(supp == "VC", 31/32, 1/32)
plattCodeModel <- glm(dep2~len, family=binomial)
plattCodeModel
predict(plattCodeModel)
compare <- cbind(predict(OneZeroModel), predict(plattCodeModel))
plot(predict(OneZeroModel), predict(plattCodeModel))