Як інтерпретувати заходи помилок?


41

Я запускаю класифікацію у Weka для певного набору даних, і я помітив, що якщо я намагаюся передбачити номінальне значення, то вихід конкретно показує правильно та неправильно прогнозовані значення. Однак тепер я запускаю його для числового атрибута, а вихід:

Correlation coefficient                 0.3305
Mean absolute error                     11.6268
Root mean squared error                 46.8547
Relative absolute error                 89.2645 %
Root relative squared error             94.3886 %
Total Number of Instances               36441 

Як я трактую це? Я намагався гуглювати кожне поняття, але мало розумію, оскільки статистика зовсім не в моїй галузі знань. Я дуже вдячний для відповіді типу ELI5 з точки зору статистики.

Відповіді:


52

Позначимо справжнє значення інтересу як & і вартості , оціненої з допомогою якої - то алгоритм , як & thetas .θθ^

Кореляція говорить вам , скільки і θ пов'язані між собою . Це дає значення між - 1 і 1 , де 0 немає зв'язку, 1 дуже сильна, лінійна залежність і - 1 є зворотною лінійного зв'язку (тобто більші значення & thetas вказують менші значення & thetas , або навпаки). Нижче ви знайдете ілюстрований приклад кореляції.θθ^1101-1θθ^

Приклад кореляції

(джерело: http://www.mathsisfun.com/data/correlation.html )

Середня абсолютна помилка:

МАЕ=1Ni=1N|θ^i-θi|

Коренева середньоквадратична помилка є:

RМSЕ=1Ni=1N(θ^i-θi)2

Відносна абсолютна помилка :

RАЕ=i=1N|θ^i-θi|i=1N|θ¯-θi|

θ¯θ

Відносна коренева помилка у корені:

RRSЕ=i=1N(θ^i-θi)2i=1N(θ¯-θi)2

θ

МАЕRМSЕМSЕθθ^θ

RАЕRRSЕθ(θ¯-θi)2|θ¯-θi|θθθ

Перевірте також ці слайди .


Дякую за ваше пояснення! Я намагаюся оцінити працездатність різних алгоритмів. Наприклад, якщо я отримаю цей інший вихід (Кореляція: 0.3044, МАЕ: 10.832, MSE: 47.2971, RAE: 83.163%, RSE: 95.2797%), і я спробую порівняти його з першим, який би я міг сказати, виконаний краще?
FloIancu

5
Вам слід вибрати модель із більшою кореляцією та меншими оцінками помилок. Як бачите, існує декілька показників продуктивності моделі (а таких лише кілька), і вони часом дають різні відповіді. Це майже ніколи відповідь "так / ні", яку ви отримуєте. Завдання вибору моделі стане простішим, якщо ви досягнете теорії, ви можете перевірити, наприклад, ці лекції .
Тім

Дуже дякую! Я пішов вперед і позначив вашу відповідь як відповідь, тому що ви багато мені допомогли!
FloIancu

1
@Tim Середня абсолютна помилка, ймовірно, повинна бути скорочена як MAE :)
Антуан

1
@MewX Які посилання ви шукаєте? Це в основному масштаб RMSE. Не можна багато про що сказати ...
Тім
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.