Як інтерпретувати середньоквадратичну помилку (RMSE) проти стандартного відхилення?


21

Скажімо, у мене є модель, яка дає мені прогнозовані значення. Я обчислюю RMSE цих значень. А потім стандартне відхилення фактичних значень.

Чи має сенс порівнювати ці два значення (дисперсії)? Я думаю, що якщо RMSE і стандартне відхилення схожі / однакові, то помилка / дисперсія моєї моделі є такою ж, як і на ділі. Але якщо навіть не має сенсу порівнювати ці значення, то цей висновок може бути помилковим. Якщо моя думка правдива, то це означає, що модель настільки ж хороша, наскільки вона може бути, тому що вона не може пояснити, що викликає дисперсію? Я думаю, що остання частина, ймовірно, помиляється або, принаймні, потребує більше інформації, щоб відповісти.

Відповіді:


22

Скажімо, наші відповіді y1,,yn а наші прогнозовані значення y^1,,y^n .

Дисперсія вибірки (використовуючи а не для простоти) дорівнює тоді як MSE - . Таким чином, вибіркова дисперсія дає те, наскільки відповіді різняться в середньому, в той час як MSE визначає, наскільки відповіді змінюються залежно від наших прогнозів. Якщо ми вважаємо загальне середнє значення як найпростіший прогноз, який ми коли-небудь вважали, то, порівнюючи MSE з вибірковою дисперсією відповідей, ми можемо побачити, наскільки більше варіантів ми пояснили з нашою моделлю. Саме це робить R ^ 2 значення в лінійній регресії.n - 1 1nn111ni=1n(yiy¯)2ˉ у R 21ni=1n(yiy^i)2y¯R2

Розглянемо наступне зображення: Дисперсія вибірки - це мінливість навколо горизонтальної лінії. Якщо ми проектуємо всі дані на вісь ми можемо це побачити. MSE - середня квадратна відстань до лінії регресії, тобто мінливість навколо лінії регресії (тобто ). Отже, мінливість, виміряна дисперсією вибірки, - це усереднене відстань у квадраті до горизонтальної лінії, яке ми можемо бачити значно більше, ніж середня квадратна відстань до лінії регресії. yiYy^iвведіть тут опис зображення


5

Якщо ви говорите про середню квадратичну помилку передбачення, тут це може бути: залежно від того, скільки ( p ) параметрів оцінено для прогнозування, тобто втрати ступеня свободи (DF).

i(yiy^i)2np,

Дисперсія вибірки може бути: де є просто оцінником середнього значення .

i(yiy¯)2n1,
y¯yi

Отже, ви можете розглядати останню формулу (вибіркова дисперсія) як особливий випадок колишньої (MSE), де а втрата DF становить 1, оскільки середнє обчислення - оцінка.y^i=y¯y¯

Або якщо ви не дуже переймаєтесь тим, як прогнозується , але хочете отримати бальну MSE для вашої моделі, ви все одно можете використовувати наступну формулу, щоб оцінити це, y^i

i(yiy^i)2n,

що найпростіше обчислити.


Я не маю привілею коментувати відповідь @Chaconne, але сумніваюся, чи є в його останньому твердженні помилка друку, де він говорить: "Отже, мінливість, виміряна дисперсією вибірки, - це усереднене відстань у квадраті до горизонтальної лінії, яку ми можемо див. значно менше, ніж середня квадратна відстань до лінії ". Але на малюнку у його відповіді прогнозування значень y за допомогою рядка досить точне, що означає, що MSE невеликий, принаймні набагато кращий, ніж "прогноз" із середнім значенням.
Сяо-Фен Лі

3

За відсутності кращої інформації середнє значення цільової змінної можна вважати простою оцінкою значень цільової змінної, чи намагаються моделювати існуючі дані, чи намагаються передбачити майбутні значення. Ця проста оцінка цільової змінної (тобто прогнозованих значень, рівних середньому значення цільової змінної) буде усунена певною помилкою. Стандартний спосіб вимірювання середньої помилки - це стандартне відхилення (SD) , , оскільки SD має гарну властивість пристосування дзвоникоподібного (гауссового) розподілу, якщо цільова змінна нормально розподілена. Отже, SD можна вважати величиною помилки, яка природно виникає в оцінках цільової змінної.1ni=1n(yiy¯)2Це робить його еталоном, який потрібно намагатися обіграти будь-якій моделі.

Існують різні способи вимірювання похибки оцінки моделі ; серед них середньоквадратична помилка (RMSE), яку ви згадали, , є однією з найпопулярніше. Це концептуально досить схоже на SD: замість того, щоб вимірювати, наскільки далеко від фактичного значення знаходиться середнє значення, він використовує по суті ту саму формулу, щоб виміряти, наскільки далеко від фактичного значення від прогнозування моделі для цього значення. Гарна модель повинна, в середньому, мати кращі прогнози, ніж наївна оцінка середнього рівня для всіх прогнозів. Таким чином, міра варіації (RMSE) повинна зменшити випадковість краще, ніж SD.1ni=1n(yiy^i)2

Цей аргумент стосується інших заходів помилки, не лише до RMSE, але RMSE особливо привабливий для прямого порівняння з SD, оскільки їх математичні формули є аналогічними.


Це найкраща відповідь, оскільки вона пояснює, як порівняння може бути корисним, а не просто описувати відмінності.
Ганс
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.