Концептуальне розуміння кореневої середньої помилки у квадраті та середнього відхилення зміщення


13

Я хотів би отримати концептуальне розуміння помилки кореневого середнього квадрату (RMSE) та середнього відхилення зміщення (MBD). Підрахувавши ці заходи для власного зіставлення даних, я часто здивований, виявивши, що RMSE є високим (наприклад, 100 кг), тоді як MBD низький (наприклад, менше 1%).

Більш конкретно, я шукаю посилання (не в Інтернеті), яке перераховує та обговорює математику цих заходів. Яким є звичайно прийнятий спосіб розрахунку цих двох заходів, і як я повинен повідомити про них у статті статті журналу?

У контексті цієї публікації було б дуже корисно мати набір даних про іграшку, який можна використовувати для опису розрахунку цих двох заходів.

Наприклад, припустимо, що я повинен знайти масу (у кг) 200 віджетів, вироблених конвеєрним рядком. У мене також є математична модель, яка намагатиметься передбачити масу цих віджетів. Модель не повинна бути емпіричною, і вона може бути заснована на фізичній основі. Я обчислюю RMSE та MBD між фактичними вимірюваннями та моделлю, виявляючи, що RMSE становить 100 кг, а MBD - 1%. Що це означає концептуально, і як би я інтерпретував цей результат?

Тепер припустимо, що з результатів цього експерименту я знаходжу, що RMSE становить 10 кг, а MBD - 80%. Що це означає, і що я можу сказати про цей експеримент?

Який сенс цих заходів, і що вони означають ці двоє (разом узятих)? Яку додаткову інформацію дає MBD при розгляді з RMSE?


2
Ви оглянули наш сайт, Микола? Подумайте, починаючи з stats.stackexchange.com/a/17545, а потім вивчіть деякі теги, які я додав до вашого питання.
whuber

@whuber: Дякую Ваубер! Я оглянув цей сайт, але мені все ще складно зрозуміти, що насправді мається на увазі в контексті мого власного дослідження.
Ніколас Кінар

Відповіді:


21

Я думаю, що ці поняття легко пояснити. Тому я б швидше описав це тут. Я впевнений, що багато елементарних статистичних книг висвітлюють це, включаючи мою книгу "Основи біостатистики для лікарів, медсестер та лікарів".

Подумайте про ціль із бичачим оком посередині. Середня квадратна помилка представляє середню квадратичну відстань від стріли, вистріленої у ціль та центр. Тепер якщо ваші стрілки рівномірно розкидаються по центру, то стрілець не має зміщення прицілювання, а середня квадратна помилка така ж, як дисперсія.

Але загалом стрілки можуть розлітатися навколо точки від цілі. Середня квадратна відстань стрілок від центру стрілок - це дисперсія. Цей центр можна розглядати як точку націлювання стрільців. Відстань від цього центру стрільби або точки цілі до центру цілі є абсолютною величиною зміщення.

Думаючи правий трикутник, де квадрат гіпотенузи є сумою квадратів двох сторін. Отже, відстань у квадраті від стрілки до цілі - це квадрат відстані від стрілки до точки цілі та площа відстані між центром цілі та ціллю. Усереднення всіх цих квадратних відстаней дає середню квадратичну помилку як суму квадратичного зміщення та дисперсії.


Дякую; це дуже цінується. Мені все ще важко зрозуміти, в чому різниця між RMSE та MBD. Як я розумію, RMSE кількісно визначає, наскільки близька модель експериментальним даним, але яка роль MBD? Можливо, моє непорозуміння просто пов'язане з термінологією.
Ніколас Кінар

1
Середнє відхилення зміщення, як ви це називаєте, - це термін зміщення, який я описав. Він вимірює, наскільки далеко від мети знаходиться ціль. Упередженість робить внесок неточним.
Майкл Р. Черник

Ще раз дякую, Майкл. Тож високий RMSE і низький MBD означає, що це хороша модель?
Микола Кінар

Ні високий RMSE і низький MBD просто говорять про те, що модель погана через велику дисперсію, а не великий ухил. RMSE - це число, яке визначає, наскільки хороша модель.
Майкл Р. Черник

1
@bbadyalina: вони є незалежними частинами інформації, так само, як вгору / вниз та вліво / вправо незалежно. Ваше запитання схоже на запитання: "якщо точка розташована по вертикалі, і відстаньте ліворуч, чи знаходиться вона посередині?" , або "Якщо точка вгорі, але по горизонталі в центрі, вона знаходиться посередині?"
naught101

1

RMSE - це спосіб виміряти, наскільки хороша наша прогнозована модель над фактичними даними, чим менше RMSE, тим кращий спосіб поведінки моделі, тобто якщо ми перевірили це на новому наборі даних (не на нашому навчальному наборі), але потім знову RMSE 0,37 в діапазоні від 0 до 1, пояснює велику кількість помилок, порівняно з RMSE 0,01 як кращою моделлю. BIAS призначений для завищення або заниження.


Не могли б ви надати більше деталей та розроблений приклад? ОП шукає інтуїтивне пояснення значення RMSE, скажімо, 100, проти його проблеми з оцінкою.
Сіань

Це, здається, не дає великої інтуїції. Чи можете ви пояснити більше?
Glen_b -Встановіть Моніку

0

Наскільки я можу зрозуміти, RMSE дає більш точне значення помилки між моделлю та спостережуваною, однак BIAS, крім того, щоб дати значення помилки (менш точної, ніж RMSE), він також може визначити, чи є модель позитивне зміщення або негативне зміщення, якщо модель недооцінює або завищує спостережувані значення.


Ні. Ви можете вважати RMSE як "точність" моделі - наприклад, скільки поширення існує в помилках її передбачень (зауважте: точність - це зворотна дисперсія - висока дисперсія = низька точність). І ви можете вважати зміщення як систематичну помилку в моделі - наприклад, середнє значення всіх помилок. Робоча «точність» - це невизначене поєднання обох, і тому викликає багато плутанини.
naught101
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.