Інтервал довіри RMSE


20

Я взяв зразок з яти точок даних у популяції. Кожен з цих пунктів має справжнє значення (відоме з основної істини) та оцінене значення. Потім я обчислюю помилку для кожної вибіркової точки і потім обчислюю RMSE вибірки.н

Як я можу тоді зробити певний інтервал довіри навколо цього RMSE, виходячи з розміру вибірки ?н

Якби я використовував середнє, а не RMSE, я б не мав проблем робити це, оскільки я можу використовувати стандартне рівняння

м=Zσн

але я не знаю, чи справедливо це для RMSE, а не для середнього. Чи є якийсь спосіб я це адаптувати?

(Я бачив це запитання , але у мене немає питань щодо нормального розподілу мого населення, на що йдеться у відповіді)


Що конкретно ви обчислюєте, коли "обчислюєте RMSE вибірки"? Чи є це RMSE з істинних значень, з оціночних значень, або їх відмінності?
whuber

2
Я обчислюю RMSE різниць, тобто обчислюю квадратний корінь середнього квадрату різниць між істинним і оціненим значеннями.
robintw

Якщо ви знаєте "основну правду" (хоча я не впевнений, що це насправді означає), навіщо вам потрібна невизначеність у RMSE? Ви намагаєтесь побудувати якийсь висновок про випадки, коли у вас немає основної правди? Це питання калібрування?
Glen_b -Встановіть Моніку

@Glen_b: Так, саме це ми намагаємось зробити. У нас немає основної істини для всього населення, лише для вибірки. Потім ми обчислюємо RMSE для вибірки, і ми хочемо мати на цьому інтервали довіри, оскільки ми використовуємо цей зразок, щоб зробити висновок про RMSE сукупності.
robintw

1
Можливий дублікат SE з RMSE в R
цікаво

Відповіді:


15

Маючи подібні міркування, як тут , я можу бути в змозі дати відповідь на ваше запитання за певних умов.

Нехай б ваше справжнє значення для я т ч точки даних і х I оціночної вартості. Якщо припустити, що різниці між оцінними та справжніми значеннями маютьхiiтгодх^i

  1. нульове середнє (тобто х я розподілений по ї I )х^iхi

  2. слідувати нормальному розподілу

  3. і всі мають однакове стандартне відхилення σ

коротко:

х^i-хiN(0,σ2),

тоді ви дійсно хочете довірчий інтервал для .σ

Якщо вищезгадані припущення справедливі випливає зрозподілуχ 2 n зn(неn-1) ступенями свободи. Це означає

нRMSE2σ2=н1нi(хi^-хi)2σ2
χн2нн-1

П(χα2,н2нRMSE2σ2χ1-α2,н2)=1-αП(нRMSE2χ1-α2,н2σ2нRMSE2χα2,н2)=1-αП(нχ1-α2,н2RMSEσнχα2,н2RMSE)=1-α.

Тому - ваш інтервал довіри.

[нχ1-α2,н2RMSE,нχα2,н2RMSE]

Ось програма python, яка імітує вашу ситуацію

from scipy import stats
from numpy import *
s = 3
n=10
c1,c2 = stats.chi2.ppf([0.025,1-0.025],n)
y = zeros(50000)
for i in range(len(y)):
    y[i] =sqrt( mean((random.randn(n)*s)**2))

print "1-alpha=%.2f" % (mean( (sqrt(n/c2)*y < s) & (sqrt(n/c1)*y > s)),)

Сподіваюся, що це допомагає.

Якщо ви не впевнені, чи застосовуються припущення, чи ви хочете порівняти те, що я написав, з іншим методом, ви завжди можете спробувати завантажувати .


1
Я думаю, ви помиляєтесь - він хоче CI для RMSE, а не . І я теж цього хочу :)σ
Цікаво

1
MSE=σ^2=1нi=1н(хi-х^i)2нн-1σσ

10

i=1,,нхiх^i

ϵi

ϵi=х^i-хi,BIAS=ϵ¯=1нi=1нϵi,MSE=ϵ2¯=1нi=1нϵi2,RMSE=MSE.

ϵ

STDE2=(ϵ-ϵ¯)2¯=1нi=1н(ϵi-ϵ¯)2,
STDE2=(ϵ-ϵ¯)2¯=ϵ2¯-ϵ¯2=RMSE2-BIAS2.

ϵн<30STDE/н


2
RМSЕ2=SТDЕ2RМSЕ2БЯАS2χ2χ2
fabee

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.