Як ви інтерпретуєте RMSLE (кореневу логарифмічну помилку середнього рівня)?

29

Я проводив змагання з машинного навчання, де вони використовують RMSLE (кореневу середню квадратичну логарифмічну помилку), щоб оцінити ефективність, прогнозуючи ціну продажу категорії обладнання. Проблема в тому, що я не впевнений, як інтерпретувати успіх свого остаточного результату.

Наприклад , якщо я досяг RMSLE з я міг підняти його експонентну потужність і інтерпретувати його як RMSE? (тобто )? $1.052$ $e$ $e^{1.052}=2.863=RMSE$

Чи можу я тоді сказати, що мої прогнози в середньому становили від фактичних цін? Або є кращий спосіб інтерпретувати метрику? Чи можна взагалі інтерпретувати метрику за винятком порівняння з іншими RMSLE іншими моделями? $\pm \$2.863$

— Опус
джерело

З моїх обмежених знань, це: 1. зняти гетероседастичність 2. вирішити проблему різних розмірів

26

Я раніше не бачив RMSLE, але припускаю, що це . $\sqrt{ \frac{1}{N} \sum_{i=1}^N (\log(x_i) - \log(y_i))^2 }$

Таким чином, експоненцію це не дасть вам RMSE, воно дасть вам

$e^\sqrt{ \frac{1}{N} \sum_{i=1}^N (\log(x_i) - \log(y_i))^2 } \ne \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - y_i)^2}$ .

Якщо взяти журнал обох сторін, отримаємо RMSLE проти , що явно не одне і те ж. $\frac{1}{2} \log \left( \frac{1}{N} \sum_{i=1}^N (x_i - y_i)^2 \right)$

На жаль, взагалі немає хороших легких стосунків (хоча хтось розумніший за мене / думає про це важче, ніж я, можливо, міг би використати нерівність Дженсена, щоб з'ясувати деякі стосунки між ними).

Звичайно, це RMSE змінної, перетвореної журналом, для того, що це варто. Якщо ви хочете мати грубе відчуття поширення розподілу, можете натомість отримати приблизний сенс поширення їх логарифму, так що RMSLE 1,052 означає, що "середнє значення" в рази більше, ніж справжнє значення, або 1 / 2,86. Звичайно, це не зовсім те, що означає RMSE .... $2.86$

— Дугал
джерело

Привіт @Dougal дякую! це, безумовно, допомагає з’ясувати речі.

— Opus

18

Я не знаю, чи існує пряма родова інтерпретація, навіть аналізуючи конкретний випадок.

Наприклад, вам може бути цікаво оцінити, що було б помилкою, якщо ви передбачите всі випадки із середнім значенням та порівняєте його зі своїм підходом.

У будь-якому випадку, я вважаю, що RMSLE зазвичай використовується, коли ви не хочете штрафувати величезні відмінності у передбачуваних та справжніх значеннях, коли і передбачувані, і справжні значення великі. У цих випадках мають значення лише відсоткові відмінності, оскільки їх можна переписати

$\log{P_i + 1} - \log{A_i +1} = \log{\frac{P_i + 1}{A_i +1}}$ .

Наприклад, для P = 1000 і A = 500 дасть вам приблизно таку ж помилку, як і коли P = 100000 і A = 50000.

— Евкліди
джерело

1

Я розумію, що коли ми робимо логарифм як за прогнозуванням, так і за фактичними числами, ми отримаємо набагато більш плавні результати, ніж оригінальні. І зменшіть вплив більшого х, при цьому підкресліть менший х для . $\log{x+1}$

Також ви отримаєте інтуїтивне враження, намалювавши простий графік . $y=\log{x+1}$

— Хао
джерело

1

Існує непрямий спосіб вимірювання ефективності функції збитку з точки зору чогось більш зрозумілого, хоча це не буде безпосередньо перетворювати значення, як ви сподівалися.

Після того, як модель пройшла навчання та тестування за допомогою RMSLE, просто скористайтеся новою метрикою. Тільки тому, що модель була підготовлена на RMSLE, це не означає, що ви не можете потім використовувати інші більш зрозумілі функції втрат як метрики.

Наприклад, у Керасі ви можете вказати додаткові функції втрат у категорії метрик у компіляторі моделі. Внизу MSLE використовується для навчання моделі (еквівалентно RMSLE), але також записуються MAE та MSE:

model.compile(loss='mean_squared_logarithmic_error', optimizer='adam', metrics=['mean_absolute_error','mean_squared_error'])

— HowdyEarth
джерело