... очікувана [квадратична помилка] втрата може бути розкладена на термін зміщення у квадраті (який описує, наскільки середні прогнози від істинної моделі), термін дисперсії (який описує поширення прогнозів навколо середнього) та термін шуму (який дає внутрішній шум даних).
Дивлячись на декомпозицію втрат помилок у квадраті
Я бачу лише два терміни: один для зміщення та інший для дисперсії оцінки чи прогноктора . Немає додаткового терміну шуму в очікуваних збитках. Як це має бути, оскільки мінливість - це мінливість , а не самого зразка.δ
Eθ[(θ−δ(X1:n))2]=(θ−Eθ[δ(X1:n)])2+Eθ[(Eθ[δ(X1:n)]−δ(X1:n))2]
δ ( X 1 : n )δ(X1:n)δ(X1:n)
- Чи можна розкласти дисперсійне зміщення за допомогою функцій втрат, крім втрат у квадраті?
Моя інтерпретація розкладу квадратичного зміщення + дисперсії [і того, як я навчаю це] полягає в тому, що це статистичний еквівалент теореми Піфагора, а саме те, що відстань у квадраті між оцінником і точкою в межах певного набору є сумою відстані у квадраті. між оцінником і безліччю, плюс відстань у квадраті між ортогональною проекцією на множину та точкою у множині. Будь-яка втрата, заснована на відстані з даним набором даних, чи існує більше однієї моделі, очікувана втрата якої мінімальна для всіх моделей, і якщо це так, чи означає це, що можуть бути різні комбінації зміщення та дисперсії, які дають вихід той самий мінімальний очікуваний збиток від ортогональної проекції, тобто внутрішній продукт, тобто, по суті, Гільбертові простори, задовольняє це розкладання.
- Чи є для даного набору даних модель більше однієї моделі, очікувані втрати якої є мінімальними для всіх моделей, і якщо так, то чи означає це, що можуть бути різні комбінації зміщення та дисперсії, що дають однакові мінімальні очікувані втрати?
Питання незрозуміле: якщо під мінімальними моделями ви маєте на увазі
то є багато прикладів статистичні моделі та пов'язані з ними рішення з постійною очікуваною втратою (або ризиком). Візьмемо для прикладу MLE середнього значення.
minθEθ[(θ−δ(X1:n))2]
- Як можна обчислити упередженість, якщо ви не знаєте справжньої моделі?
У загальному сенсі зміщення - це відстань між справжньою моделлю та найближчою моделлю в межах передбачуваного сімейства розподілів. Якщо справжня модель невідома, зміщення може бути встановлено завантажувальним інструментом.
- Чи існують ситуації, в яких є більше сенсу мінімізувати зміщення чи відхилення, а не очікувану втрату (сума квадратичного зміщення та дисперсії)?
При розгляді іншої функції втрати на зразок
натиснувши до нуля, ставить більшість оцінок на зміщення, при цьому натискаючи на нескінченність, перемикає фокус на дисперсії.α α
(θ−Eθ[δ(X1:n)])2+α[(Eθ[δ(X1:n)]−δ(X1:n))2]0<α
αα