Завантажувальна програма: оцінка знаходиться за межами довірчого інтервалу


10

Я робив завантажувальну роботу зі змішаною моделлю (кілька змінних з взаємодією та одна випадкова величина). Я отримав цей результат (лише частковий):

> boot_out

ORDINARY NONPARAMETRIC BOOTSTRAP

Call:
boot(data = a001a1, statistic = bootReg, R = 1000)

Bootstrap Statistics :
          original        bias     std. error
t1*   4.887383e+01 -1.677061e+00 4.362948e-01
t2*   3.066825e+01  1.264024e+00 5.328387e-01
t3*   8.105422e+01  2.368599e+00 6.789091e-01
t4*   1.620562e+02  4.908711e+00 1.779522e+00
......

Тепер я хотів отримати інтервали довіри для перехоплення:

> boot.ci(boot_out,type=c("norm","basic","perc"), index=1)
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 1000 bootstrap replicates

CALL : 
boot.ci(boot.out = boot_out, type = c("norm", "basic", 
"perc"), index = 1)

Intervals : 
Level      Normal              Basic              Percentile     
95%   (49.70, 51.41 )   (49.70, 51.41 )   (46.34, 48.05 )  
Calculations and Intervals on Original Scale

Оцінка коригування зміщення становить:

48.873 -1.677
1 47.196

Проблема, яку я маю, полягає в тому, що нормальна та основна ІС знаходяться поза оцінкою (оригінальна та виправлена) Мені просто цікаво, як з цим впоратися.

Оновлення 1:
Ось подібні запитання з великою кількістю відповідей.


2
Лише коментар: Efron & Tibshirani (1993) у класичній книзі висловлювалися доволі проти корекції упередженості, кажучи, що це "небезпечна" та "проблемна" практика, яка може призвести до збільшення стандартних помилок.
Тім

@Tim Дякую за ваш коментар Я перегляну книгу. Можливо, рішення полягає у використанні оцінок та та завантажувального інструменту se * для обчислення довірчих інтервалів. У моєму випадку зміщення впливає на оцінки лише незначно.
giordano

Відповіді:


1

Складність, з якою ви стикаєтеся, полягає в математиці, що має на увазі. Центром оцінювача місцеположення або оцінкою інтервалу можна вважати мінімізацію функції витрат над розподілом. Середнє значення вибірки над гауссом мінімізує квадратичні втрати, тоді як медіана мінімізує функцію абсолютних лінійних втрат над гауссом. Незважаючи на те, що серед населення вони розташовані в одній точці, їх виявляють за допомогою різних функцій витрат.

Ми даємо вам алгоритм і кажемо "зроби це", але перш ніж алгоритм був розроблений, хтось вирішив проблему оптимізації.

Ви застосували чотири різні функції витрат, надаючи три інтервали та оцінку балів. Оскільки функції витрат різні, вони надають вам різні точки та інтервали. З цим нічого робити, окрім ручного уніфікації методики.

Потрібно знайти основні документи і подивитися на базовий код, щоб зрозуміти, які з них відображають, які типи проблем.

Вибачте, що сказали це, але програмне забезпечення вас зрадило. Він зробив свою роботу, і в середньому це чудово виходить, але ви отримали зразок, де програмне забезпечення не працюватиме. Або, скоріше, це працює ідеально, і вам потрібно насправді прокласти свій шлях назад в літературі, щоб визначити, що це насправді.


Дякуємо за те, що він зробив свою роботу, і в середньому це чудово справляється, але ви отримали зразок, де програмне забезпечення не працюватиме та інші відомості. Дійсно, зразок дивний, тому я хотів використовувати Bootsstrap для обчислення ІП. Очевидно, цей метод здається не таким простим, як здається.
giordano
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.