Методологія завантаження. Навіщо перепробовувати "із заміною" замість випадкової підсистеми?


11

Метод завантаження в останні роки відчував велику дифузію в останні роки, я також його дуже багато використовую, тим більше, що міркування досить інтуїтивно зрозумілі.

Але це одне, чого я не розумію. Чому Efron вирішив виконати повторний вибір із заміною, а не просто підпрограмувати шляхом випадкового включення або виключення одиничних спостережень?

Я думаю, що випадкове підсимулювання має одну дуже гарну якість, тобто ідеально представляє реальну життєву ситуацію, в якій спостереження, які ми маємо в нашому дослідженні, є підгрупою гіпотетичної сукупності. Я не бачу переваги в тому, що в ході повторного відтворення було багаторазове спостереження. У реальному контексті жодне спостереження не схоже на інше, особливо для складних багатоваріантних ситуацій.


3
перекомпонування з перекомпонування робиться тому, що це правильно робити, враховуючи модель. Модель, що стоїть за завантажувальним механізмом, полягає у використанні непараметричної максимальної ймовірності для оцінки функції кумулятивного розподілу, а потім вибірки незалежних спостережень з оціночної функції кумулятивного розподілу. Подумайте про це --- алгоритмічно, що отримується шляхом вибірки шляхом заміни з вихідного зразка.
kjetil b halvorsen

Відповіді:


10

Один із способів зрозуміти цей вибір - це розглядати обраний зразок як найкраще представлення базової сукупності. Можливо, у вас не може бути все населення для вибірки, але ви маєте саме це представлення. Дійсно випадкова повторна вибірка з цього представлення сукупності означає, що ви повинні зробити вибірку із заміною, інакше ваша пізніша вибірка залежатиме від результатів вашої первинної вибірки. Наявність повторного випадку у конкретному зразку завантажувальної програми представляє членів основної сукупності, які мають характеристики, близькі до характеристик конкретного повторного випадку. Як ви пропонуєте, також можна використовувати підходи "залишити один" або "відпустити кілька", але це перехресне підтвердження, а не завантажувальне завантаження.

Я думаю, що це дуже просто вкладає в інші слова коментар від @kjetil_b_halvorsen


Я розумію сенс. Зробити окремі спостереження у зразку завантажувальної програми незалежними один від одного. У літературі існують методи, засновані на підсистемізації, див. Politis, Romano, Wolf. Використання фіксованого підмножини m n, обраного без заміни. Як вони уникають гріз, про який ви говорили раніше? У їхньому випадку знову я не розумію, чому вони використовують підпробову фіксований розмір замість випадкової підпроби.
Бакабург

2
Методи підсистеми намагаються виконати щось інше, ніж завантажувальний. Ці методи прагнуть вибрати випадкові підмножини з вибірки даних, а не намагатися імітувати новий випадковий вибірки з базової сукупності . Справа не в тому, що те чи інше не так; це різні підходи, які мають особливі сильні та слабкі сторони.
EdM

Тож, можливо, я повинен поставити нове запитання щодо різниці між двома методами у статистиці висновку. Дякую!
Бакабург

@ Bakaburg бачимо це питання для чудового вступу в літературу про завантажувальну програму та перехресну перевірку (що є певним типом підсистеми).
EdM

@Bakaburg Метод завантаження моделює моделювання повторного незалежного малювання випадкових вибірок розміром n (не підмножиною менше n) з більшої сукупності. Це означає, що можливо випадкова вибірка міститиме велику кількість надзвичайно малих або великих значень батьківської сукупності, які часто недостатньо представлені в нашому вихідному зразку. Як зазначав EdM, перекомпонування з заміною дозволяє за допомогою одного спостереження вибірки "представляти" численні спостереження в сукупності, які мають подібні значення - це спосіб отримати плавне наближення розподілу населення.
RobertF
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.