Чому б не завжди використовувати інтерфейси завантажувача?


12

Мені було цікаво, як виконуються завантажувальні інтерфейси завантаження (і BCa у бартикулярних) на нормально розподілених даних. Здається, багато роботи над вивченням їх роботи на різних типах розподілів, але не вдалося знайти нічого в нормально розподілених даних. Оскільки, здається, спочатку вивчити очевидну річ, я вважаю, що документи просто занадто старі.

Я зробив кілька моделей Монте-Карло, використовуючи завантажувальний пакет R, і виявив, що інтерфейси завантажувальних програм збігаються з точними КІ, хоча для невеликих зразків (N <20) вони, як правило, трохи ліберальні (менші КІ). Для досить великих зразків вони по суті однакові.

Це змушує мене замислитися, чи є якась вагома причина не завжди використовувати завантажувальну систему. Зважаючи на складність оцінювання того, чи є розподіл нормальним, і безліч підводних каменів, які стоять за цим, здається розумним не приймати рішення та повідомляти про КІ завантажувальної програми незалежно від розподілу. Я розумію мотивацію, щоб систематично не використовувати непараметричні тести, оскільки вони мають меншу потужність, але мої симуляції говорять мені, що це не так для КІ завантажувача. Вони ще менші.

Подібне питання, яке мене клопоче, - чому не завжди використовувати медіану як міру центральної тенденції. Люди часто рекомендують використовувати його для характеристики нерозподілених даних, але оскільки медіана є такою ж, як середня для нормально поширюваних даних, навіщо робити розрізнення? Здавалося б, цілком вигідно, якби ми могли позбутися процедур вирішення питання про те, чи є розподіл нормальним чи ні.

Мені дуже цікаво ваші думки з цих питань, і чи були вони обговорені раніше. Посилання були б дуже вдячні.

Дякую!

П’єр


Дивіться тут моє запитання щодо середньої та медіани: stats.stackexchange.com/questions/96371/…
Alexis

Для багатьох проблем перекомплектування обчислювально нездійсненно. Наприклад, якщо ви просто хочете обчислити ІС для великої тривимірної матриці або для тривалого періоду.
jona

Відповіді:


4

Вигідно дивитися на мотивацію інтервалу BCa та його механізми (тобто так звані "корекційні фактори"). Інтервали BCa є одним з найважливіших аспектів завантажувальної програми, оскільки вони є більш загальним випадком інтервалів інтервалу Bootstrap (тобто інтервал довіри, що базується виключно на самому розподілі завантажувальної стрічки).

Зокрема, подивіться на взаємозв'язок між інтервалами BCa та відсотковою інтервалом Bootstrap: коли коригування для прискорення (перший "поправочний коефіцієнт") та косості (другий "поправочний коефіцієнт") дорівнюють нулю, то інтервали BCa повертаються назад до типовий інтервал Bootstrap Percentile.

Я не думаю, що було б гарною ідеєю ЗАВЖДИ використовувати завантажувальний інструмент. Запуск завантаження - це надійна техніка, яка має різноманітні механізми (наприклад: довірчі інтервали та існують різні варіанти завантажувальної стрічки для різних типів проблем, наприклад, дикий завантажувальний пристрій, коли є гетероседастичність) для коригування різних проблем (наприклад: ненормальність ), але він спирається на одне вирішальне припущення: дані точно відображають справжню сукупність.

Це припущення, хоч і просте за своєю суттю, може бути важко перевірити, особливо в умовах малих розмірів вибірки (можливо, малий зразок - це точне відображення справжньої сукупності!). Якщо оригінальний зразок, на якому розподіл завантажувального завантаження (а отже, і всі результати, що випливають з нього), не є достатньо точним, то ваші результати (а отже, і ваше рішення, що базується на цих результатах), будуть хибними.

ВИСНОВОК: Існує багато неоднозначностей із завантажувальним інструментом, і перед застосуванням слід проявити обережність.


2
"Якщо оригінальний зразок, на якому розподіл завантажувального завантаження (а отже, і всі результати, що випливають з нього), не є достатньо точним, то ваші результати (а отже, і ваше рішення, засноване на цих результатах) будуть хибними." -> але чи виконує завантаження CI гірше, ніж аналітична альтернатива в цих випадках?
jona

3
Припущення про те, що дані адекватно представляють сукупність, не є винятковим лише для завантаження даних: воно стосується статистики взагалі, тому якщо дані недостатні, то будь-які умовиводи, умовиводи завантаження або інше, що були зроблені, вводять в оману (помилкове припущення передбачає будь-яке висновок!).
ммммммммммм

4
Таким чином, цей застереження спрямований не на завантажувальний інструмент, а на висновок, і не є аргументом проти використання завантажувального інструменту над іншим методом, а щодо введення абсолютної віри у помилкові методи. Я не бачу, наскільки це актуально в цьому контексті.
jona

Вибачте, трохи пізно в цій темі .... @ jona: чи це не буде актуально, оскільки завантажувальна програма ще більше посилить зразок? Отже, якщо ваш зразок є невдалим викривленням населення, то використання завантажувальної програми відправить вас ще далі від центру населення? Хіба це не потенційний аргумент проти того, щоб систематично покладатися на завантажувальну систему?
sisdog
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.