Припущення щодо оцінки невизначеності завантажувальної програми


62

Я ціную корисність завантажувальної програми для отримання оцінок невизначеності, але одне, що мене завжди турбує, - це те, що розподіл, відповідний цим оцінкам, - це розподіл, визначений вибіркою. Загалом, здається, поганою ідеєю вважати, що наші вибіркові частоти виглядають точно як базові розподіли, тому чому обгрунтовано / прийнятно отримувати оцінки невизначеності на основі розподілу, де вибіркові частоти визначають базовий розподіл?

З іншого боку, це може бути не гірше (можливо, краще), ніж інші припущення щодо розповсюдження, які ми зазвичай робимо, але я все ж хотів би зрозуміти виправдання трохи краще.


3
Є кілька пов’язаних питань, які ви можете переглянути. Деякі з них вказані на боковій сторінці цієї сторінки. Ось один питання щодо того, коли завантажувальний запуск виходить з ладу і що це означає для нього з ладу.
кардинал

Відповіді:


55

Є декілька способів, якими можна застосувати завантажувальний інструмент. Два основні підходи - це те, що вважається "непараметричним" і "параметричним" завантажувальним пристроєм. Другий передбачає, що модель, яку ви використовуєте, є (по суті) правильною.

Давайте зосередимось на першому. Ми припускаємо , що у вас є випадковий зразок розподіленого в відповідно до функції розподілу . (Якщо інше вимагає модифікованих підходів.) Нехай є емпіричним кумулятивним розподілом функція. Значна частина мотивації завантажувального тренажера походить від пари фактів.X1,X2,,XnFF^n(x)=n1i=1n1(Xix)

Нерівність Дворецького – Кійфера – Вулфовіца

P(supxR|F^n(x)F(x)|>ε)2e2nε2.

Це свідчить про те, що емпірична функція розподілу рівномірно конвергується у справжню функцію розподілу експоненціально швидко, ймовірно. Дійсно, ця нерівність у поєднанні з Бореля — Кантеллі показує, що майже напевно.supxR|F^n(x)F(x)|0

Для форми немає додаткових умов , щоб гарантувати цю конвергенцію.F

Евристично, тоді, якщо нас цікавить якийсь функціональний функції розподілу, який є гладким , тоді ми очікуємо, що буде близький до .T(F)T(F^n)T(F)

(Вгору) БезсторонністьF^n(x)

За допомогою простої лінійності очікування та визначення для кожного ,F^n(x)xR

EFF^n(x)=F(x).

Припустимо, нас цікавить середнє значення . Тоді неупередженість емпіричної міри поширюється на неупередженість лінійних функціоналів емпіричної міри. Отже, μ=T(F)

EFT(F^n)=EFX¯n=μ=T(F).

Отже, в середньому правильний, і оскільки швидко наближається до , то (евристично), швидко наближається до .T(F^n)Fn^FT(F^n)T(F)

Для побудови інтервалу довіри ( який, по суті, у чому полягає завантажувальна програма ), ми можемо використовувати центральну граничну теорему, узгодженість емпіричних квантилів і метод дельта як інструменти для переходу від простих лінійних функціоналів до складніших статистичних даних, що цікавлять .

Хороші посилання є

  1. Б. Ефрон, Методи завантаження: Ще один погляд на нож , Енн. Стат. , т. 7, ні. 1, 1–26.
  2. Б. Ефрон та Р. Тібшірані, Вступ до завантажувального закладу , Чапман – Холл, 1994 рік.
  3. Г.А. Янг і Р.Л. Сміт, Основи статистичних висновків , Кембриджський університетський прес, 2005, глава 11 .
  4. AW van der Vaart, Асимптотична статистика , Cambridge University Press, 1998, глава 23 .
  5. П. Бікель та Д. Фрідман, Деякі асимптотичні теорії для завантажувального пристрою . Енн. Стат. , т. 9, ні. 6 (1981), 1196–1217.

Дуже приємно, @cardinal (+1).

Чітке пояснення, наведені посилання, відмінна відповідь.
vesszabo

12

Ось інший підхід до роздумів про це:

Почнемо з теорії, де ми знаємо справжній розподіл, ми можемо виявити властивості вибіркової статистики, моделюючи з істинного розподілу. Так Госсет розробив t-розподіл і t-тест, відбираючи з відомих нормалів і обчислюючи статистику. Це фактично форма параметричного завантажувального пристрою. Зауважте, що ми моделюємо для виявлення поведінки статистики (іноді відносно параметрів).

Тепер, що, якщо ми не знаємо розподілу населення, у нас є оцінка розподілу в емпіричному розподілі, і ми можемо зробити вибірку з цього. Шляхом вибірки з емпіричного розподілу (що відомо) ми можемо побачити взаємозв'язок між зразками завантажувальної програми та емпіричним розподілом (сукупність для вибірки завантажувальної програми). Тепер ми робимо висновок, що відношення від зразків завантаження до емпіричного розподілу таке ж, як і від вибірки до невідомої сукупності. Звичайно, наскільки вдало це співвідношення буде залежати від того, наскільки репрезентативною є вибірка для населення.

Пам'ятайте, що ми не використовуємо засоби зразків завантажувальної програми для оцінки середньої сукупності, ми використовуємо для цього середнє значення вибірки (або будь-яку статистику, що становить інтерес). Але ми використовуємо зразки завантажувальної програми для оцінки властивостей (поширення, зміщення) процесу вибірки. А використання вибірки з населення, що знає (на що ми сподіваємось, є репрезентативною для населення, що цікавить) для вивчення ефектів вибірки має сенс і набагато менш круговий.


8

Основна хитрість (і жала) завантажувального завантаження полягає в тому, що це асимптотична теорія: якщо у вас є нескінченний зразок для початку, емпіричний розподіл буде настільки близьким до фактичного розподілу, що різниця незначна.

На жаль, завантажувальна програма часто застосовується в невеликих розмірах зразків. Поширене враження, що завантажувальна машина показала свою роботу в дуже неасимптотичних ситуаціях, але будьте обережні. Якщо розмір вибірки занадто малий, ви насправді працюєте умовно над тим, щоб зразок був «хорошим представленням» справжнього розподілу, що дуже легко призводить до міркувань у колах :-)


це щось таке, що я думав, але в цьому міркуванні є щось кругле. Я не статистик, але я розумів, що статистичний висновок працює, коли ваші оцінки швидко сходяться, тому навіть якщо ваш зразок не збігся на розподіл, ваші умовиводи є надійними. У цьому випадку ми покладаємось на весь емпіричний розподіл, щоб сходити до фактичного розподілу. Можливо, є теореми, які говорять про те, що деякі оцінки завантажувальної програми швидко сходяться, але я, як правило, бачу застосовану завантажувальну систему, не звертаючись до таких теорем.
user4733

4
Очевидне циркулярне міркування - саме тому його отримали прізвисько завантажувальний. Здавалося, люди намагаються піднятись власними завантажувальними системами. Пізніше Ефрон показав, що це дійсно спрацювало.
Грег Сніг

Якщо розмір вибірки дійсно невеликий, вам потрібно багато довіряти будь-яким методам, які ви використовуєте ...
kjetil b halvorsen

5

Я б заперечував не з точки зору "асимптотично, емпіричний розподіл буде близький до фактичного розподілу" (що, звичайно, дуже вірно), а з "довгострокової перспективи". Іншими словами, у будь-якому конкретному випадку емпіричне розподіл, отримане завантажувальним завантаженням, буде вимкнено (іноді зміщується занадто далеко таким чином, іноді пересувається занадто далеко таким чином, іноді занадто перекошеним таким чином, іноді занадто перекошеним таким чином), але в середньому це буде хорошим наближенням до фактичного розподілу. Аналогічно, ваші оцінки невизначеності, отримані від розподілу завантажувальної програми, будуть вимкнені в будь-якому конкретному випадку, але знову ж таки, в середньому, вони будуть (приблизно) правильними.

Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.