Відповідь Міура не зовсім точна, тому я відповідаю на це старе питання для нащадків:
(2). Це дуже різні речі. Емпіричний cdf - це оцінка CDF (розповсюдження), яка генерувала дані. Саме дискретний CDF призначає вірогідність кожній спостереженій точці даних, , для кожного . Цей оцінювач сходиться до справжнього cdf: майже точно для кожного (насправді рівномірно).Р ( х ) = 11/nх Р (х)→F(х)=P(Xя≤х)хF^(x)=1n∑ni=1I(Xi≤x)xF^(x)→F(x)=P(Xi≤x)x
Розподіл вибірки статистичної замість цього є розподілом тієї статистики, яку ви очікували б побачити при повторному експерименті. Тобто ви експериментуєте один раз і збираєте дані . - функція ваших даних: . Тепер, припустимо, ви повторите експеримент і збираєте дані . Перерахунок T на новий зразок дає . Якщо ми зібрали 100 зразків ми мали б 100 оцінок . Ці спостереження утворюють вибірковий розподілX 1 , … , X n T T = T ( X 1 , … , X n ) X ′ 1 , … , X ′ n T ′ = T ( X ′ 1 , … , X ′ n ) T T T E ( T ) V a r ( T )TX1,…,XnTT=T(X1,…,Xn)X′1,…,X′nT′=T(X′1,…,X′n)TTT. Це справжній розподіл. Оскільки кількість експериментів йде до нескінченності, його середнє значення сходить до а його дисперсія до .E(T)Var(T)
Загалом, звичайно , не повторювати експерименти , як це, ми тільки коли - небудь один екземпляр . З'ясування, що дисперсія від одного спостереження дуже важко , якщо ви не знаєте , основний вірогідну функцію апріорно. Бутстрапірованіе спосіб оцінити , що розподіл вибірки шляхом штучного запуску «нові експерименти» , на якому для розрахунку нових екземплярів . Кожен новий зразок - це фактично лише повторний вибір із початкових даних. Те, що це дає вам більше інформації, ніж ви маєте в оригінальних даних, загадкове та абсолютно дивовижне.T T T TTTTTT
(1). Ви маєте рацію - ви б цього не зробили. Автор намагається мотивувати параметричний завантажувальний засіб, описуючи його як "те, що ви зробили б, якби знали розподіл", але замінивши дуже хороший оцінювач функції розподілу - емпіричний cdf.
Наприклад, припустимо, ви знаєте, що ваша тестова статистика зазвичай розподіляється із середнім нулем, дисперсією. Як би ви оцінили розподіл вибірки ? Отже, оскільки ви знаєте розподіл, нерозумний і надмірний спосіб оцінювання розподілу вибірки - це використання R для отримання 10 000 або близько стандартних звичайних випадкових величин, а потім взяти середнє значення та дисперсію вибірки та використовувати їх як наші оцінки середнього та дисперсія розподілу вибірки .T TTTT
Якщо ми апріорі не знаємо параметрів , але ми знаємо, що він зазвичай розподіляється, то, що ми можемо зробити замість цього, є генерувати 10 000 або близько зразків із емпіричного cdf, обчислювати на кожному з них, а потім брати середнє значення вибірки і дисперсія з них 10000 с, і використовувати їх як наші оцінки очікуваного значення і дисперсії . Оскільки емпіричний cdf є хорошим оцінником справжнього cdf, параметри вибірки повинні збігатися з справжніми параметрами. Це параметрична завантажувальна програма: ви розміщуєте модель на статистиці, яку хочете оцінити. Модель індексується параметром, наприклад , який ви оцінюєте за повторної вибірки з ecdf.TTTT(μ,σ)
(3). Непараметрична завантажувальна стрічка навіть не вимагає, щоб ви апріорно знали, що нормально розподілений. Натомість ви просто малюєте повторні зразки з ecdf та обчислюєте на кожному. Після того як ви намалювали 10 000 або близько зразків і обчислили 10000 s, ви можете побудувати гістограму своїх оцінок. Це візуалізація розподілу вибіркиTTTT. Непараметричний завантажувальний пристрій не скаже вам, що розподіл вибірки є нормальним, або гамма тощо, але дозволяє оцінити розподіл вибірки (як правило) так точно, як це потрібно. Це робить менше припущень і надає менше інформації, ніж параметрична завантажувальна програма. Він менш точний, коли параметричне припущення є істинним, але більш точний, коли він хибний. Який із них ви використовуєте в кожній ситуації, з якою ви стикаєтесь, повністю залежить від контексту. Справді, більшість людей знайомі з непараметричним завантажувальним рядком, але часто слабке параметричне припущення робить абсолютно нерозбірливою модель, придатну до оцінки, що є прекрасною.