Пояснення людям, чому працює завантажувальна машина


326

Нещодавно я використовував завантажувальну програму для оцінки інтервалів довіри для проекту. Хтось, хто мало що знає про статистику, нещодавно попросив мене пояснити, чому працює завантажувальна програма, тобто чому перекомпонування одного і того ж зразка знову і знову дає хороші результати. Я зрозумів, що, хоча витратив багато часу, розуміючи, як його використовувати, я не дуже розумію, чому працює завантажувальна програма.

Зокрема: якщо ми перепробовуємо з нашої вибірки, то як ми дізнаємось щось про населення, а не лише про вибірку? Здається, там є стрибок, який є дещо контрінтуїтивним.

Тут я знайшов кілька відповідей на це питання, які я наполовину розумію. Особливо цей . Я "споживач" статистики, а не статистик, і працюю з людьми, які знають про статистику набагато менше, ніж я. Тож, чи може хтось пояснити, з мінімальним посиланням на теореми тощо, основні міркування, що стоять перед завантажувальним? Тобто, якби вам довелося пояснювати це своєму сусідові, що б ви сказали?


13
(+1) Ви можете коротко згадати питання, які ви подивилися, але це не зовсім вас задовольняє. Тут є багато запитань щодо завантажувальної програми. :)
кардинал

@cardinal Спасибі, я оновив оригінальну публікацію. Сподіваюсь, це зрозуміліше. :)
Алан Х.

5
Варто зазначити одне - завантажувальна робота не працює легко для ієрархічно структурованих даних - таких як багаторівневі моделі та багатоступеневі схеми вибірки. Дуже заплутано знати, "який завантажувальний" ви повинні використовувати.
ймовірністьлогічний

2
В основному, завантажувальний механізм працює, тому що це непараметрична максимальна ймовірність. Тож, коли є проблеми з максимальною ймовірністю, можна очікувати проблем із завантажувальним пристроєм.
kjetil b halvorsen

3
Джейк ВандерПлас провів велику розмову в PyCon 16 про завантажувальний процес та деякі інші пов'язані з ними методи. Дивіться слайди, починаючи з слайду 71, та відеозапис .
thm

Відповіді:


198

fwiw версія середньої довжини, яку я зазвичай даю, йде так:

Ви хочете задати питання про населення, але не можете. Тож ви берете зразок і натомість ставите питання про нього. Тепер, наскільки впевненими ви повинні бути, що вибіркова відповідь близька до відповіді населення, очевидно, залежить від структури населення. Один із способів дізнатися про це - це брати зразки у населення знов і знов, задавати їм питання та бачити, наскільки схильні відповіді вибірки. Оскільки це неможливо, ви можете або зробити деякі припущення щодо форми населення, або ви можете використовувати інформацію у вибірці, про яку ви насправді повинні дізнатися про це.

Уявіть, що ви вирішили робити припущення, наприклад, що це "Нормальне", "Бернуллі" чи інша зручна фантастика. Дотримуючись попередньої стратегії, ви знову можете дізнатися про те, наскільки відповідь на ваше запитання, коли вас запитують вибірки, може змінюватись залежно від того, який конкретний зразок ви отримали, повторно генеруючи зразки того ж розміру, що й у вас, і задаючи їм однакові питання. Це було б просто, якщо ви вибрали обчислювально припущення. (Дійсно, особливо зручні припущення плюс нетривіальна математика можуть дозволяти вам взагалі обійти частину вибірки, але ми навмисно ігноруємо це.)

Це здається гарною ідеєю, якщо ви раді зробити свої припущення. Уявіть, що ви не є. Альтернативно - взяти зразок, який у вас є, і замість нього взяти пробу. Ви можете це зробити, тому що зразок, який ви маєте, - це також сукупність, просто дуже маленька дискретна; це схоже на гістограму ваших даних. Відбір проб «із заміною» - це просто зручний спосіб поводження з вибіркою, як з популяцією, і вибірки з неї таким чином, що відображає її форму.

Це розумно зробити, тому що не тільки найкраща інформація, яку ви маєте, але єдина інформація, яку ви маєте про те, як насправді виглядає популяція, але й тому, що більшість вибірок, якщо їх обрали випадковим чином, будуть виглядати як населення вони родом. Отже, ймовірно, і ваш теж.

Для інтуїції важливо подумати про те, як ви могли б дізнатися про мінливість, агрегуючи вибіркову інформацію, яка генерується різними способами та на різних припущеннях. Повністю ігноруючи можливість математичних рішень закритої форми важливо зрозуміти це.


5
Гарна відповідь. Особливо мені подобається передостанній абзац.
Пітер Флом

19
(+1) Це хороша відповідь. Я думаю, що може існувати спосіб подальшого окреслення дуже важливого моменту. У тому, як зазвичай виконується завантажувальна програма, є два наслідки. По-перше, ми робимо вигляд, що отриманий нами зразок є проксі для нашого населення. Це номінально розумна річ, якщо наш розмір вибірки досить великий. Однак у нас зазвичай важко обчислити фактичну кількість відсотків від цього розподілу претендентів. Отже , ми маємо їх оцінювати , і саме тому ми малюємо безліч зразків завантажувальної програми. Якби ми могли ... / ...
кардинал

11
... / ... обчислюючи величину відсотків безпосередньо для нашого розподілу вигляд, ми вважаємо за краще це зробити. І це була б справжня завантажувальна програма. Але, як правило, ми не можемо, тому замість цього ми зводимось до повторного розміщення.
кардинал

8
@ naught101: "Розумно великий" можна досить добре оцінити за допомогою нерівності DKW (якщо ви хочете, ви можете подивитися на мою відповідь за посиланням у запитанні щодо ОП) та стосовно лотів , це залежить від вибіркової статистики, що цікавить, але якщо у нас є зразки завантажувальних приладів , то за допомогою простого Монте-Карло ми знаємо, що стандартна помилка порядку порядку приблизно . BO(B1/2)
кардинал

4
@cardinal: Приємний коментар. Дуже багато людей думають, що завантажувальна програма та перекомпонування - це одне і те ж, коли насправді останній є інструментом, який використовується для першого. Аналогічне хибне уявлення полягає в тому, що багато користувачів статистики схильні плутати MCMC та Bayes-аналіз.
MånsT

122

+1 до @ConjugatePrior, я просто хочу вияснити один момент, який міститься в його відповіді. Питання задає питання: "Якщо ми перепробовуємо з нашої вибірки, то як ми дізнаємось щось про населення, а не лише про вибірку?" Перестановка не робиться для оцінювання розподілу населення - ми беремо сам зразок як модель чисельності. Швидше, переустановка робиться для забезпечення оцінки розподілу вибірки відповідної статистичної вибірки.


10
(+1) Це близько до того, що я намагався зробити в коментарі до відповіді ConjugatePrior, хоча ви це заявили більш стисло та чітко. У деяких особливих випадках ми можемо обчислити розподіл вибірки тестової статистики саме за емпіричним розподілом, отриманим з вибірки . Але, як правило, ми не можемо, і тому нас змушують моделювати. :)
кардинал

7
Я бачу, тож якщо я вас розумію, то ця методика передбачає, що вибірка є адекватною моделлю сукупності, а отже, повторне розміщення над цим зразком у досить великому масштабі дозволить виявити щось про популяцію, але лише настільки, наскільки оригінальний зразок - хороший. Тепер, коли я кажу так, це здається майже очевидним ...
Алан Х.

4
@AlanH., Я просто хочу змінити "... розкриє щось про сукупність " на "... розкриє щось про розподіл вибірки " ( спірних статистичних даних, наприклад, середніх). Але так, у вас це є
gung

Ви все правильно, звичайно. Особисто, і лише з педагогічних причин, я зберігаю цю точку в моїй "довшій версії", тому що в моїй конкретній аудиторії ця точка має тенденцію збивати їх молоду та ще нестабільну інтуїцію, трохи виводячи з рівноваги, якщо її застосовувати занадто рано.
кон'югатпріор

3
@ErosRam, завантаження - це визначення розподілу вибірки чогось. Ви можете зробити це для вибіркової статистики (наприклад, 56-й перцентиль) або тестової статистики (t) і т.д. 1 голова - 50%; 2 голови - 25%; це ясно без перекомпонування. У кардинала десь є коментар, який пояснює це (багато найкращих відповідей на сайті - це коментарі кардинала), але важко знайти б / с, це коментар.
gung

43

Це, мабуть, більш технічне пояснення, спрямоване на людей, які розуміють певну статистику та математику (принаймні, обчислення). Ось слайд із курсу з завантажувальних програм, який я десь викладав:

принцип завантаження

Звичайно, потрібні деякі пояснення. - процедура отримання статистики з існуючих даних (або, якщо бути технічно точним, функціоналом від функції розподілу до реальних чисел; наприклад, середнє значення є , де для функції розподілу проби , то розуміється як точка маси в точці зразка). У популяції, що позначається , додаток дає параметр інтересу . Тепер ми взяли зразок (перша стрілка вгорі) і маємо емпіричну функцію розподілу - застосовуємо до нього для отримання оцінкиTE[X]=xdFFn()dFF()TθFn()Tθ^n . Як далеко від , ми дивимося? Який розподіл може мати випадкова кількість навколо ? Це знак питання в нижній лівій частині діаграми, і це питання, на яке намагається відповісти завантажувальний інструмент. Якщо повторити точку Гунга, це не питання про кількість населення, а питання про певну статистику та її розподіл.θθ^nθ

Якби ми могли повторити нашу процедуру вибірки, ми могли б отримати таку розподіл та дізнатися більше. Добре, що зазвичай є поза нашими можливостями. Однак якщо

  1. Fn досить близький до , у відповідному розумінні, іF
  2. відображення досить гладке, тобто якщо ми візьмемо невеликі відхилення від , результати буде відображено в числа, близькі до ,TF()θ

ми можемо сподіватися, що процедура завантаження спрацює. А саме ми робимо вигляд, що наш розподіл - це а не , і за допомогою цього ми можемо розважати всі можливі вибірки - і таких зразків буде , що практично для . Повторю ще раз: завантажувальний механізм працює для створення розподілу вибірки навколо "істинного" параметра , і ми сподіваємось, що при двох вищезазначених умовах цей розподіл вибірки є інформативним щодо розподілу вибірки з навколо :Fn()F()nnn5θ^nθ^nθ^nθ

θ^n to θ^n is like θ^n to θ

Тепер, замість того, щоб просто пройти в одну сторону по стрілках і втратити деяку інформацію / точність вздовж цих стрілок, ми можемо повернутися назад і сказати щось про мінливість навколо .θ пθ^nθ^n

Вищезазначені умови продемонстровані надзвичайно технічно в книзі Холла (1991) . Розуміння обчислення, яке я сказав, може бути необхідним умовою дивитися на цей слайд, є другим припущенням щодо гладкості: у більш офіційній мові функціональний повинен мати слабку похідну. Перша умова - це, звичайно, асимптотичне твердження: чим більший ваш зразок, тим ближче має стати ; і відстані від до повинні бути однаковими на величину, що і відстані від до . Ці умови можуть порушитися, і вони порушуютьсяР п Р θ * п θ п θ п θ РTFnFθ^nθ^nθ^nθв ряді практичних ситуацій з досить дивними статистичними дані і / або схемою вибірки , які не виробляють емпіричні розподілу, які досить близькі до .F

Тепер, звідки береться ці 1000 зразків, або що б там не було магічне число? Це випливає з нашої нездатності намалювати всі зразків, тому ми просто беремо випадкову підмножину з них. У правій стрілці «імітувати» вказується ще одне наближення, яке ми робимо на своєму шляху, щоб отримати розподіл навколо , і це означає, що наш Монте-Карло імітував розподіл - досить гарне наближення повного розподілу завантажувальної програми навколо .thetas ; п & thetas ; & thetas ; ( * г ) п & thetas ; * п & thetas ; пnnθ^nθθ^n(r)θ^nθ^n


7
Ця відповідь повністю пропускає точку намагання бути доступною для широкої аудиторії.
Tripartio

20

Я відповідаю на це запитання, оскільки погоджуюся, що це важко зробити, і існує багато помилок. Ефрон та Діаконіс спробували це зробити у своїй науковій американській статті 1983 року, і, на мій погляд, вони не змогли. Зараз є кілька книг, присвячених завантажувальній програмі, які добре справляються. Ефрон і Тібширані роблять велику роботу в своїй статті в статистичній науці в 1986 році. Я особливо намагався зробити доступний завантажувальний доступ доступним для практикуючих в моїй книзі методів завантаження, і моя інтродукція на завантаження програм із застосуванням до книги Р. Холла - це велика, але дуже вдосконалена і теоретична . Тім Хестерберг написав велику додаткову главу до однієї із вступних книг статистики Девіда Мура. У покійного Кліффорда Луннеборга була приємна книга. Нещодавно Чіхара та Гестерберг випустили книгу з математичної статистики середнього рівня, яка висвітлює завантажувальну систему та інші методи перекомпонування. Навіть просунуті книги, такі як Лахірі або Шао і Ту, дають хороші концептуальні пояснення. Менлі добре справляється зі своєю книгою, яка висвітлює перестановки та завантажувальний тренд. Причин для того, щоб не здивуватися з приводу завантажувальної програми, більше немає. Важливо пам’ятати, що завантажувальна програма залежить від принципу завантаження «Вибірка із заміною поводиться на оригінальній вибірці так, як поводиться оригінальний зразок популяції. Є приклади, коли цей принцип не вдається. Важливо знати, що завантажувальний пристрій - це не відповідь на кожну статистичну проблему. s дати хороші концептуальні пояснення. Менлі добре справляється зі своєю книгою, яка висвітлює перестановки та завантажувальний тренд. Причин для того, щоб не здивуватися з приводу завантажувальної програми, більше немає. Важливо пам’ятати, що завантажувальна програма залежить від принципу завантаження «Вибірка із заміною поводиться на оригінальній вибірці так, як поводиться оригінальний зразок популяції. Є приклади, коли цей принцип не вдається. Важливо знати, що завантажувальний пристрій - це не відповідь на кожну статистичну проблему. s дати хороші концептуальні пояснення. Менлі добре справляється зі своєю книгою, яка висвітлює перестановки та завантажувальний тренд. Причин для того, щоб не здивуватися з приводу завантажувальної програми, більше немає. Важливо пам’ятати, що завантажувальна програма залежить від принципу завантаження «Вибірка із заміною поводиться на оригінальній вибірці так, як поводиться оригінальний зразок популяції. Є приклади, коли цей принцип не вдається. Важливо знати, що завантажувальний пристрій - це не відповідь на кожну статистичну проблему. Відбір з заміною поводиться на вихідному зразку так, як поводиться оригінальний зразок щодо популяції. Є приклади, коли цей принцип не вдається. Важливо знати, що завантажувальна програма - це не відповідь на кожну статистичну проблему. Відбір з заміною поводиться на вихідному зразку так, як поводиться оригінальний зразок щодо популяції. Є приклади, коли цей принцип не вдається. Важливо знати, що завантажувальна програма - це не відповідь на кожну статистичну проблему.

Ось посилання на амазонку до всіх згаданих мною книг тощо.

Математична статистика з перескладкою та R

Методи завантаження та їх застосування

Методи завантаження: Посібник для практиків і дослідників

Вступ до методів завантаження з додатками до R

Методи перекомпонування залежних даних

Рандомізація, методи Bootstrap та Monte Carlo в біології

Вступ до завантажувальної програми

Практика супутника статистики бізнесу Глава 18: Методи завантаження та тести перестановки

Аналіз даних шляхом перекомпонування: поняття та програми

Джек-нож, завантажувальна програма та інші плани перестановки

Джек-нож і бутстрап

Перевірка гіпотез перестановки, параметричних та завантажувальних робіт

Розширення завантаження та Edgeworth


2
@Procrastinator. Я роблю це частіше. в деяких випадках я поспішаю опублікувати свою відповідь і повернутися, щоб прибрати її пізніше. У мене не виходить перетворення адрес посилань на посилання за назвою, і я не впевнений, що це все, що потрібно. Це в один і той же клік в будь-якому випадку, але якщо ви не можете дочекатися цього, я не заперечую, щоб ви внесли зміни. Насправді я ціную це.
Майкл Черник

1
Я збирався змінити свій коментар на "Я не заперечую, щоб ти робив правки", і "Але якщо ти не можеш чекати" було вилучено. Я бачу, як те, що ви робили, є більш охайним і простішим, і, ймовірно, займає менше часу, але я просто ще цього не навчився, і я не вважаю це великою справою, як це роблять деякі модератори та інші члени.
Майкл Черник

1
(+1) Я надаю вам потужність балів @Michael Chernick. 10,000

Дякую прокрастинові. я очікував, що, можливо, сьогодні буде досягнутий загальний результат.
Майкл Черник

10

Завдяки завантажувальному завантаженню ви просто забираєте зразки з тієї ж групи даних (ваші вибіркові дані), щоб оцінити, наскільки точні ваші оцінки щодо всієї сукупності (що насправді є в реальному світі).

Якби ви взяли один зразок і оцінили реальну сукупність, ви, можливо, не зможете оцінити, наскільки точні ваші оцінки - ми маємо лише одну оцінку і не визначили, як ця оцінка варіюється в різних вибірках, з якими ми могли зіткнутися.

Під час завантаження ми використовуємо цей основний зразок для створення декількох зразків. Наприклад, якщо ми вимірювали прибуток щодня протягом 1000 днів, ми можемо брати випадкові вибірки з цього набору. Ми можемо отримати прибуток від одного випадкового дня, записати його, отримати прибуток від іншого випадкового дня (який може статися того ж дня, що і раніше - вибірки з заміною), записати його тощо, поки не отримаємо "новий" зразок 1000 днів (з початкового зразка).

Цей "новий" зразок не є ідентичним вихідному зразку - дійсно, ми можемо створити кілька "нових" зразків, як описано вище. Коли ми дивимось на варіанти засобів та оцінки, ми можемо отримати читання про те, наскільки точними були початкові оцінки.

Редагувати - у відповідь на коментар

"Більш нові" зразки не ідентичні першим, і нові оцінки, засновані на них, будуть різними. Це імітує повторні вибірки популяції. Різниці в оцінках "новіших" зразків, що генеруються завантажувальним пристроєм, прояснять, як змінюватимуться оцінки вибірки за різних вибірок у сукупності. Це насправді, як ми можемо спробувати виміряти точність початкових оцінок.

Звичайно, замість завантаження ви можете замість цього взяти кілька нових зразків у населення, але це може бути нездійсненно.


5
Дякую! Це дуже я розумію. Мене особливо цікавить, як саме таке перекомпонування з вибірки населення допомагає зрозуміти основне населення. Якщо ми перекомпонуємо з вибірки, то як ми дізнаємось щось про населення, а не лише про вибірку? Здається, там є стрибок, який є дещо контрінтуїтивним.
Алан Х.

4

Я усвідомлюю, що це старе запитання з прийнятою відповіддю, але я хотів би надати свій погляд на метод завантаження. Я жодним чином не експерт (більше користувач статистикою, як ОП) і вітаю будь-які виправлення чи коментарі.

Мені подобається розглядати завантажувальний інструмент як узагальнення методу джекніфа. Скажімо, ви маєте вибірку S розміром 100 і оцініть деякий параметр, використовуючи статистику T (S). Тепер ви хочете знати інтервал довіри для цієї бальної оцінки. Якщо у вас немає моделі та аналітичного вираження для стандартної помилки, ви можете продовжити та видалити один елемент із зразка, створивши підпробову з видаленим елементом i. Тепер ви можете обчислити і отримати 100 нових оцінок параметра, з якого можна обчислити, наприклад стандартну помилку і створити довірчий інтервал. Це метод ножового ножа JK-1. T ( S i )SiT(Si)

Ви можете замість цього розглянути всі підмножини розміром 98 та отримати JK-2 (2 елементи видалені) або JK-3 тощо.

Тепер, завантажувальна програма - це лише рандомізована версія цього. Здійснюючи перекомпонування за допомогою вибору із замінами, ви "видаляєте" випадкову кількість елементів (можливо, жодних) та "замінюєте" їх однією (або більше) репліками.

Замінюючи репліками набір даних, що перекомпоновані, завжди мають однаковий розмір. Для джекніфа ви можете запитати, що таке ефект джекніфінгу на зразках розміром 99 замість 100, але якщо розмір вибірки "достатньо великий", це, швидше за все, не викликає проблем.

У jackknife ви ніколи не змішуєте delete-1 та delete-2 тощо, щоб переконатись, що оцінені підключення є зразками однакового розміру.

Ви також можете розглянути поділ вибірки розміром 100 на 10 зразків розміром 10. Це може в деяких теоретичних аспектах бути більш чистими (незалежні підмножини), але зменшує розмір вибірки (зі 100 до 10) настільки, що непрактично (у більшості справ).

Ви також можете розглянути частково перекриваючі підмножини певного розміру. Все це обробляється автоматичним та рівномірним та випадковим способом завантажувальним методом.

Крім того, метод завантаження дає вам оцінку розподілу вибірки вашої статистики з емпіричного розподілу вихідного зразка, так що ви можете проаналізувати подальші властивості статистики, крім стандартної помилки.


1

Перефразовуючи Фокса , я би почав з того, що процес багаторазового перекомпонування з вашого спостережуваного зразка показав, що імітує процес первинного відбору проб у всієї сукупності.


Посилання вище не існує, тому я не знаю, що сказав Фокс. Але жодна з адрес не викликає мого занепокоєння через те, що завантажувальна програма не створює помилок. Припустимо, ви хотіли дізнатися про відносну частоту мов на землі. Якщо ви взяли зразок з Інтернету і просто повторно взяли його за зразок, ви пропустили б усі мови не в мережі.
аквагремлін

1

Кінцева вибірка популяції наближає розподіл так само, як і гістограма. Повторний відбір проб змінюється кожним підрахунком кошика, і ви отримуєте нове наближення. Великі величини підрахунку коливаються менше, ніж малі значення підрахунку як у вихідній сукупності, так і у вибірці. Оскільки ви пояснюєте це лайперсону, ви можете стверджувати, що для великих підрахунків сміття це приблизно квадратний корінь підрахунку сміття в обох випадках.

Якщо я знайду червоношкірих та інших із вибірки , повторна вибірка оцінила б коливання червоношкірих як , що так само, як припускати, що початкове населення було справді розподілено . Отже, якщо ми наблизимо справжню ймовірність до вибіркової, ми можемо отримати оцінку помилки вибірки "навколо" цього значення.80 100 2080100 1:4(0.2×0.8)×1001:4

Я думаю, що важливо підкреслити, що завантажувальний пристрій не розкриває "нових" даних, це просто зручний, не параметричний спосіб приблизно визначити вибірку для вибірки коливань, якщо справжня ймовірність задана вибіркою.


Я змінив форматування у вашій відповіді - сміливо повертайте їх, якщо вважаєте їх непридатними. Що може знадобитися для подальшого уточнення, чому існує квадратний корінь?
Тім

1

Зауважимо, що в класичній інфекційній статистиці теоретичною сутністю, яка з'єднує вибірку з популяцією як хороший оцінювач популяції, є розподіл вибірки (усі можливі вибірки, які можна взяти з популяції). Метод завантаження створює своєрідний розподіл вибірки (розподіл на основі декількох зразків). Звичайно, це метод максимальної ймовірності, але основна логіка не настільки відрізняється від традиційної теорії ймовірностей, що стоїть за класичною статистикою на основі звичайного розподілу.


0

Моя думка дуже крихітна.

Bootstrap працює, тому що він обчислювально інтенсивно використовує основну передумову нашої програми досліджень.

Якщо бути конкретнішим, то в статистиці чи біології, або в більшості нетеоретичних наук ми вивчаємо людей, тим самим збираючи зразки.

Однак з таких зразків ми хочемо робити висновки щодо інших людей, представляючи нам у майбутньому чи різні зразки.

Завдяки завантажувальній програмі, чітко встановивши наше моделювання на окремих компонентах нашої вибірки, ми можемо краще (з меншою кількістю припущень, як правило) робити висновки та прогнозувати для інших людей.


1
Здається, це не відрізняє завантажувальну програму від будь-якої іншої статистичної процедури, яка починається з необроблених даних. Здається лише відрізнити ті, від процедур, які базуються на підсумковій статистиці або породжених частотах.
whuber

0

Пояснюючи початківцям, я думаю, що це допомагає взяти конкретний приклад ...

Уявіть, у вас є випадкова вибірка з 9 вимірювань від деякої сукупності. Середнє значення вибірки - 60. Чи можемо ми бути впевнені, що в середньому все населення також становить 60? Очевидно, що не тому, що невеликі зразки будуть різними, тому оцінка 60, ймовірно, буде неточною. Щоб дізнатись, наскільки варіюватиметься подібні зразки, ми можемо провести кілька експериментів - використовуючи метод, який називається завантажувальним завантаженням.

Перше число у вибірці - 74, а друге - 65, тож давайте уявимо собі велику "прикидающуюся" сукупність, що складається з дев'ятого 74-го, одного дев'ятого 65-х років тощо. Найпростіший спосіб взяти випадкову вибірку з цієї сукупності - це взяти число навмання у вибірки дев'яти, потім замінити його, щоб у вас знову був початковий зразок дев'яти і вибирали інший, і навпаки, і так далі, поки у вас немає "повторний вибір" 9. Коли я це зробив, 74 взагалі не з'являлися, але деякі інші цифри з'являлися двічі, а середнє значення - 54,4. (Це встановлено на електронній таблиці за адресою http://woodm.myweb.port.ac.uk/SL/resample.xlsx - клацніть на вкладці завантажувальної машини в нижній частині екрана.)

Коли я взяв 1000 повторних зразків таким чином, їхній показник коливався від 44 до 80, причому 95% складали від 48 до 72. Це говорить про те, що існує помилка до 16-20 одиниць (44 - на 16 нижче, ніж припущенний середній показник на 60, 80 - це 20 одиниць вище) для використання зразків розміром 9 для оцінки середньої сукупності. і що ми можемо бути на 95% впевнені, що помилка складе 12 або менше. Тож ми можемо бути на 95% впевнені, що середній показник чисельності населення буде десь між 48 і 72.

Тут викладено ряд припущень, очевидним з яких є припущення, що вибірка дає корисну картину популяції - досвід показує, що це, як правило, добре працює за умови, що вибірка досить велика (9 дещо мало, але полегшує її подивіться, що відбувається). Електронна таблиця на веб- сайті http://woodm.myweb.port.ac.uk/SL/resample.xlsx дозволяє переглядати окремі повторні зразки, графікувати гістограми з 1000 повторних проб, експериментувати з більшими зразками тощо. У статті більш детальне пояснення за адресою https://arxiv.org/abs/1803.06214 .


Це елементарно і, можливо, інтуїтивно, але я не думаю, що це виникає з тієї причини, що працює завантажувальна програма.
Майкл Черник
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.