Середнє значення вибірки завантаження та статистика вибірки


18

Скажіть, у мене є зразок і зразок завантажувального пристрою з цього зразка для статичного (наприклад, середнього). Як усі ми знаємо, ця самозавантаження зразок оцінює на розподіл вибірки з оцінки з статистики.χ

Тепер, чи є середнє значення цього зразка завантаження кращою оцінкою статистики популяції, ніж статистика вихідної вибірки ? За яких умов це було б так?


2
Середнє значення зразка завантажувальної програми - це середнє значення для вибірки, і для цього вам не потрібен зразок завантажувальної програми.
Сіань

1
Дякую @ Xi'an, я не впевнений, що я слідкую за цим. Середнє значення вибірки завантажувальної програми може чисельно відрізнятися від середнього значення вибірки. Ви намагаєтесь сказати, що вони все ще теоретично рівноцінні? Чи можете ви підтвердити з обох кінців?
Амеліо Васкес-Рейна

2
Давайте зрозуміємо нашу термінологію: "зразок завантажувальної програми" міг би посилатися або на певний зразок із заміною із даних, або міг посилатися на (багатоваріантну) випадкову змінну, яку такий зразок вважатиметься однією реалізацією. Ви вірні, що середнє значення може відрізнятись від середнього значення даних, але @ Xi'an надає більш релевантне спостереження, що середнє значення випадкової величини (яка за визначенням є оцінкою завантаження середнього значення сукупності ) має збігатися із середнім значенням даних.
whuber

1
Тоді ваше запитання майже ідентичне stats.stackexchange.com/questions/126633/… ; Єдина відмінність полягає в тому, що реалізація зразка завантажувальної програми може перекриватися, але аналіз, наданий у відповіді, легко переноситься на ситуацію завантаження з тим же результатом.
whuber

1
Я бачу з'єднання @whuber, хоча в завантажувальному пристрої є "підмножини із заміною", і реалізація може перетинатися, як ви сказали. Я б міг уявити, що розподіл (наприклад, псевдовипадковість), який використовується для отримання повторних зразків у завантажувальній програмі, також може вплинути на зміщення оцінки зразка завантажувальної програми. Можливо, відповідь полягає в тому, що в усіх практичних питаннях різниця незначна. Це питання, що виникає після: умови, тонкощі та різниця у практиці.
Амеліо Васкес-Рейна

Відповіді:


19

Давайте узагальнимо, щоб зосередити увагу на суті справи. Я викладу найдрібніші деталі, щоб не залишати сумнівів. Аналіз вимагає лише наступного:

  1. Середнє арифметичне з набору чисел визначається якz1,,zм

    1м(z1++zм).
  2. Очікування - лінійний оператор. Тобто, коли є випадковими змінними, а α i - числами, тоді очікування лінійної комбінації є лінійною комбінацією очікувань,Zi,i=1,,мαi

    Е(α1Z1++αмZм)=α1Е(Z1)++αмЕ(Zм).

Нехай - зразок ( B 1 , , B k ), отриманий із набору даних x = ( x 1 , , x n ) , приймаючи k елементи рівномірно з x із заміною. Нехай т ( Б ) середнє арифметичне з B . Це випадкова величина. ПотімБ(Б1,,Бк)х=(х1,,хн)кхм(Б)Б

Е(м(Б))=Е(1к(Б1++Бк))=1к(Е(Б1)++Е(Бк))

далі за лінійністю очікування. Оскільки елементи отримані однаково, всі вони мають однакове очікування, b скажімо:Бб

Е(Б1)==Е(Бк)=б.

Це спрощує вищевикладене до

Е(м(Б))=1к(б+б++б)=1к(кб)=б.

За визначенням, очікування - це величина, зважена на ймовірність. Оскільки кожне значення вважається рівним шансом на вибір 1 / n ,Х1/н

Е(м(Б))=б=Е(Б1)=1нх1++1нхн=1н(х1++хн)=х¯,

середнє арифметичне даних.

Щоб відповісти на запитання, якщо для оцінювання середньої сукупності використовується середнє значення , то середнє значення завантаження (що є випадком k = n ) також дорівнює ˉ x , і тому є ідентичним як оцінювач середнього значення сукупності.х¯к=нх¯


Для статистики, яка не є лінійними функціями даних, той самий результат не обов'язково виконується. Однак було б неправильним просто замінювати середнє значення завантажувального значення на значення статистики на дані: це не так, як працює завантажувальна програма. Натомість, порівнюючи середнє значення завантажувальної програми з статистикою даних, ми отримуємо інформацію про зміщення статистики. Це можна використовувати для коригування вихідної статистики для усунення зміщення. Таким чином, скорегована на зміщення оцінка, таким чином, стає алгебраїчним поєднанням вихідної статистики та середнього завантаження. Для отримання додаткової інформації знайдіть "BCa" (коригування зміщення та прискорений завантажувальний пристрій) та "ABC". У Вікіпедії є деякі посилання.


Ви маєте на увазі, що очікування середнього завантажувального рівня дорівнює середньому значенню даних, ні? Саме середнє значення завантаження не визначається (оригінальною) вибіркою даних.
capybaralet

@ user2429920 Середнє значення завантаження - це статистика, визначена вибіркою. У цьому сенсі він ідентичний середній вибірці. Його очікування приймається у сенсі розподілу вибірки. Я підозрюю, що ви можете використовувати "очікування" в іншому сенсі відносно процесу обчислення середнього завантажувального механізму за допомогою повторної підсистеми з заміною.
whuber

1
Я думаю, що останній абзац - це фактична відповідь на це питання, оскільки він загальний і не зосереджений лише на середній статистиці. У мене були такі самі сумніви, що і в ОП, і мені не було відомо про існування BCa. Хоча демонстрація у цій відповіді не дуже допомогла мені (я не використовую середину як свою статистику), останній абзац був дуже зрозумілий щодо сутності справи. Я вважаю, що відповідь Сіань також стосується випадку, коли використовується середня статистика, тому саме питання. Дякую!
Габріель

1
@Gabriel хороші моменти. Я перевірив запис: перед редагуванням це питання спочатку задавали лише про середню. Ось чому відповіді здаються настільки орієнтованими на цю статистику.
whuber

9

Так як розподіл початкового завантаження визначається як F п ( х ) = 1 Середнє значення розподілу початкового завантаження є Е Р п [ Х ] = 1

Ж^н(х)=1нi=1нЯХiхХiiidЖ(х),
Коли ви (якщо ви повинні) реалізувати версію моделювання цього очікування, тобто, в середньому випадкових розіграшів, існує мінливість МонтеКарло в цьому наближенніE F п[X], але його середнє значення (розширення емпіричного середнього) та його межа, коли кількість моделей завантажувальної програми зростає до нескінченності, є рівно ˉ X n.
ЕЖ^н[Х]=1нi=1нХi=Х¯н
ЕЖ^н[Х]Х¯н

2
+1 Це відповідь, яку я спочатку хотів написати, але побоювався, що це може бути занадто непрозорим для деяких читачів. Я все-таки радий бачити його настільки елегантно представленим. Я не впевнений, що ви маєте на увазі в своєму останньому реченні, однак, коли ви, схоже, диференціюєте "очікування" змодельованого наближення від середнього від його "межі": оскільки очікування постійне (воно не змінюється залежно від розміру моделювання) ), насправді немає обмежень.
whuber

@whuber: Дякую за коментар і вибачте за те, що я написав мою коротку відповідь точно в той же час, що і ваш! Ваші пояснення, безумовно, більш читаються новачками у завантажувальному закладі. Я виправив остаточне речення, обмежувальною частиною якого є закон великої кількості.
Сіань

3
Ваше використання "середнього" в останньому реченні є досить неоднозначним! Я зрозумів це з вашої підказки LLN. При будь-якому кінцевому моделюванні розподілу завантажувальної програми кожен зразок у моделюванні виробляє власне середнє значення (є одне значення "середній"). Середнє значення всіх зразків у даному моделюванні дає середнє моделювання (є інше значення). Середнє значення моделювання перетворюється на константу, оскільки розмір імітації зростає великим, що означає середнє завантажувальне значення (третє значення), і це дорівнює середній вибірці (четверте значення). (І це підрахунок населення означає - п’яте значення!)
похмурий
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.