Я намагаюся вивчити статистику, бо вважаю, що вона настільки поширена, що забороняє мені вчитися чомусь, якщо я не розумію її належним чином. У мене виникають проблеми з розумінням цього поняття розподілу вибірки засобів вибірки. Я не можу зрозуміти, як це пояснили деякі книги та сайти. Я думаю, що я розумію, але не впевнений, чи правильно він. Нижче - моя спроба зрозуміти це.
Коли ми говоримо про якесь явище, яке набуває нормального поширення, воно, як правило, (не завжди) стосується населення.
Ми хочемо використовувати інфекційну статистику, щоб передбачити деякі дані про деяке населення, але не маємо всіх даних. Ми використовуємо випадкову вибірку, і кожен зразок розміром n однаково вірогідний.
Отже, ми беремо багато зразків, скажемо 100, і тоді розподіл засобів цих вибірок буде приблизно нормальним відповідно до центральної граничної теореми. Середнє значення вибіркового засобу буде приблизним до середнього.
Тепер те, що я не розумію, багато разів бачиш "Зразок 100 людей ..." Чи не знадобляться нам 10-ти чи 100-ти зразки 100 людей, щоб оцінити кількість середнього? Або випадок, що ми можемо взяти один достатньо великий зразок, скажімо, 1000, а потім сказати, що середнє значення буде приблизним до середнього? АЛЕ ми беремо вибірку з 1000 осіб, а потім беремо 100 випадкових зразків по 100 чоловік у кожній вибірці з тих первісних 1000 людей, які ми взяли, а потім використовуємо це як наше наближення?
Чи завжди достатньо великого зразка для апроксимації середнього (майже) завжди? Чи потрібно навіть населенню бути нормальним, щоб це працювало?